背后中国型思考套壳痛与大模的阵产业成长

最近AI圈子里炸开了锅。阿里巴巴前首席AI科学家贾扬清的一则朋友圈,像一块石头扔进了平静的湖面。他毫不客气地指出国内某大厂的大模型产品其实就是Meta的LLaMA换了个马甲。这不禁让人想起那个著名的笑话:把羊驼涂成斑马,难道就真的变成斑马了吗?李开复团队陷入"套壳"风波虽然贾扬清没有点名,但明眼人都能猜到,他说的就是李开复创立的零一万物公司推出的Yi-34B大模型。这个拥有340亿参数的大家伙,刚...

最近AI圈子里炸开了锅。阿里巴巴前首席AI科学家贾扬清的一则朋友圈,像一块石头扔进了平静的湖面。他毫不客气地指出国内某大厂的大模型产品其实就是Meta的LLaMA换了个马甲。这不禁让人想起那个著名的笑话:把羊驼涂成斑马,难道就真的变成斑马了吗?

李开复团队陷入"套壳"风波

虽然贾扬清没有点名,但明眼人都能猜到,他说的就是李开复创立的零一万物公司推出的Yi-34B大模型。这个拥有340亿参数的大家伙,刚发布就在Hugging Face和C-Eval排行榜上拿了第一,没想到风光没多久就被Hugging Face社区要求修改张量名称,因为除了两个重命名的张量外,整个架构几乎就是Llama的翻版。

这让我想起上个月参加的一个AI沙龙,有位创业者半开玩笑地说:"现在做AI项目就像开餐馆,大家都在用同样的调料包,只是把包装换了换。"这种"套壳"现象在国内AI圈早已见怪不怪。

套壳现象的前世今生

记得今年5月,科大讯飞的"星火"大模型在发布会上闹了个笑话。当用户问"你是谁发明的"时,它居然回答"我是OpenAI发明的"。这就像一个小学生交作业时不小心把参考答案的署名也抄了上去。虽然讯飞后来解释说是因为用了相似的训练数据,但这个解释显然没能让所有人信服。

更早之前的百度文心一言也遭遇过类似质疑。它的文生图功能把"车水马龙"翻译成"car water horse dragon",结果生成的图片里真的出现了汽车、水、马和龙的奇怪组合。这就像是用谷歌翻译做了个机翻,然后又用这个机翻去做创作。

创业公司的两难困境

说实话,我能理解这些公司的难处。现在AI领域的竞争就像百米冲刺,OpenAI等国外巨头已经跑出50米了,国内企业才刚起跑。更可怕的是,OpenAI还在不断加速——从GPT-4到DALL·E 3,再到最近的GPTs,他们几乎每个月都在颠覆行业认知。

在这种情况下,很多创业团队面临一个残酷的选择:要么花几年时间从零开始研发,等产品出来时可能早就过时了;要么基于现有开源模型快速迭代,虽然可能背上"套壳"的骂名,但至少能在市场上先站稳脚跟。

借鉴与创新的边界在哪里?

零一万物在回应中强调,他们确实借鉴了LLaMA的架构,但也在数据处理和训练方法上做了大量创新。这就引出一个关键问题:在AI领域,到底怎样才算真正的创新?

我认为这就像做菜。如果你完全照着别人的菜谱做,连摆盘都一模一样,那显然是抄袭。但如果你在传统做法的基础上加入自己的创意,比如用新食材、新技法,甚至发明全新的烹饪方式,那就是创新。关键要看改动的深度和价值。

写在最后

站在行业观察者的角度,我不认为简单地将这些案例归类为"套壳"或"创新"就能解决问题。当前中国AI产业正处在关键的发展阶段,既需要理解创业公司的现实困境,也要坚持鼓励真正的技术创新。

正如一位资深投资人告诉我的:"在AI这个赛道上,短期套利或许能获得一时风光,但只有持续投入核心技术的企业,才能最终赢得这场马拉松。"或许,这才是这场"套壳"争议给我们最宝贵的启示。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

相关阅读