斯坦福就抄袭面壁智能模型事件致歉Llama3-V 模型将悉数撤下
6月4日消息,近日,一起涉及斯坦福大学AI研究团队与清华系创业公司面壁智能的开源模型抄袭事件在网络上引起了广泛关注。据悉,斯坦福团队发布的Llama3-V开源模型被指控抄袭了面壁智能的“小钢炮”MiniCPM-Llama3-V 2.5模型。
事件的起因是,5月29日,斯坦福AI团队在公开渠道宣布,他们以仅有的500美元成本,成功训练出了一个超越GPT-4V等模型的多模态大模型。然而,这一声明并未持续太久,便有细心的网友发现,该团队所发布的Llama3-V模型与面壁智能的MiniCPM模型在结构和代码上存在着惊人的相似性,只是部分变量名有所不同。
据了解,面壁智能团队在6月2日深夜进一步证实了这一抄袭行为。他们发现,斯坦福的Llama3-V模型不仅能够识别出“清华简”中的战国古文字,而且其错误的识别结果竟然与自家的MiniCPM模型如出一辙。这些用于验证的古文字数据是面壁智能团队历经数月,从清华简上逐字扫描并人工标注的珍贵资料,且从未对外公开。
面对这一严重的学术不端行为,斯坦福 Llama3-V 团队的两位作者 Siddharth Sharma 和 Aksh Garg 在社交平台 X 上对面壁 MiniCPM 团队就这一学术不端行为进行了正式道歉,并承诺将撤下所有 Llama3-V 模型。这并非他们首次为此事道歉,此前他们曾发布过一封类似内容的道歉信,但很快被删除。