斯坦福AI团队被指抄袭中国大模型，引发争议，各方回应陆续出炉。

admin 2024-06-04 15:02:00

斯坦福大学的人工智能研究团队陷入了一场争议，因为他们发布的开源模型Llama 3-V被指抄袭了清华大学系创业公司面壁智能的MiniCPM-Llama3-V 2.5。事情的起因是一篇由斯坦福学生团队发布的文章声称他们用500美元的成本训练出一个性能超越GPT-4、Gemini Ultra和Claude Opus的多模态模型。然而，随后网友发现，Llama 3-V在模型结构、代码和配置文件上与 MiniCPM-Llama3-V高度相似，只是变量名有所调整。证据确凿后，质疑声四起，相关项目页面和社交媒体内容已被删除。
团队成员Aksh Garg回应称，由于全职工作繁忙，模型的主要编写者Mustafa Aljadery负责代码编写。他们对模型的原创性表示怀疑，但在收到抄袭指控后，尚未看到有力的证据。Aksh Garg对此表示歉意，并承认未能充分验证模型的原创性。
值得注意的是，斯坦福AI实验室主任Christopher David Manning在社交媒体上对抄袭行为表示谴责，同时赞扬了清华大学的开源模型。面壁智能CEO李大海则在朋友圈中回应，强调技术创新的艰辛和团队的努力，对于这种不正当的认可方式表示遗憾，同时也呼吁构建开放、合作和信任的社区。
面壁智能是一家专注于大模型创新的公司，由清华大学的研究团队创立，CEO李大海曾任知乎CTO。公司已经获得两轮融资，分别来自知乎、智谱AI和华为哈勃等投资方。知乎与面壁智能在大模型技术方面有着深度合作，共同开发了多个产品和应用。
此次事件引发了关于学术诚信和开源社区责任的讨论，提醒人们在追求技术创新的同时，要尊重他人的劳动成果，维护良好的科研环境。

热门排行

斯坦福AI团队被指抄袭中国大模型，引发争议，各方回应陆续出炉。

相关文章