探索财经奥秘,指引财富未来

斯坦福AI团队被指抄袭中国大模型,引发争议,各方回应陆续出炉。

admin 2024-06-04 15:02:00
斯坦福大学的人工智能研究团队陷入了一场争议,因为他们发布的开源模型Llama 3-V被指抄袭了清华大学系创业公司面壁智能的MiniCPM-Llama3-V 2.5。事情的起因是一篇由斯坦福学生团队发布的文章声称他们用500美元的成本训练出一个性能超越GPT-4、Gemini Ultra和Claude Opus的多模态模型。然而,随后网友发现,Llama 3-V在模型结构、代码和配置文件上与 MiniCPM-Llama3-V高度相似,只是变量名有所调整。证据确凿后,质疑声四起,相关项目页面和社交媒体内容已被删除。
团队成员Aksh Garg回应称,由于全职工作繁忙,模型的主要编写者Mustafa Aljadery负责代码编写。他们对模型的原创性表示怀疑,但在收到抄袭指控后,尚未看到有力的证据。Aksh Garg对此表示歉意,并承认未能充分验证模型的原创性。
值得注意的是,斯坦福AI实验室主任Christopher David Manning在社交媒体上对抄袭行为表示谴责,同时赞扬了清华大学的开源模型。面壁智能CEO李大海则在朋友圈中回应,强调技术创新的艰辛和团队的努力,对于这种不正当的认可方式表示遗憾,同时也呼吁构建开放、合作和信任的社区。
面壁智能是一家专注于大模型创新的公司,由清华大学的研究团队创立,CEO李大海曾任知乎CTO。公司已经获得两轮融资,分别来自知乎、智谱AI和华为哈勃等投资方。知乎与面壁智能在大模型技术方面有着深度合作,共同开发了多个产品和应用。
此次事件引发了关于学术诚信和开源社区责任的讨论,提醒人们在追求技术创新的同时,要尊重他人的劳动成果,维护良好的科研环境。