斯坦福大学AI团队主导的 Llama3-V开源模子被证实套壳抄袭海内清华与面壁智能的开源模子“小钢炮”MiniCPM-Llama3-V 2.5一事,在网络上激发烧议。
克日,斯坦福大学AI团队主导的 Llama3-V开源模子被证实套壳抄袭海内清华与面壁智能的开源模子 小钢炮 MiniCPM-Llama3-V 2.5一事,在网络上激发烧议。在最新的希望中,斯坦福Llama3-V团队的两位作者Siddharth Sharma(森德哈斯 沙玛)和 Aksh Garg(阿克沙 加格)在社交平台上就这一学术不端行为向面壁MiniCPM团队正式致歉,并暗示会将Llama3-V模子悉数撤下。
图片来历:社交媒体截图
证券时报发文称,斯坦福AI团队抄袭清华系大模子一事,在AI圈炸开了锅。
事件起因是5月29 日,一个由斯坦福学生构成的AI团队宣布了一篇名为《Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars》的文章,称练习出了一个开源多模态模子Llama 3-V。这一模子比 GPT-4、Gemini Ultra、Claude Opus 等模子本领更强,并且练习本钱只需要500美元。
Llama 3-V模子的团队成员 Aksh Garg 在社交平台X上发帖先容了这一模子。该帖很快阅读量便高出30万,Llama 3-V 也很快冲上了全球知名开源社区HuggingFace的趋势榜首页。
随后,有热心网友发明,Llama 3-V与清华系大模子创业公司面壁智能的MiniCPM-Llama3-V 2.5在模子布局、代码、设置文件等方面险些一模一样,只是斯坦福AI团队将个中的变量名称做了变动。该网友更是直接将相关的要害证据一一截图,进队罗列证明。
简言之,Llama3-V疑似套壳抄袭了面壁智能的MiniCPM-Llama3-V 2.5。发明白这一问题的网友在Llama3-V页面上提出了质疑,但Llama3-V页面很快就被作者删除了。今朝,Llama3-V 的GitHub项目主页已显示为 404 ,HuggingFace上的Llama3-V项目已不行见。作者社交媒体账号上,此前宣传Llama3-V的内容页已经遭到删除。
6月3日,Aksh Garg在其社交平台上发文回应了质疑,他艾特别的两名成员Siddharth Sharma和Mustafa Aljadery,并暗示: 我和Siddharth都忙于本身的全职事情,所以Mustafa为该项目编写了所有代码。我俩都对多模态模子感想很是欢快,,而且喜欢他向我们描写的架构扩展,所以我们辅佐他推广该产物。 他还进一步暗示: 在看到这些(抄袭)指控后,我们与Mustafa接头了Llama3-V的原创性证明,并要求提供练习代码,但到今朝为止还没有看到任何证据。我们向原作者致歉,也对本身没有尽职尽责地验证其作品的原创性感想很是失望。
果真资料显示,Siddharth Sharma与Aksh Garg都是斯坦福大学计较机系的本科生,颁发过数篇呆板进修相关的论文。Siddharth Sharma曾在亚马逊实习过一段时间,今朝主要从事与AI和数据相关事情。Aksh Garg 则在SpaceX、斯坦福大学和加州理工学校等知名企业机构都实习过。Aksh Garg 所说的 编写了所有代码 的Mustafa Aljadery则就读于南加州大学,今朝其社交平台X 账号已被设为隐私状态。
值得留意的是,斯坦福 AI 尝试室主任 Christopher David Manning 在社交平台发帖谴责了抄袭行为,同时还对清华的开源模子表达了赞赏。
这一事件中的别的一个主角面壁智能也举办了果真回应。面壁智能CEO李大海在其伴侣圈中发文暗示: 技能创新不易,每一项事情都是团队夜以继日的格斗功效,也是以有限算力对全世界技能进步与创新成长作出的真诚奉献。我们但愿团队的功德情被更多人存眷与承认,但不是以这种方法。我们对这件事深表遗憾!一方面感应这也是一种受到国际团队承认的方法,另一方面也号令各人共建开放、相助、有信任的社区情况。一起加油相助,让世界因AGI的到来变得更好。
果真资料显示,面壁智能创立于2022年8月,专注于大模子技能创新与应用转化。首创团队主要来自于清华大学自然语言处理惩罚尝试室(THUNLP),公司CEO李大海是知乎首席技能官(CTO),连系首创人刘知远是清华大学计较机系副传授、博士生导师。
天眼查显示,面壁智能今朝已完成两轮融资。去年4月,公司完成由知乎、智谱AI投资的数千万人民币天使轮融资;本年4月,公司公布完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能财富投资基金等跟投,知乎作为计谋股东一连跟投支持。
值得留意的是,李大海曾暗示面壁智能是他作为知乎CTO提倡的独一一个项目。作为中等梯队的互联网上市企业,知乎面临全新的技能海潮,想要热情拥抱,又无法如创业公司一样全情投入个中,于是选中面壁智能,作为AI大模子海潮中对知乎技能气力的增补。而知乎所把握大量中文互联网优质语料,也为面壁智能开展大模子练习提供了富厚的数据。
去年4月,知乎与面壁智能公布连系研发的首其中文大模子 知海图AI 和应用 热榜摘要 正式面世。除此以外,两边在面壁智能研发的中文基座大模子CPM-Bee10b、对话类模子产物 面壁露卡 ,以及内测第二款知乎场景下的模子应用 搜索聚合 等方面,也开展了遍及深入的相助。
另据新浪科技报道,6月2日深夜,面壁智能团队证实,斯坦福大模子项目与MiniCPM一样,可以识别出 清华简 战国古文字, 不只对得一模一样、连错得都一模一样 ,且这一古文字数据为研究团队耗费数月从清华简上逐字扫描并人工标注得来,并未对外果真,证实抄袭事实。
北京时间6月4日破晓,斯坦福团队的两位成员Siddharth Sharma和Aksh Garg在X上正式致歉。
图片来历:社交媒体截图
以下为Siddharth Sharma的声明全文:
首先,我们要向MiniCPM的原作者致歉。
@AkshGarg03和我尚有@mustafaaljadery宣布了Llama3V。Mustafa为这个项目编写了代码。Aksh和我都对多模式模子感想欢快,而且喜欢他向我们描写的在Idefics和Siglip之上的架构扩展。我们在这里的脚色是辅佐他在媒体和推特上推广这种模式。我们查察了最近的论文,以验证这项事情的新颖性,但我们没有被奉告或知道@OpenBMB之前的任何事情。在昨天看到关于这个话题的推特帖子后,我们向Mustafa询问了关于Llama3V的独创性证明,并要求提供练习代码,但到今朝为止我们还没有看到任何回应。我们一直在期待Mustafa率先颁发声明,但此刻我们颁发了本身的声明。
我们向miniCBM的作者致歉,因为我们没有尽最大的尽力来验证和同行评审这项事情的新颖性。展望将来,我们将越发审慎和勤奋,我们真诚地感激各人让我们留意到这一点。我们已经删除了所有关于Llama3V的信息,并再次为我们大概造成的未便致歉。
文章来历:证券时报、第一财经、新浪科技
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。