都抄了!清华系团队发文回应 连识别 清华简 斯坦福AI团队抄袭国产大模型

智东西(公众号:

作者 | 程茜

编辑 | 心缘

智东西6月3日消息,大模型“套壳”的回旋镖,这次扎到了美国科研团队身上。最近几天, 斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果 ,引起舆论哗然。

起因是这个团队在5月29日发布了一个多模态大模型Llama3-V,声称只花500美元训练,就能实现在多个基准测试中比肩GPT-4的性能。但很快有人发现,该模型跟清华系大模型创企面壁智能5月发布的MiniCPM-Llama3-V 2.5模型有不少相似处,而且没有任何相关致谢或引用。

一开始团队面对抄袭质疑还嘴硬否认,只承认使用了MiniCPM-Llama3-V的分词器,后来证据越来越多——不仅,而且被发现作者 曾在Hugging Face导入MiniCPM-V的代码,然后改名成Llama3-V

最绝的是Llama3-V连国产AI模型的“胎记”都抄走了,跟MiniCPM-V一样能 识别清华战国竹简“清华简” ,而且连出错的样例、在高斯扰动验证后的正确和错误表现方面都高度相似。

而基于非公开训练数据的清华简识别能力,是面壁MiniCPM团队耗时数月、从卷帙浩繁的清华简中逐字扫描并逐一数据标注,融入模型中的。

面对铁一般的证据,Llama3-V团队终于立正挨打,一套道歉流程行云流水,火速删库、发文致歉外加撇清关系。其中来自斯坦福计算机科学专业的两位作者澄清说他们并未参与代码工作, 所有代码都是毕业于南加州大学的Mustafa Aljadery负责的 ,他一直没交出训练代码。

▲Llama3-V作者:Siddharth Sharma(左)、Aksh Garg(中)、Mustafa Aljadery(右)

这样看来,Llama3-V团队并不能算严格意义上的斯坦福团队,不过因为此事声誉受损的斯坦福大学至今没有采取任何公开措施。

面壁智能团队的回应很有涵养。今日,面壁智能联合创始人兼CEO李大海在朋友圈回应说,这也是一种 “受到国际团队认可的方式” ,并呼吁大家共建开放、合作、有信任的社区环境。

一、网友细数五大证据,作者删库跑路、不打自招

Llama3-V的 模型代码与MiniCPM-Llama3-V 2.5高度相似 ,同时其项目页面没有出现任何与MiniCPM-Llama3-V 2.5相关的声明。

公开的基准测试结果显示,Llama3-V在所有基准测试中优于GPT-3.5,在多个基准测试中优于GPT-4,且模型尺寸是GPT-4V的1/100,预训练成本为500美元。这也使得该模型一经就冲上Hugging Face首页。

但当细心网友发现Llama3-V疑似“套壳”面壁智能此前发布的开源多模态模型MiniCPM-Llama3-V 2.5,在评论区发表评论后,Llama3-V项目作者最初否认抄袭,并称他们的项目开始时间先于MiniCPM-Llama3-V 2.5发布, 只是使用了MiniCPM-Llama3-V 2.5的分词器

当网友抛出三大事实质疑后,Llama3-V的做法是—— 不回应 直接删除网友评论

昨日下午,网友在MiniCPM-V页面下将事情经过全部公开,并公开@面壁智能让其项目团队投诉。

当日晚间, 面壁智能研发人员发布推文,其验证结果也印证了网友的说法,Llama3-V与MiniCPM-Llama3-V 2.5高度相似 。同时公开喊话Llama3-V研发团队:“鉴于这些结果,我们担心很难用巧合来解释这种不寻常的相似性。我们希望作者能够对这个问题给出官方解释,相信这对开源社区的共同利益很重要。”

以下就是Llama3-V被质疑抄袭MiniCPM-Llama3-V 2.5的五大证据:

1、Llama3-V的代码是对MiniCPM-Llama3-V 2.5的重新格式化,其模型行为检查点的噪声版本高度相似。

其中,Llama3-V只是对代码进行了重新格式化和变量重命名,包括但不限于图像切片、标记器、重采样器和数据加载。 面壁智能研发人员也证实,Llama3-V有点类似于MiniCPM-Llama3-V 2.5的噪声版本。

2、起初网友在Llama3-V的Hugging Face页面质疑抄袭时,其作者回应称只是使用了其分词器,并且项目开始时间比MiniCPM-Llama3-V 2.5更早。

当网友进一步询问如何在MiniCPM-Llama3-V 2.5发布前使用其分词器, 作者给出的答案是使用了MiniCPM-V-2的分词器,但很明显,两个版本的分词器完全不同

3、Llama3-V提供的代码无法与Hugging Face的检查点兼容。

但网友将Llama3-V模型权重中的变量名称更改为MiniCPM-Llama3-V 2.5的名称后,该模型可以与MiniCPM-V代码一起运行。

面壁智能的研发人员的调查结果也显示:更改参数名称后,可以使用MiniCPM-Llama3-V 2.5的代码和config.json运行Llama3-V。

4、Llama3-V项目的作者害怕面对质疑, 删除了质疑者在Llama3-V上提交的质疑他们偷窃的问题 。并且目前Llama3-V项目已经从开源网站中下架删除。

5、在一些未公开的实验性特征上, 比如在内部私有数据上训练的古汉字清华竹简,Llama3-V表现出与MiniCPM-Llama3-V 2.5高度相似的推理结果。 这些训练图像是最近从出土文物中扫描并由面壁智能的团队注释的,尚未公开发布。

例如下图中的几个古汉字识别:

MiniCPM-Llama3-V 2.5中未公开的WebAgent功能上,在框选内容大小时,Llama3-V与之犯了相同的错误:

二、仨作者内讧,Aljadery全权负责写代码,但拿不出训练代码

昨天,Aksh Garg、Siddharth Sharma在外媒Medium上公开回应:“非常感谢在评论中指出(Llama3-V)与之前研究相似之处的人。 我们意识到我们的架构与OpenBMB的‘MiniCPM-Llama3-V2.5:手机上的GPT-4V级多模态大模型’非常相似 ,他们在实现方面领先于我们。为了尊重作者,我们删除了原始模型。”Aljadery没有出现在声明中。

▲Aksh Garg、Siddharth Sharma的回应声明

曾在南加州大学从事深度学习研究,并在麻省理工学院从事并行计算研究,拥有南加州大学计算机科学学士学位和计算神经科学理学士学位,目前其没有在公司任职。

Garg在社交平台X中发布的致歉声明中提到,Mustafa全权负责编写Llama3-V的代码,他与Sharma因忙于全职工作并未参与代码编写。

在听取了Mustafa描述的Idefics、SigLip等架构扩展创新、查看了最新论文后,他们二人就在未被告知该项目与开源代码关系的情况下,帮助Mustafa在外媒Medium和社交平台X对Llama3-V进行了宣传推广。

在昨天看到关于的抄袭指控后,和就与 Mustafa进行了原创性讨论,并要求他 提供训练代码,但目前未收到任何相关证据。

目前,Aljadery的推特账号显示“只有获得批准的关注者才能看到”。

三、首个基于Llama-3构建的多模态大模型

此前,Garg在介绍Llama3-V的文章中提到,Llama3-V是首个基于Llama-3构建的多模态大模型,训练费用不到500美元。并且与多模态大模型Llava相比,Llama3-V性能提升了10-20%。

除了MMMU之外,Llama3-V在所有指标上的表现都与大小为其100倍的闭源模型非常相近。

他们所做的就是让Llama 3能理解视觉信息。Llama3-V采用SigLIP模型获取输入图像并将其嵌入到一系列块嵌入中。然后,这些嵌入通过投影块与文本标记对齐,投影块应用两个自注意力块将文本和视觉嵌入放在同一平面上。最后,投影块中的视觉标记就被添加到文本标记前面,并将联合表示传递给Llama 3。

结语:Llama3-V套壳实锤,或损害开源社区健康发展

不论从网友的质疑还是Llama3-V作者的回应来看,该模型套壳MiniCPM-Llama3-V2.5已经基本实锤,高度相似的代码以及部分基于面壁智能内部未公开训练数据训练的功能,都证明这两大模型的相似性。

目前来看,对于大模型“套壳”没有明确的界定,但开源大模型以及开源社区的构建本意是促进技术的共享和交流,加速AI的发展,但如果以这种直接“套壳”、更改变量的形式使用,或许会与这一发展愿景背道而驰,损害开源社区的健康发展。


四川省哪所专科学校最好?并且该学校哪些专业好?高考理科大概要多少分才能进?

四川建筑职业技术学院吧,简称四川建院,这个学校这几年在四川的专科中应该是最火爆的,收分相比之下肯定要比其他专科院校收分高一些,这个学校最好的专业是工程造价和建筑工程技术两个专业,收分的话可能要接近2本分数吧,建院的一专所有专业应该都会收到三本分数左右吧,二转收分可能就是比一专调档线高点吧! 学院现有教职工1013人,其中专任教师745人,教授19人,副教授177人,“双师”素质教师309人,四川省学术和技术带头人1人,4人获得四川省教学名师奖,省级教学团队4个。 学院另有兼职教师458人,均为行业企业知名专家和能工巧匠。 学院硬件设施非常不错,可以这样说,已经超过了有些本科院校,学院就业率超高,就在2010年学院又被教育部评为全国高等院校就业先进单位(四川省只有四川建院一所学校获此殊荣,全国包括北大,清华在内的仅50所高校获此荣誉) 最后给楼主说下,建院的管理相当严格(都有点令人发指了),男女比例严重失调!但是我在想可能就是因为建院管理严格才能有这么高的就业率吧,还有就是在建院其实很多专业都是不错的,但前提条件是一定要与建筑挂钩的专业哈,神马物流,神马计算机就不要去读了哈! 说了这么多,我也不是说四川其他的专科院校就不好了,比如成都电子高专的数控和模具专业,四川工程职业技术学院的机电方面专业,四川交通职业技术学院的道路桥梁工程专业都还是非常不错的,但是收分没有四川建院高,就业率没建院高,名气没建院大!

"新奥数能科技有限公司"新奥数能,技术实力如何?

新奥数能是行业领先的互联网能源技术企业,获得了“十大能源互联网示范项目”等多项荣誉,与斯坦福、麻省理工、清华大学等高校科研机构在人工智能、计算和大数据、物联等领域开展联合研究。 华为、Intel等著领先企业也在与新奥数能有关于边缘计算和IOT领域的技术交流及合作探索。

水系统中央空调品牌哪个好

水系统中央空调确实是现在家装的趋势,氟利昂只在室外机循环,室外机和房间室内机是水循环,冷风柔和,温度稳定,比氟系统中央空调更加舒适、健康。 更重要的是冬天还可以带水地暖,比壁挂炉供暖节能30%以上。 选择哪个品牌好?有人会说知名度高的品牌啊,那你90%会选错,真正的行家会告诉你,一定要根据自家户型来选,为什么呢?因为水系统中央空调最早在独栋别墅为主的欧美地区普及,室外机安装位置不受限制,而进入中国,大多是以平层或复式为主的中小住宅,普遍的空调外机位标准仅为1.2米宽,而一般的“水机”室外机体积庞大,有1米来宽,根本放不下。 即使勉强放下,也是违规安装,外机两侧的进风空间不足10CM,影响散热,制热/制冷效果都会很差,节能效果也达不到预期。 甚至很多用户反映,室外机经常出故障罢工。 其实这都不是产品故障,也不是系统问题,而是因为室外机安装位置受限、散热不足,导致的室外机超温停机,引发了故障。 所以一定要根据户型情况来选择品牌,如果你是别墅,外机可以放在楼顶、露台上,安装空间充足,选择面就很广,像开利,空调的发明者,大家也是耳熟能详,水机技术处于领先地位;但如果是平层或复式户型,室外机只有开发商预留的标准外机位,最好就是选择奥特朗,最窄的机型宽度仅为0.8米,什么机位都能安装,就不不影响效果,也不会出问题。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://www.srwj168.com.cn/kuaibao/20494.html
幼态审美快把人逼疯 连牙齿也要 白瘦幼
王秋儿知三当三 师生同性应有尽有 绝世唐门另类爱情合集