已删库跑路斯坦福团队被曝抄袭清华系大模型

作者： 2024年06月03日财经浏览

家人们，大模型圈儿出了个惊天大瓜——

斯坦福 AI团队，竟然曝出了抄袭事件，而且抄袭的还是中国国产的大模型成果——模型结构和代码，几乎一模一样！跟任何抄袭事故一样……AI圈内都惊呆了。

斯坦福的这项研究叫做，是于5月29日新鲜发布，宣称只需要500美元就能训出一个SOTA多模态大模型，比GPT-4V、Gemini Ultra、Claude Opus都强。

Llama3-V的3位作者或许是拥有名校头衔加持，又有特斯拉、SpaceX的大厂相关背景，这个项目短短几天就受到了不小的关注。

甚至一度冲上了HuggingFace趋势榜首页：

然而，戏剧性的一幕开始上演了。

有位细心的网友发现，咦？这“配方”怎么如此的熟悉？

然后他定睛一看，好家伙，这不就是 MiniCPM-Llama3-V 2.5 （出自清华系明星创业公司 面壁智能 ）嘛。

于是这位网友便跑到面壁智能GitHub项目下开始爆料了：

并且他还附上了一堆的证据，最直接的莫过于这张2个模型代码的对比图了：

Emmm……用这位网友的话来说就是：

至于为什么这位网友要跑到面壁智能GitHub项目下面留言，是因为他之前已经给Llama3-V作者留过言了，但斯坦福团队的做法竟是 删库跑路 ……

没错，现在不论是GitHub还是HuggingFace， 统统都是404 ：

并且这事现在还在持续发酵的过程中，网上吃瓜的群众也是越来越多。

那么我先来一同回顾一下这件drama事情的始末。

“代码和架构一模一样”

正如刚才所述，一个网友爆料Llama3-V抄袭MiniCPM-Llama3-V 2.5，跑到面壁智能的GitHub主页提醒团队注意，并把关键证据都一一截图列举整理了下来，这才有了整个抄袭门的还原现场。

以下是来自这位网友的证据。

证据一，Llama3-V的模型架构和代码与MiniCPM-Llama3-V 2.5几乎完全相同：

看下面的例子，配置文件就改了图像切片、分词器、重采样器和数据加载等格式化和变量名：

Llama3-V作者表示参考了LLaVA-UHD架构，在ViT和LLM等选择上有一些差异。但实际上，网友发现他们的具体实现在空间模式等很多方面都与LLaVA-UHD不同，却出奇与MiniCPM-Llama3-V 2.5一致。

甚至，Llama3-V还用了MiniCPM-Llama3-V 2.5的分词器，连 MiniCPM-Llama3-V 2.5定义的特殊符号都 能“巧合”实属离谱。

证据二，网友质疑Llama3-V作者是如何在MinicPM-Llama3-V2.5项目发布之前就使用上MinicPM-Llama3-V2.5分词器的。

Llama3-V作者给的回复是这样婶儿的，说是用的面壁智能上一代MinicPM-V-2项目的：

但事实却是，HuggingFace中，MiniCPM-V2与MiniCPM-Llama3-V 2.5分词器分别是两个文件，文件大小也完全不同。

MiniCPM-Llama3-V 2.5的分词器是用Llama3分词器加上MiniCPM-V系列模型的特殊token组成，而MiniCPM-V2的发布都在Llama3开源之前，怎么会有Llama3分词器。

证据三，Llama3-V作者随后无故删除了网友在Llama3-V页面上提交的质疑他们抄袭的问题。

而且，他们似乎对MiniCPM-Llama3-V 2.5架构或他们自己的代码都不完全了解。

感知器重采样器（Perceiver resampler）是单层交叉注意力，而不是双层自注意力。但是下图所示Llama3-V的技术博客里作者的理解很明显是错的。

SigLIP的Sigmoid激活也不用于训练多模态大语言模型，而仅用于预训练SigLIP。

视觉特征提取不需要Sigmoid激活：

基于以上三点事实，这位网友认为足以证据证明Llama3-V项目窃取了MiniCPM-Llama3-V 2.5项目的学术成果。

但还没完，他随后又补充了两点证据。

几天前，当这位网友尝试运行Llama3-V时，发现他们提供的代码无法与HuggingFace的checkpoint一起使用，反馈问题没有得到作者回复。

于是网友把从HuggingFace下载的Llama3-V模型权重中的变量名改成了MiniCPM-Llama3-V 2.5的，惊奇发现模型居然可以用MiniCPM-V代码成功运行。

此外，如果将高斯噪声（由单个标量参数化）添加到MiniCPM-Llama3-V 2.5的checkpoint，结果就是会得到一个行为与Llama3-V极其相似的模型。

收到网友的提醒后，MiniCPM-Llama3-V 2.5团队这边也迅速展开了调查，他们按照网友的在GitHub上的说明，使用 Llama3-V的checkpoint和MiniCPM-Llama3-V 2.5的代码和配置文件正确获取了推理结果。

于是，一个更为关键性的证据出现了。

Llama3-V在一些未公开的实验性特征上表现出与MiniCPM-Llama3-V 2.5高度相似的行为，而这些特征是根据MiniCPM-Llama3-V 2.5团队内部数据训练的。

例如， 识别清华简 ！

MiniCPM-Llama3-V 2.5特有的功能之一是识别清华简，这是一种非常罕见、于战国时期写在竹子上的中国古代文字。

训练图像是从最近出土的文物中扫描出来的，由MiniCPM-Llama3-V 2.5团队进行了标注，尚未公开发布。

而Llama3-V的识别情况和MiniCPM-Llama3-V 2.5极为相似。

识别错误的情况竟也出奇一致：

MiniCPM-Llama3-V 2.5团队还在1000 张竹简图像上测试了几种基于Llama3的视觉-语言模型，并比较了每对模型的预测精确匹配。

结果，每两个模型之间的重叠为零，而Llama3-V和MiniCPM-Llama3-V 2.5之间的&&重叠达到了惊人的87%**。

此外，MiniCPM-Llama3-V 2.5和Llama3-V 甚至具有相似的错误分布 。Llama3-V和MiniCPM-Llama3-V 2.5分别做出 236和194个错误预测，重叠部分为182个。

且按照网友在GitHub上的指令获得的MiniCPM-Llama3-V2.5-noisy显示出与Llama3-V几乎相同的定量结果，真令人匪夷所思……

在另一个MiniCPM-Llama3-V 2.5内部数据上训练的未公开功能——WebAgent上，也出现了同样的情况。

Llama3-V甚至和MiniCPM-Llama3-V 2.5团队新定义的WebAgent模式中犯的错误都一样。

鉴于这些结果，MiniCPM-Llama3-V 2.5团队表示很难将这种不寻常的相似性解释为巧合，希望Llama3-V作者能对这个问题给出一个正式的解释。

斯坦福团队已删库跑路

虽然斯坦福的2位本科生已经下架了几乎所有与之相关的项目，但其实在此之前，他们最初在面对质疑的时候还是做出了些许的解释。

例如他们强调，Llama3-V这项工作的时间是要早于面壁智能的MiniCPM，只是使用了他们的tokenizer。

不过作者对Medium上的声明还是做了保留：

对此，一部分网友表示，既然选择删掉项目，那么就表示确实存在一定的问题。

不过另一方面，对于抄袭这事也有不一样的声音——

MiniCPM-Llama3-V 2.5不也是在Llama3的基础上做的改良吗？不过连tokenizer都直接拿来用就应该不算是借鉴了。

而就在刚刚，另一个戏剧性的事情发生了。

斯坦福的作者在中午时间做出了最新的回应：

但现在……这条回应又删掉了

而面壁智能这边，CEO李大海也做出了正式回应：

参考链接：[1]https://github.com/OpenBMB/MiniCPM-V/issues/196[2]https://github.com/mustafaaljadery/Llama3-V[3]https://www.reddit.com/r/LocalLLaMA/comments/1d6f1f3/Llama3-V_project_is_stealing_a_lot_of_academic/[4]https://www.reddit.com/r/LocalLLaMA/comments/1d6f1f3/Llama3-V_project_is_stealing_a_lot_of_academic/?rdt=41696&onetap_auto=true&one_tap=true[5]https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee

四川省哪所专科学校最好？并且该学校哪些专业好？高考理科大概要多少分才能进？

四川建筑职业技术学院吧，简称四川建院，这个学校这几年在四川的专科中应该是最火爆的，收分相比之下肯定要比其他专科院校收分高一些，这个学校最好的专业是工程造价和建筑工程技术两个专业，收分的话可能要接近2本分数吧，建院的一专所有专业应该都会收到三本分数左右吧，二转收分可能就是比一专调档线高点吧！学院现有教职工1013人，其中专任教师745人，教授19人，副教授177人，“双师”素质教师309人，四川省学术和技术带头人1人，4人获得四川省教学名师奖，省级教学团队4个。学院另有兼职教师458人，均为行业企业知名专家和能工巧匠。学院硬件设施非常不错，可以这样说，已经超过了有些本科院校，学院就业率超高，就在2010年学院又被教育部评为全国高等院校就业先进单位（四川省只有四川建院一所学校获此殊荣，全国包括北大，清华在内的仅50所高校获此荣誉）最后给楼主说下，建院的管理相当严格（都有点令人发指了），男女比例严重失调！但是我在想可能就是因为建院管理严格才能有这么高的就业率吧，还有就是在建院其实很多专业都是不错的，但前提条件是一定要与建筑挂钩的专业哈，神马物流，神马计算机就不要去读了哈！说了这么多，我也不是说四川其他的专科院校就不好了，比如成都电子高专的数控和模具专业，四川工程职业技术学院的机电方面专业，四川交通职业技术学院的道路桥梁工程专业都还是非常不错的，但是收分没有四川建院高，就业率没建院高，名气没建院大！

斯坦福或 MIT 的计算机系比清华的强在哪？

1. 环境。清华旁边是五道口、中关村，斯坦福旁边是硅谷。 2. 学校和业界之间的联系。人所见到的世界越大，这个世界越精彩，值得为之奋斗的东西也就越多。比如说，你是想去世界一流的公司工作，还是想去中国一流的公司？（比如说去某些中国一流的公司的某些部门抄袭世界一流的公司产品？）（其实我觉得做改变全中国的产品已经很棒了。）3. 校友。我个人认为好学校和普通学校最明显的差距在于校友。校友之间的联系和校友之间的帮助是非常重要的。你的校友的经历会一定程度上影响你自己的人生规划，也会多少影响业界其他人对你的看法。毕竟，大部分人看一个职场新人简历的时候，第一眼都是看“本科学校”。 4. 同学氛围清华：你的很多同学都在想方设法考GRE出国或者进Google fb等公司实习。 Stanford：你的很多同学都在想方设法办自己的公司。比如说，Google。但我觉得这两所学校的学生智商没差别。按人口比例以及录取比例来说（假定录取方式可以合理地筛选出高智商人才），我觉得清华学生智商可能还高些。而这两所学校学生focus点的差异，取决于社会环境。 5. 师资力量。虽说天才学生不一定需要好老师，但对大多数学生来说，遇见好老师还是受益终身。要说编程能力等，我觉得清华学生的平均水平绝对是世界一流的。 6. 学校的研究氛围。国内的研究风气太烂是通病，虽说在我的观念里国内计算机系No.1的清华的研究风气还是很好的，但依然比不上米国牛校。查查每年发的论文就知道了。

国内哪个高校的机械故障诊断大牛比较多。

不是大神，只是了解一些，说下个人看法。国内的话推荐1 清华大学机械工程系褚福磊教授团队2 上海交通大学振动冲击噪声研究所彭志科教授团队3 西安交通大学机械制造系统工程国家重点实验室雷亚国教授团队这三所大学目前在这个领域比较强。其他的大学也有很多人在做，比如华中科技大学机械学院史铁林教授，四川大学空天学院苗强教授，苏州大学轨道交通学院朱忠奎教授，北京科技大学机械工程学院车辆工程系冯志鹏教授，中科大，西南交通大学，哈工大等等大学也有人在做。国内读博的话还是推荐清华，上交，西交比较好。国外的话推荐1 澳大利 Prof. R.B. Randall, School of Mechanical and Manufacturing Engineering, UNSW Sydney2 美国：Prof. Michael Pecht, Center for Advanced Life Cycle Engineering (CALCE), University of Maryland3 法国：Prof. JérômeAntoni, Laboratoire Vibrations Acoustique, University ofLyon4 英国：Prof. David Mba, Department of Faculty of Technology, London South Bank University此外，加拿大阿尔伯塔大学，新加坡，韩国，意大利也有人在做，具体大学忘记了。