斯坦福 AI 团队被曝抄袭清华系大模型
斯坦福AI 团队近期曝出抄袭事件,涉嫌抄袭中国国产大模型成果——模型结构和代码几乎一模一样。此事在 AI 圈内引发震动。
Llama3-V 发布与争议
斯坦福的这项研究名为Llama3-V,于 5 月 29 日发布,宣称只需 500 美元就能训练出一个 SOTA(State-of-the-Art)多模态大模型,性能声称优于 GPT-4V、Gemini Ultra 和 Claude Opus。

Llama3-V 的 3 位作者拥有名校头衔及特斯拉、SpaceX 等大厂背景,项目发布后迅速受到关注,一度冲上 HuggingFace 趋势榜首页。

然而,有细心的网友发现该项目的'配方'异常熟悉。经比对,发现其与MiniCPM-Llama3-V 2.5(出自清华系明星创业公司面壁智能)高度相似。

网友随后在面壁智能 GitHub 项目下留言指出抄袭问题,并附上证据:
你们家大模型被斯坦福团队抄袭了!

最直接的证据是两张模型代码的对比图,显示模型结构、代码、配置文件简直一模一样,仅变量名有所更改。

面对质疑,斯坦福团队的做法是删除相关页面,导致 GitHub 和 HuggingFace 上的项目链接均显示 404。

详细抄袭证据分析
1. 代码和架构高度一致
网友整理的证据显示,Llama3-V 的模型架构和代码与 MiniCPM-Llama3-V 2.5 几乎完全相同。配置文件仅修改了图像切片、分词器、重采样器和数据加载等格式化和变量名。
















