在人工智能领域,开源共享是推动科技进步的重要力量。然而,近期斯坦福AI实验室团队涉嫌抄袭中国开源模型的事件,引发了全球范围内对学术诚信和开源文化的讨论。
事件概述
涉事模型
- Llama3-V: 斯坦福AI实验室团队开发的多模态大模型
- MiniCPM-Llama3-V 2.5: 国产开源模型,由面壁智能团队开发
抄袭指控
- 架构和代码相似性: Llama3-V与MiniCPM-Llama3-V 2.5高度相似
- 证据列举: 网友提供多重证据,直指抄袭行为
涉事人员回应
- Siddharth Sharma和Aksh Garg: 发表致歉声明,承认未尽到核实原创性的责任
- Mustafa Aljadery: 被指为主要过错方,目前失联
斯坦福AI实验室主任的批评
- Christopher Manning: 批评团队避重就轻,没有承认抄袭
网友爆料
- 抄袭历史: 涉事团队之前写的教材也存在抄袭问题
原作者团队回应
- 面壁智能CEO 李大海: 表示这是一种受到国际团队认可的方式
- 首席科学家 刘知远: 确信Llama3-V是对MiniCPM-Llama3-V 2.5的套壳,并强调开源共享的重要性
新证据与分析
权重分析
- 高斯分布: Llama3-V权重差值符合高斯分布,推测直接添加了低方差噪声
书籍抄袭指控
- Mustafa Aljadery书籍: 被指抄袭,目前书籍已404
社区讨论
开源共享的重要性
开源文化的价值
- 全球算法、数据与模型的共享: 推动人工智能的飞速发展
开源协议的遵守
- 尊重和致敬前人成果: 维护开源共享的基石
中国在大模型领域的贡献
- 国际顶尖工作: 如Sora和GPT-4o等
- 中国实验室的成就: 从nobody到关键推动者
结论
斯坦福AI实验室抄袭事件不仅是一个学术诚信的问题,更是一个关于全球开源文化和合作的讨论。这一事件提醒我们,开源共享需要建立在相互尊重和信任的基础上。同时,它也让我们重新审视和认识到中国在大模型领域的成果和贡献。
暂无评论...