0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

斯坦福团队抄袭国产大模型,主要责任人失联

Felix分析 来源:电子发烧友 作者:吴子鹏 2024-06-05 00:10 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/吴子鹏)近日,斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5。该事件引起了业界的广泛关注,也让大家对于开源大模型的规范使用更加担忧。

斯坦福Llama3V模型被证实抄袭

5月29日,斯坦福大学的一个AI团队在Github等平台发布了一款大模型,名为Llama3V,该模型的亮点是据称只需要500美元就可以训练出一个 SOTA多模态模型,模型效果可比肩GPT-4V、Gemini Ultra等大模型。

由于模型团队来自斯坦福,且效果描述非常吸引眼球,因此该模型很快在社交平台发酵,推特上相关话题的浏览量超过了30万,迅速冲到了Hugging Face首页。

不过,有用户很快发现,Llama3-V大模型实际上是套壳面壁智能的MiniCPM-Llama3-V 2.5,但Llama3-V在发布信息中并没有体现这一点,且称只是使用了MiniCPM-Llama3-V 2.5的tokenizer。但这一说法让用户很难认同,随后有用户在Github页面上指出了套壳的问题,但相关言论很快被斯坦福团队删除。

该用户非常不满随后到MiniCPM-Llama3-V 2.5页面下重述了这一问题,并提醒面壁智能重视此事。面壁团队通过测试发现,Llama3V与MiniCPM-Llama3-V 2.5在“胎记”般案例上的表现100%雷同,做实了斯坦福团队的抄袭行为。随后,这一事件在国外媒体迅速发酵。

随后不久,斯坦福Llama3-V团队承认抄袭,斯坦福本科生Siddharth Sharma和Aksh Garg发布了道歉声明,不过据称是主要责任人的Mustafa Aljadery并没有出现在道歉声明中,这名学生来自南加利福尼亚大学,目前处于失踪的状态,是这一事件的主要过错方。

Aksh Garg在道歉声明中表示,“首先,我们要向MiniCPM原作者道歉。我、Siddharth Sharma,以及Mustafa一起发布了Llama3-V,Mustafa为这个项目编写了代码,但从昨天起就无法联系他。我与Siddharth Sharma主要负责帮助Mustafa进行模型推广。我们俩查看了最新的论文,以验证这项工作的新颖性,但并未被告知或意识到OpenBMB(清华团队支持发起的大规模预训练语言模型库与相关工具)之前的任何工作。我们向作者道歉,并对自己没有努力验证这项工作的原创性感到失望。我们对所发生的事情承担全部责任,并已撤下Llama3-V,再次致歉。”

6月3日,面壁智能CEO李大海与联合创始人刘知远先后发文,回应开源模型被斯坦福大学AI团队抄袭一事。李大海表示:“我们对这件事深表遗憾。一方面感慨这也是一种受到国际团队认可的方式,另一方面呼吁大家共建开放、合作、有信任的社区环境。”“我们希望团队的好工作被更多人关注与认可,但不是以这种方式。”

据介绍,MiniCPM-Llama3-V 2.5是MiniCPM-V系列的最新版本模型,基于SigLip-400M和Llama3-8B-Instruct构建,共参数规模为8B,相较于MiniCPM-V 2.0性能取得较大幅度提升。MiniCPM-Llama3-V 2.5在综合了11个主流多模态大模型评测基准的OpenCompass榜单上平均得分65.1的成绩,超越了GPT-4o、GPT-4V、Gemini Pro、Qwen-VL-Max等商用闭源模型。

开源大模型规范使用值得关注

开源大模型是指一种基于开源技术和大规模数据集构建的人工智能模型,具有开放性和可扩展性的特点。开源大模型与传统的商业人工智能模型不同,其最大的特点在于开放性和可扩展性。这种模型的构建需要利用大量的开源工具和资源,包括开源的深度学习框架、开源的数据集和开源的算法等。

开源大模型是AI大模型发展的重要分支,拥有LLaMA、Grok-1、Stable Code Instruct-3B、Mistral 8x7B和零一万物的Yi-34B等代表产品,这些大模型的发布和发展,不仅显著增强了数据的安全性和隐私保护,更为用户节省了大量成本,减少了对外部依赖的需求。

不过,由于是开源的,因此开源大模型一直以来都面临着被抄袭的风险。实际上,上述提到的零一万物的Yi-34B在去年也是深陷抄袭的漩涡里。2023年11月14日,一位国外开发者在Hugging Face开源主页上评论称,创新工场董事长兼CEO、零一万物CEO李开复旗下 AI 公司“零一万物”开源大模型Yi-34B,完全使用Meta研发的LIama开源模型架构,而只对两个张量(Tensor)名称进行修改。

根据零一万物的说明,零一万物在训练模型过程中,沿用了GPT/LLaMA的基本架构,由于LLaMA社区的开源贡献,让零一万物可以快速起步。零一万物还在声明中称,模型结构仅是模型训练其中一部分。Yi 开源模型在其他方面的精力,比如数据工程、训练方法、baby sitting(训练过程监测)的技巧、hyperparameter设置、评估方法以及对评估指标的本质理解深度、对模型泛化能力的原理的研究深度、行业顶尖的AI infra能力等。

实际上,在更早的2022年,智源研究院的大模型研究中心就被爆出了抄袭的问题,一篇拥有100位作者署名的综述研究《A Roadmap for Big Model》被质疑抄袭了多篇论文内容,引发国内外学者和社区的广泛关注与讨论。另外,商汤、谷歌等公司都曾被指出存在抄袭问题。

目前,AI大模型在防止抄袭、版权归属等问题方面还存在很大的漏洞,行业法规明显不健全,关于大模型使用已有作品进行训练是否构成侵权,以及大模型生成物是否可以享有版权,这类事件也已经有案件发生。相信随着行业的进一步发展,杜绝抄袭和版权归属将逐渐有法可依,这样会更有利于大模型的发展。

结语

斯坦福团队开源大模型抄袭事件暴露了开源大模型的滥用和监管问题,同时AI大模型也还有更深层次的数据和作品版权归属问题,因此不难看出AI大模型尚处于野蛮生长的阶段,未来还需要逐步健全行业法规。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 大模型
    +关注

    关注

    2

    文章

    3460

    浏览量

    4975
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    斯坦福团队开发新型铁基电池材料推动储能技术发展

    这项关于铁基电池材料的发现最直接的应用前景在于锂离子电池领域。研究人员采用锂、铁、锑和氧合成的正极材料,在斯坦福大学与SLAC国家加速器实验室联合建立的电池中心进行的初步测试中表现出稳定的高电压特性
    的头像 发表于 11-13 14:41 150次阅读
    <b class='flag-5'>斯坦福</b><b class='flag-5'>团队</b>开发新型铁基电池材料推动储能技术发展

    2025安波创新大奖揭晓

    本次创新大奖共吸引安波全球300余个项目申报,最终,23位员工入选安波创新名人堂,11位晋级升阶,3支团队闯入团队创新奖最终提名,明日之星奖、年度创新奖和One Aptiv奖则分别
    的头像 发表于 09-26 14:38 546次阅读

    斯坦福SR860数字锁相放大器

    | 实验室校验、维修 | 计量校准实验室 | 前沿科学研究实验室 | | 价格等级 | 万元级 | 数十万至百万级 | 十万美元级别 | 总结 斯坦福研究系统SR860是一款基于DSP技术的、高性能
    发表于 09-09 10:00

    回收出售租赁维修二手斯坦福SR620频率计

    回收出售租赁维修二手斯坦福SR620频率计 SR620时间间隔和频率计数器概述 SR620是一款高精度时间间隔和频率计数器,适用于实验室或ATE环境中的各类时间和频率测量需求。其核心优势在于单次
    发表于 08-25 14:22

    斯坦福(Stanford)锁相放大器故障修复

    斯坦福锁相放大器是由斯坦福研究系统公司(Stanford Research Systems, SRS)研发的一款测量工具,主要用于微弱信号的测量和提取。它结合了高灵敏度、高精度、高稳定性和多功能性于一体,是科研和工业领域的重要设
    的头像 发表于 07-30 10:58 681次阅读
    <b class='flag-5'>斯坦福</b>(Stanford)锁相放大器故障修复

    斯坦福SR530锁相放大器技术手册

    斯坦福SR530锁相放大器是一款专为精密微弱信号检测设计的高性能仪器,核心功能是从强噪声背景中提取特定频率信号,广泛应用于物理、化学、生物医学及工程领域。
    的头像 发表于 07-11 18:02 659次阅读
    <b class='flag-5'>斯坦福</b>SR530锁相放大器技术手册

    斯坦福SR445A科研级前置放大器安装、操作与维护指南

    斯坦福前置放大器SR445A是一款专为低噪声信号放大设计的高性能设备,覆盖直流至高频段,提供可变增益及灵活的滤波功能,适用于光电探测、生物电信号、精密测量等领域。
    的头像 发表于 06-20 16:52 769次阅读
    <b class='flag-5'>斯坦福</b>SR445A科研级前置放大器安装、操作与维护指南

    斯坦福SR830锁相放大器低量程报错维修步骤详解

    近期某客户送修一台斯坦福SR830锁相放大器,报修故障为在低量程状态下一直报错 OVLD。对仪器进行初步检测,仪器缺旋钮盖;开机自检正常;GPIB正常;空载SENSITIVTY 在2mV以下报
    的头像 发表于 06-10 18:06 688次阅读
    <b class='flag-5'>斯坦福</b>SR830锁相放大器低量程报错维修步骤详解

    斯坦福DG535脉冲发生器无法启动故障诊断与维修方案

    近期深圳某院校送修一台斯坦福DG535数字延时脉冲发生器,报修故障为开机之后面板卡住,操作没有反应。对仪器进行初步检测,仪器开机之后卡在启动界面,指示灯全亮,按键没有反应。
    的头像 发表于 05-28 16:02 482次阅读
    <b class='flag-5'>斯坦福</b>DG535脉冲发生器无法启动故障诊断与维修方案

    详解《斯坦福 AI 报告 2025》:国产模型崛起、清华论文领先

    斯坦福AI指数报告这是一份影响力很大的报告,每年一期。该报告旨在追踪、整合、提炼并可视化与人工智能(AI)相关的各类数据。报告提供无偏见、经过严格审查、来源广泛的数据,帮助政策制定者、研究人员、高管
    的头像 发表于 04-17 18:05 1602次阅读
    详解《<b class='flag-5'>斯坦福</b> AI 报告 2025》:<b class='flag-5'>国产</b><b class='flag-5'>模型</b>崛起、清华论文领先

    斯坦福大学发布《2025 年人工智能指数报告》

    2025年4月,斯坦福2025HAI报告重磅发布。由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(StanfordHAI)发布了《2025年人工智能指数报告
    的头像 发表于 04-11 11:08 1379次阅读
    <b class='flag-5'>斯坦福</b>大学发布《2025 年人工智能指数报告》

    字节豆包大模型团队提出稀疏模型架构

    字节跳动豆包大模型Foundation团队近期研发出UltraMem,一种创新的稀疏模型架构,旨在解决推理过程中的访存问题,同时确保模型效果不受影响。
    的头像 发表于 02-13 15:25 1030次阅读

    阿里巴巴Qwen大模型助力开发低成本DeepSeek替代方案

    近日,阿里巴巴的开源Qwen2.5模型在AI领域再次展现其强大实力,为斯坦福大学与伯克利大学的研究人员提供了低成本的AI训练解决方案。借助这一技术,两所知名学府的研究团队成功开发出价格低于50美元
    的头像 发表于 02-12 13:42 1270次阅读

    海光信息技术团队完成模型与DCU国产化适配

    近期,中科曙光国家先进计算产业创新中心有限公司对外发布了一则重要消息。据悉,该公司的海光信息技术团队已经成功完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的国产化适配工作,并
    的头像 发表于 02-06 11:37 1766次阅读

    斯坦福STANFORD FS725铷钟

    斯坦福STANFORD FS725铷钟 SRS斯坦福FS725 10MHzRb频率标准   SRS斯坦福FS72510MHzRb频率标准FS725集成了一个铷振荡器(SRS模型PRS1
    的头像 发表于 12-13 15:22 840次阅读