首页
技术

可编程逻辑

MEMS/传感技术

嵌入式技术

模拟技术

控制/MCU

处理器/DSP

存储技术

EMC/EMI设计

电源/新能源

测量仪表

制造/封装

RF/无线

接口/总线/驱动

EDA/IC设计

光电显示

连接器

PCB设计

LEDs

汽车电子

医疗电子

人工智能

可穿戴设备

军用/航空电子

工业控制

触控感测

智能电网

音视频及家电

通信网络

机器人

vr|ar|虚拟现实

安全设备/系统

移动通信

便携设备

物联网

区块链

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充电桩

氮化镓

BLDC

逆变器

5G

电机控制
资源

技术文库

新品速递

电路图

元器件知识

电子百科

最新技术文章

元器件搜索引擎
下载

在线工具

常用软件

电子书

datasheet
专栏

电子说

专栏
社区

论坛

问答

小组

技术专栏

社区之星

试用中心

HarmonyOS技术社区

2023电子工程师大会
研究院
活动

设计大赛

硬创大赛

社区活动

线下会议

在线研讨会

小测验
学院

直播

课程
视频
企业号
工具

datasheet查询

免费评测试用

技术子站

搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

谷歌DeepMind被曝抄袭开源成果，论文还中了顶流会议

卡奥斯智能交互引擎是卡奥斯基于海尔近40年工业生产经验积累和卡奥斯7年工业互联网平台建设的最佳实践，基于大语言模型和RAG技术，集合海量工业领域生态资源方优质产品和知识服务，旨在通过智能搜索、连续交互，实时生成个性化的内容和智能化产品推荐，为用户提供快速、可靠的交互式搜索服务，首创了聚焦工业领域的智能交互引擎。

详情戳：卡奥斯智能交互引擎

大模型圈再曝抄袭大瓜，这回，“被告”还是大名鼎鼎的谷歌DeepMind。

“原告”直接怒喷：他们就是把我们的技术报告洗了一遍！

具体是这么个事儿：

谷歌DeepMind一篇中了顶流新生代会议CoLM 2024的论文被挂了，瓜主直指其抄袭了一年前就挂在arXiv上的一项研究。开源的那种。

两篇论文探讨的都是一种规范模型文本生成结构的方法。

抓马的是，谷歌DeepMind这篇论文中确实明晃晃写着引用了“原告”的论文。

然鹅，即便是标明了引用，“原告”的两位论文作者Brandon T. Willard（布兰登）和R´emi Louf（雷米）还是坚称谷歌抄袭，并认为：

谷歌对两者差异性的表述“简直荒谬”。

而不少网友看过论文后也缓缓打出一个问号：CoLM是怎么审的稿？

唯一区别是换了概念？

赶紧瞅一眼论文对比……

两篇论文的比较

先浅看一眼两篇论文的摘要对比。

谷歌DeepMind的论文说的是，tokenization给约束语言模型输出带来了麻烦，他们引入自动机理论来解决这些问题，核心是避免在每个解码步骤遍历所有逻辑值（logits）。

该方法只需要访问每个token的解码逻辑值，计算与语言模型的大小无关，高效且易用于几乎所有语言模型架构。

而“原告”的说法大致是：

提出了一个高效框架，通过在语言模型的词汇表上构建索引，来大幅提升约束文本生成的效率。简单来说，就是通过索引避免对全部逻辑值的遍历。

同样“不依赖于具体模型”。

方向上确实大差不差，我们还是接着来看看更多详细内容。

我们用谷歌Gemini 1.5 Pro分别总结了两篇论文的主要内容，并接着让Gemini来比较两者的异同。

对于“被告”谷歌这篇论文，Gemini总结其方法是将detokenization重新定义为有限状态转换器（FST）操作。

将此FST与表示目标形式语言的自动机组合，这种自动机可以用正则表达式或语法来表示。

通过以上结合，生成一个基于token的自动机，用于在解码过程中约束语言模型，确保其输出的文本符合预设的形式语言规范。

此外，谷歌论文中还进行了一系列正则表达式扩展，这些扩展通过使用特别命名的捕获组来编写，显著提升了系统处理文本时的效率和表达能力。

而对于“原告”论文，Gemini总结其方法的核心是将文本生成问题重新定义为有限状态机（FSM）之间的转换。

“原告”的具体方法是：

利用正则表达式或上下文无关文法构建FSM，并将其用于指导文本生成过程。

通过构建词汇表索引，高效地确定每个步骤中的有效词，避免遍历整个词汇表。

Gemini列出了两篇论文的共同点。

至于两者的区别，有点像前头那位网友说的，简单总结就是：谷歌将词汇表定义为了一个FST。

前面也说到了，谷歌在“Related work”中将原告论文列为“最相关”的一项工作：

最相关的研究是Outlines（Willard&Louf, 2023），该研究同样采用有限状态自动机（FSA）和下推自动机（PDA）作为约束手段——我们的方法是在2023年初独立开发的。

谷歌认为两者的差异在于，Outlines的方法基于一种特制的“索引”操作，需要手动扩展到新的应用场景。相比之下，谷歌使用自动机理论彻底重新定义了整个过程，使得应用FSA和泛化到PDA变得更加容易。

另一个区别是，谷歌定义了扩展以支持通配符匹配，并提高了可用性。

谷歌紧接着在介绍下面的两项相关工作中，也都提到了Outlines。

一项是Yin等人（2024年）通过增加“压缩”文本段到预填充的功能，扩展了Outlines。

另一项是Ugare等人（2024年）近期提出的一个系统，名为SynCode。它也利用FSA，但采用LALR和LR解析器而非PDA处理语法。

与Outlines类似，该方法依赖于定制算法。

但吃瓜群众们显然不是很买账：

CoLM的评审们应该注意。我不认为这看上去是各自独立的“同期工作”。

网友：这事儿不罕见…

这件事一发酵，不少网友都怒了，抄袭可耻，更何况“科技巨头剽窃小团队的工作成果不是第一次了”。

顺便一提，布兰登和雷米发布原告论文的时候都在给Normal Computing远程工作，这家AI Infra公司成立于2022年。

哦对了，Normal Computing的创始团队有一部分就来自Google Brain……

另外，布兰登和雷米现在合伙出来创业了，新公司名叫.txt，官网信息显示，其目标是提供快速可靠的信息提取模型。并且官网挂出的GitHub主页，就是Outlines仓库。

说回到网友这边，更让大家伙儿生气的是，“这种情况已经变得普遍”。

一位来自荷兰代尔夫特理工大学的博士后分享了自己的遭遇：

去年10月我们完成了一项工作，最近有篇已被接收的论文采用了相同的思路和概念，但甚至没有引用我们的论文。

还有一位美国东北大学的老哥更惨，这种情况他遭遇过两次，下手的还都是同一个组。并且对面那位第一作者还给他的GitHub加过星标……

不过，也有网友表达了不同的意见：

如果说发个博客文章或未经评估的预印本论文就算占坑了，那人人都会占坑，不是吗？

对此，雷米怒怼：

好家伙，发布预印本论文并开源代码 = 占坑；
写篇数学论文，甚至不需要任何伪代码 = 好工作？？？

布兰登老哥也表示yue了：

开源代码并撰写相关论文是“占坑”，复制别人的工作却说“我更早有了这个想法”且投稿了会议反而不是啦？真恶心。

瓜就先吃到这里，对此你有什么想法？不妨在评论区继续讨论~

两篇论文戳这里：
谷歌DeepMind论文：https://arxiv.org/abs/2407.08103v1
原告论文：https://arxiv.org/abs/2307.09702

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

谷歌

谷歌

+关注

关注
27

文章
6271

浏览量
112241
DeepMind

DeepMind

+关注

关注
0

文章
131

浏览量
12472
ChatGPT

ChatGPT

+关注

关注
31

文章
1609

浏览量
10455

评论

精选推荐
更多

文章

资料

帖子

如何使用.mem文件初始化ROM并从PS-APU读取内容

XILINX开发者社区
1天前

1640 阅读

从仰望到丈量，在全球人工智能技术大会看见AI的下沉

脑极体
1天前

757 阅读

从实验室到量产：3D高斯泼溅仿真还缺什么？

康谋keymotek
2天前

3465 阅读

8种PLC和激光测距仪串口通信实战案例

工控论坛
2天前

2287 阅读

如何正确启用恩智浦MCXN947芯片中RTC模块的亚秒计数器功能

恩智浦MCU加油站
2天前

2087 阅读

单片机视频教程下载

qjqb
681984

10积分

3.2w下载

液晶高压板电路图全集

独当一面
1111

10积分

2295下载

通信原理学习专业指导书

159520
3.61 MB

免费

409下载

列表视图教程案例分享

姚小熊27
0.48 MB

免费

5下载

my-mind思维导图工具

tr12345
0.46 MB

2积分

3下载

【米尔RZ/T2H开发板试用，驱控一体芯】+GPIO及其使用

jennyzhaojie
23小时前

67 阅读

【飞凌嵌入式RV1126B-S开发板体验报告】从点亮到AI部署的实战之旅

jf_70961879
4天前

1064 阅读

【米尔TI AM62L开发板试用+初识米尔TI AM62L开发板】

jf_67024233
9天前

2046 阅读

【飞凌嵌入式T153开发板试用】飞凌嵌入式T153开发板如何编译源码

jf_67024233
10天前

3373 阅读

【飞凌嵌入式T153开发板试用】初试开发环境搭建

jf_67024233
10天前

3463 阅读

推荐专栏
更多

企业产品

资料

方案
更多

电子发烧友

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

电子发烧友

关于我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

张迎辉：mikezhang@elecfans.com

关注我们的微信

下载发烧友APP

机器人发烧友

版权所有 © 长沙勒克斯教育咨询有限公司

湖南省长沙市开福区月湖街道匍园路20号聚恒科技园1栋2301-1房
电子发烧友 （电路图） 电信与信息服务业务经营许可证：湘B2-20260003 湘ICP备2023036445号-105-1