0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用AI打击论文图像造假,仍有4000多篇医学“问题论文”

DPVg_AI_era 来源:未知 作者:李倩 2018-11-12 10:19 次阅读

在生物医学领域的论文中,AI已经搜索出9%的高度重复图像,0.59%的论文被认为存在欺诈嫌疑。因图像造假撤回的医学论文,一年时间可能浪费接近10亿美元的研发成本。

“打击论文造假,维护科研正义”。这不是一句喊口号的话。

今年6月,斯坦福大学微生物学家分析了2009-2016年发表在分子与细胞生物学(MCB)上的960篇论文,发现其中59篇(6.1%)含有“不适当的”重复图像,约有2%值得再去进行图像证伪。

不过,斯坦福大学微生物学家的工作完全依靠手动,五位研究人员靠十只手从近1000篇论文里总结出了这一成果。

现在,AI的介入让论文中的可疑图像被发现的概率大大提升,一个显著的成果是,在生物医学领域的论文中,AI已经搜索出9%的图像是高度重复的,0.59%的论文被认为存在欺诈嫌疑。

用AI打击论文图像造假,仍有4000多篇医学“问题论文”

使用AI来打击论文图像造假的工作是由纽约雪城大学(Syracuse University)机器学习研究员开发算法,他们分析了PubMed Open Access子集(PMOS)中截止到2015年发布的所有数据,包含了760036篇文章、超过200万的数据。

研究人员构建了一个pipeline,以自动检测不适合图像重用候选对象,在初步检测之后,删除了可能只是文本的图像或表示为图像的方程式,留下了大约200万张图片。

接着,研究人员发现每张图像平均有大约1K高熵关键点,这产生了大的相似度检测问题,研究人员使用近似最近邻算法来解决这个问题。之后,机器学习算法来估计是否显示生物图像。

检测复制-移动重用。A.癌变细胞和缩小部分的原始例子。B.关键点(高熵区域)的计算C.最近邻匹配。D.集群关键点、跨集群匹配和仿射变换。

最后,使用人工来评估不当重用。

算法检测图像区域重用,同时对旋转、裁剪、调整大小和对比度变化具有鲁棒性。总的来说,这项研究得出一个结论:在PubMed Open Access上,大约有0.59%的文章会被一致认为是具有欺骗性的。也就是说,在760036篇文章里面,大约有4484篇文章涉嫌造假。

论文图像篡改可能导致一年损失10亿美元

学术研究论文中的图像造假的祸害十分普遍。

两个星期前,Science联合撤稿观察发布了一个“撤稿”报告,许多数字令人震惊:过去10年里学术期刊撤回的论文数量增加了10倍,撤稿率最高的国家中国排第7,撤稿最多的10位作者中,中国占了两人。

Top 10撤稿作者(数据来自Science)

在撤稿观察的数据库中,有18000份研究论文被撤回(最早可追溯到20世纪70年代),其中,317篇被撤回论文进行了图像篡改,约占整体论文的1.7%。

宾夕法尼亚大学生物工程副教授Arjun Raj早在2012年就指出,平均一篇生物医学研究论文背后的科学成本约为30万美元至50万美元。而柳叶刀报道称,美国研究人员在当年发表了近152000篇论文。

这样推算,即使每篇论文成本30万美元,美国研究人员在2012年发表的所有生物医学科学论文的成本也将接近500亿美元。

如果2%的论文因为图像伪造需要撤回,美国可能会在2012年浪费接近10亿美元。随着全球科学产量每九年翻一番,照此计算,自2012年以来,因撤稿产生的负利润率可能会更大。

图像篡改向来如此糟糕吗?

有些研究人员认为,这么多年来,论文图像篡改问题一直在恶化。

来自美国研究诚信办公室(the United States Office of Research Integrity,ORI)的数据表明,在Photoshop发布后,他们所处理的涉及图像处理的案件比例有所增加。

技术在打击论文造假的过程中,一直是一场“猫鼠游戏”。AI除了检测图像区域重用,也成为对抗Photoshop的利器。

今年9月,Scientific Reports发表了一篇论文,文章指出,基于植物Rhus toxicondendron(毒性常春藤)的稀释度非常高的顺势疗法,至少与减轻疼痛的药物(加巴喷丁)一样有效。

不过,很快这篇介绍顺势疗法的论文,被生物学家Enrico Bucci使用的一款软件标记出来错误:在两种不同的实验中,所建议的药物浓度差别很大,而其图表却惊人地一致。

后来,论文作者回应称,他的的团队在准备手稿时犯了一些无意的错误,导致重复的图像和重复的数据。

作者表示,文本和数字之间的差异是错别字的结果。该小组将要求Scientific Reports更新该文章并进行更正。但也表示,“这不会以任何方式改变科学结论”。

AI距离自动打击论文造假还有多远?

然而,即使基于软件的方法已经被广泛讨论了近十年,使用此类应用程序的公司还是很少用软件发布他们的结果。

基于软件的方法仍然需要人为的监督支持。检测图像处理软件的开发有可能增加扫描图像期刊的数量。然而,需要注意的是,软件的使用并不能消除对人为干预的需求。软件的输出必须由人来评估。

一个领域是软件开发有可能对大型文章数据库的图像复制检测产生巨大影响,使用视觉检查技术不可能进行这种大规模的比较。

AI来检测论文图像造假在未来可能有两种形式。一是,公司可以为期刊编辑提供定制的应用程序,然后编辑可以使用这些应用程序对即将发表的论文进行分析,这可能类似于反抄袭软件的工作方式。

而另一种方法是,图像完整性分析公司将自己的人力和计算机资源分配给期刊进行图像完整性检查。

随着自动化的图像分析软件演变为一个企业,那些造假的研究人员可能会发现他们的计量很难再“瞒天过海”。然后,也许会出现另一个更为复杂的工具,使得造假的图像更难以被发现,这场“猫鼠游戏”更能还将继续。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4448

    浏览量

    90721
  • AI
    AI
    +关注

    关注

    87

    文章

    26363

    浏览量

    263957
  • 机器学习
    +关注

    关注

    66

    文章

    8095

    浏览量

    130519

原文标题:论文造假被AI抓:机器学习检测出4000多论文造假,一年损失高达10亿美元

文章出处:【微信号:AI_era,微信公众号:新智元】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    经典论文40

    经典论文40 不看会后悔! [hide]经典论文(40).rar[/hide]
    发表于 12-01 10:54

    [推荐]红梅论文网——专业代写代发各类职称论文、毕业论文QQ:149580361

    教育医学论文。 (2)        代写代发高会、高审
    发表于 01-11 16:14

    华南论文发表网——发表医学教育经济类职称论文

    ;quot;Verdana">华南论文发表网是一个专业代理发表教育论文医学论文、会计论文、科学技术、法律论文、哲学社会学、
    发表于 01-23 18:25

    labview论文

    labview论文
    发表于 03-12 16:33

    上百PLC论文集锦

    上百PLC论文集锦(本资料有20M) 个人觉得比较有用,所以就找了个链接来了!多多下载啦~~下载地址:https://www.elecfans.com/soft/study/plc/2011/20110720207035.h
    发表于 08-01 21:43

    100单片机论文资料

    本帖最后由 eehome 于 2013-1-5 09:48 编辑 100单片机论文资料
    发表于 08-16 17:43

    本人为了一论文东拼西凑来的各种资料

    本人为了一论文东拼西凑来的各种资料
    发表于 10-20 09:33

    FPGA图像处理论文大全

    本帖最后由 lorlin000 于 2015-3-15 22:53 编辑 FPGA图像处理论文大全
    发表于 03-15 22:46

    写毕业论文同学攻略,支持~paperpass有效修改论文使用手册

    5.4%,这时为了安全我就决定知网5.0系统检测,最后是8.4%,最后完成答辩~~其实整个过程走下来,如果不是抄的特别,或者对自己的论文没信心,没必要去太贵的检测系统检测
    发表于 05-02 21:05

    图像处理和机器视觉 的中文或者英文论文(二)

    从今天起,我将每天上传一个 关于 图像处理和机器视觉 的中文或者英文论文,有兴趣的童鞋可以下载查看[fly]图像处理和机器视觉 [/fly]第二Automation of Readi
    发表于 01-18 11:11

    图像处理和机器视觉 的中文或者英文论文(三)

    从今天起,我将每天上传一个 关于 图像处理和机器视觉 的中文或者英文论文,有兴趣的童鞋可以下载查看[fly]图像处理和机器视觉 [/fly]第三Kim K, Lee N K, Han
    发表于 01-22 16:48

    图像处理和机器视觉 的中文或者英文论文(四)

    本帖最后由 准电子大神 于 2016-1-23 10:35 编辑 从今天起,我将每天上传一个 关于 图像处理和机器视觉 的中文或者英文论文,有兴趣的童鞋可以下载查看[fly]图像处理和机器视觉
    发表于 01-23 10:32

    FPGA 视频图像 论文

    各种关于FPGA 视频 图像处理的论文....希望更多人加入到这个方向上来,
    发表于 08-17 09:13

    人工智能ai论文

    人工智能ai论文
    发表于 07-28 08:39

    计算机视觉论文速览

    AI视野·今日CS.CV 计算机视觉论文速览transformer、新模型、视觉语言模型、模态、clip、视角合成
    发表于 08-31 08:46