0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

Hf1h_BigDataDig 来源:fqj 2019-06-06 14:17 次阅读

近日,哥本哈根大学的研究人员的最新研究称,刚刚开发出一款“反枪手代写”的AI系统。这款系统意图通过智能写作分析技术,来检测论文作弊。可以根据你的写作习惯,确定论文究竟是你自己写的作业还是由他人代写。根据对13万份书面作业的分析,科学家们可以以近90%的准确率检测出学生究竟是自己写的作业,还是由代笔撰写。基本上可以达到“代写”作业一抓一个准的结果了。

高中代写成风,哥本哈根大学的神操作。这套针对学生论文作弊行为的研究,已经在哥本哈根大学计算机科学系(DIKU)进行了几年了,最初,这款研究是针对丹麦的高中生进行的。在丹麦,高中目前主要使用的作业查重平台叫做Lectio,可以用来检查学生的作业中是否有段落是直接复制先前提交的作业的。然而,随着各类线上服务平台的盛行,在丹麦高中生中,找人代写作业变得越发容易。面对这种情况,学校一直缺乏有效的检测手段。

学习轨迹项目或“SRP”(丹麦语的“Studie Retnings Projekt”)是丹麦高中毕业生的必修跨学科课程,也是一项非常重要的书面作业。在这个项目中的作弊现象尤其引人注目。由于SRP对于毕业十分重要,很多学生们在丹麦竞拍网站Den Bla Avis上发布他们的写作任务来找人代写。和中国的老师和大多数查重系统一样,Lectio只能查重,没法判断一份作业是否是找人代写的。哥本哈根大学的一些院系一直和很多高中有着SRP项目的合作,深受代写作弊行为之害,一直在探究解决之道。这所大学的计算机科学系DABAI项目组决定教教这些偷懒的高中生们“做人”。

DABAI(丹麦大数据分析驱动创新中心)是一个成立于2016年的丹麦国家研究中心。除了研究机器学习的高效算法,这个研究小组本来就对学生教育特别关注。之前,他们曾研究了“优化学生的个性化学习”、“提高教师洞察力”等教育项目。

名叫“枪手”的反枪手神器

这个防作弊程序被叫做Ghostwriter(枪手),它本质上属于一种基于机器学习和神经网络技术的一款文本分析程序。

项目组成员Stephan Lorenzen博士称,这款程序可以比较该学生最近提交和以前提交的文章来识别写作风格的差异。

“程序会关注单词长度、句子结构以及单词的使用方式等诸多特征。例如,它会察觉‘for example’被写成了‘ex’,还是‘e.g.,’。”

其数据集来自为丹麦高中提供Lectio平台的MaCom公司,该公司覆盖了丹麦90%以上的高中,他们为GhostWriter项目的研究人员提供了13万份不同高中学生书面作业。

这个研究组认为,这款产品非常具有实际效用,很多学校对于找出“论文究竟是谁写的”这个问题有着越来越高的技术需求。

但Stephan Lorenzen博士也认为,“在此之前,还需要认真讨论一下应用这项技术所面临的伦理问题。我们不能把这个程序得到的结论作为判别是否作弊的唯一标准,更应该把它看作一份辅助性的证据。”

Ghostwriter是怎么工作的?

Ghostwriter程序使用Siamese 神经网络来区分不同文本的写作风格:通过大量数据的训练,学习不同写作风格的外在表现(representation),然后进行比对。

这个项目分两步来解决作者身份验证问题。首先是解决了计算两个文本之间写作风格相似性的问题,主要通过使用Siamese网络学习相似度函数s:T×T→[0,1]。其次是再解决作者A的验证问题,通过比对未知作者文本X和已知是作者A的文本T之间的相似性。

网络方面,他们考虑使用不同的输入通道考虑几种不同的体系结构(例如,char,word,POS-tags),最终确定了一种表现最佳的网络架构:

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

Best performing network

编码部分包括一个字符嵌入(Embd),然后是两个不用的卷积层,每个卷积层后面都有一个全局最大池化层(GMP)。

在比较部分,他们首先计算合并层中的编码之间的绝对差值,然后,应用4个密集层,每层有500个神经元,最后使用具有两个输出的softmax层来进行归一化。

他们将数据集分为三份,T-train用于训练,T-val用于训练提前停止和selecting Cs,T-test仅用于估测试模型。

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

经过训练,模型的准确率达到了87.5%。

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

最后实现的功能就是,当学生提交作业时,该网络会将其与以前的作业进行比较。对于每个作业,神经网络都会计算出一个百分数,用于表示新旧作业的相似性。然后,通过综合考虑新旧作业相似性、交作业时间等多种因素计算出一个加权平均值。这个最终值就可以用来表示新作业和学生写作风格之间的相似性。

这一研究已经被发表在一篇名为《识别高中代写“枪手”》的论文中。

除了代写作业,Ghostwriter的技术也可以应用于社会的其他地方。

例如,该程序可辅助警方的文档审查员执行各类文件的真伪分析任务,比如一份商业合同是否是伪造的;或者一个离奇的自杀案中,死者留下了一封遗书,这封遗书是不是死者本人写的等等。

“与警方合作将是一件有趣的事情。警方现有的方法是聘用文件审查员来定性的比较文本之间的相似性和差异。而我们的方法则适用于大数据并自动找到其中潜藏的模式。我认为结合两者将有利于警察开展工作。”Lorenzen说,他强调这里也同样需要讨论其面临的伦理问题。

这项利用人工智能来检测作业中作弊行为的技术,具有广泛的应用前景。

目前,它还被用来分析Twitter文本,以确定文本内容是由真实用户撰写的,还是由水军或机器人编写的。也就是说,淘宝店铺雇佣水军好评,很有可能也能被识别出来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43870

    浏览量

    230620
  • 机器学习
    +关注

    关注

    66

    文章

    8126

    浏览量

    130569

原文标题:“翟天临”克星?哥本哈根大学开发反“枪手”AI,识别作业代写准确率接近90%

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的
    发表于 04-11 16:14

    在全志V853平台上成功部署深度学习步态识别算法

    统的步态识别准确率达到了94.9%,背包行走和穿外套行走条件下识别准确率分别达到了87.9%与71.0%。 步态识别作为一种新兴的生物
    发表于 03-04 10:15

    亚马逊云科技助力沐瞳应用生成式AI技术打造卓越游戏体验 赋能业务决策

    体验并赋能业务决策。沐瞳旗下游戏产品《Mobile Legends: Bang Bang》(以下简称《MLBB》)基于亚马逊云科技和其合作伙伴在生成式AI领域的创新技术与解决方案,显著提升辱骂识别与舆情分析的响应速度与准确率,辱
    发表于 02-22 11:20 123次阅读
    亚马逊云科技助力沐瞳应用生成式<b class='flag-5'>AI</b>技术打造卓越游戏体验 赋能业务决策

    亚马逊云科技助力沐瞳应用生成式AI技术打造卓越游戏体验 赋能业务决策

    决策。沐瞳旗下游戏产品《Mobile Legends: Bang Bang》(以下简称《MLBB》)基于亚马逊云科技和其合作伙伴在生成式AI领域的创新技术与解决方案,显著提升辱骂识别与舆情分析的响应速度与准确率,辱骂
    的头像 发表于 02-22 09:25 252次阅读

    【爱芯派 Pro 开发板试用体验】实际场景应用

    本帖最后由 邓云秀 于 2023-11-29 10:59 编辑 主板在这里 经过标准 对比视频 处理后猪只背部加红点方式标注 点数、估重、体尺测量、评级准确率高,多维度数据信息全面精准
    发表于 11-27 08:57

    智慧矿山:AI算法为何能提高未戴安全带识别准确率

    未穿戴安全带识别AI算法是智慧矿山的重要应用之一,可以提高矿山工作人员的安全意识和降低事故发生的概率。为了提高识别准确率,研究人员可以优化数据集、改进网络结构、混合模型融合、应用强化学
    的头像 发表于 10-22 22:01 244次阅读

    【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别

    -lopencv_highgui done 执行sh build.sh生成可执行文件。待测试的图片如下: 执行OCR识别后的结果如下: 总体情况识别速度很快,内容识别无误,不知道啥情况中间的“OF”不见了。 可以看出,Vi
    发表于 10-16 23:25

    【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测(OCR&amp;Textmountain)

    某些字符的图像。输出为包含所识别的字词及其位置的结构。下 图显示了 OCR 的结果。 换一个带中文的图片试一下,结果只能识别英文,准确率很高。 4.2、文本检测 Textmountain
    发表于 09-26 16:31

    【KV260视觉入门套件试用体验】六、VITis AI车牌检测&amp;车牌识别

    。下图显示了车牌检测的结果。 将图片中的车牌进行了框选,同事标准位置。 4.2、车牌识别 cd ~/Vitis-AI/examples/vai_library/samples/platenum
    发表于 09-26 16:28

    AI智能呼叫中心

    智能呼叫中心通过深度学习和大数据分析,能够准确识别、分析和记录用户的个人信息、历史记录和偏好,从而为用户提供更加个性化的服务。例如,在用户拨打电话进入呼叫中心时,AI智能呼叫中心可自动弹出用户的个人资料
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    ,ClientInfo,AlgorithmInfo,DataInfo的数据结构 具体开发过程可参考唤醒词识别SDK开发示例 2、开发插件 AI
    发表于 09-19 18:54

    AI听键盘声就能偷你密码,准确率高达95%

    来源:量子位 你没听错,现在键盘敲字也不安全了,简直防不胜防。 编辑:感知芯视界 无了个大语!以后AI靠听键盘声就能偷你密码,准确率高达95%! 最近,来自杜伦大学等三所高校的研究人员训练了个
    的头像 发表于 08-21 09:21 526次阅读

    启英泰伦新成果发布交流会线上直播预约开启

    身份验证和识别识别准确率达到了93%以上。 声纹识别技术在智能家居中有着广泛的应用。比如通过声纹识别技术,系统可以辨别家庭成员的声音,并根
    发表于 08-15 14:31

    如何开发智能家居语音控制方案

    的核心功能就是通过AI语音控制取代传统的遥控器控制,但是常用语音芯片存在语音识别准确率低,识别速度慢,AI训练成本大,系统设计复杂,使用体验
    发表于 05-31 09:50

    国产工业级RK3568核心板-AI人脸识别产品方案

    实际情况进行定制化开发, 例如: 深度学习算法优化:通过对RK3568处理器内置的NPU(神经网络处理器)进行深度学习算法的优化,可以进一步提高人脸识别准确率和稳定性,满足更高的识别
    发表于 05-06 14:30