0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

高中代写成风 哥本哈根大学的神操作

Gv1N_smartman16 来源:YXQ 2019-06-10 09:13 次阅读

随着毕业季的邻近,翟天临又一次被网友们骂上了微博热搜。

翟的论文抄袭事件过后,许多高校都加强了论文评审标准,更有严格的院校连非毕业生的论文结课都要查重。

许多深夜改论文的学生于是结伴来到微博@翟天临:你睡了吗?你怎么睡得着?我还在改论文!你配睡觉吗!

翟天临自己可能也没有想到,竟然阴差阳错对中国高校教育做出了卓越的贡献。

然而,也有学渣表示,以后查重这么严,抄袭是不可能了,只能找人代写了。

早有媒体曝光过学术圈“论文代写”的产业链。据第一财经报道,相关淘宝搜索的本科文科论文每千字200元左右。

不过,这条“学术歪路”也要被AI堵死了。近日,哥本哈根大学的研究人员的最新研究称,刚刚开发出一款“反枪手代写”的AI系统。

这款系统意图通过智能写作分析技术,来检测论文作弊。可以根据你的写作习惯,确定论文究竟是你自己写的作业还是由他人代写。

根据对13万份书面作业的分析,科学家们可以以近90%的准确率检测出学生究竟是自己写的作业,还是由代笔撰写。

基本上可以达到“代写”作业一抓一个准的结果了。

高中代写成风,哥本哈根大学的神操作

这套针对学生论文作弊行为的研究,已经在哥本哈根大学计算机科学系(DIKU)进行了几年了,最初,这款研究是针对丹麦的高中生进行的。

在丹麦,高中目前主要使用的作业查重平台叫做Lectio,可以用来检查学生的作业中是否有段落是直接复制先前提交的作业的。

然而,随着各类线上服务平台的盛行,在丹麦高中生中,找人代写作业变得越发容易。

面对这种情况,学校一直缺乏有效的检测手段。

学习轨迹项目或“SRP”(丹麦语的“Studie Retnings Projekt”)是丹麦高中毕业生的必修跨学科课程,也是一项非常重要的书面作业。在这个项目中的作弊现象尤其引人注目。

由于SRP对于毕业十分重要,很多学生们在丹麦竞拍网站Den Bla Avis上发布他们的写作任务来找人代写。

和中国的老师和大多数查重系统一样,Lectio只能查重,没法判断一份作业是否是找人代写的。

哥本哈根大学的一些院系一直和很多高中有着SRP项目的合作,深受代写作弊行为之害,一直在探究解决之道。

这所大学的计算机科学系DABAI项目组决定教教这些偷懒的高中生们“做人”。

DABAI(丹麦大数据分析驱动创新中心)是一个成立于2016年的丹麦国家研究中心。除了研究机器学习的高效算法,这个研究小组本来就对学生教育特别关注。之前,他们曾研究了“优化学生的个性化学习”、“提高教师洞察力”等教育项目。

名叫“枪手”的反枪手神器

这个防作弊程序被叫做Ghostwriter(枪手),它本质上属于一种基于机器学习和神经网络技术的一款文本分析程序。

项目组成员Stephan Lorenzen博士称,这款程序可以比较该学生最近提交和以前提交的文章来识别写作风格的差异。

“程序会关注单词长度、句子结构以及单词的使用方式等诸多特征。例如,它会察觉‘for example’被写成了‘ex’,还是‘e.g.,’。”

其数据集来自为丹麦高中提供Lectio平台的MaCom公司,该公司覆盖了丹麦90%以上的高中,他们为GhostWriter项目的研究人员提供了13万份不同高中学生书面作业。

这个研究组认为,这款产品非常具有实际效用,很多学校对于找出“论文究竟是谁写的”这个问题有着越来越高的技术需求。

但Stephan Lorenzen博士也认为,“在此之前,还需要认真讨论一下应用这项技术所面临的伦理问题。我们不能把这个程序得到的结论作为判别是否作弊的唯一标准,更应该把它看作一份辅助性的证据。”

Ghostwriter是怎么工作的?

Ghostwriter程序使用Siamese 神经网络来区分不同文本的写作风格:通过大量数据的训练,学习不同写作风格的外在表现(representation),然后进行比对。

这个项目分两步来解决作者身份验证问题。首先是解决了计算两个文本之间写作风格相似性的问题,主要通过使用Siamese网络学习相似度函数s:T×T→[0,1]。其次是再解决作者A的验证问题,通过比对未知作者文本X和已知是作者A的文本T之间的相似性。

网络方面,他们考虑使用不同的输入通道考虑几种不同的体系结构(例如,char,word,POS-tags),最终确定了一种表现最佳的网络架构:

Best performing network

编码部分包括一个字符嵌入(Embd),然后是两个不用的卷积层,每个卷积层后面都有一个全局最大池化层(GMP)。

在比较部分,他们首先计算合并层中的编码之间的绝对差值,然后,应用4个密集层,每层有500个神经元,最后使用具有两个输出的softmax层来进行归一化。

他们将数据集分为三份,T-train用于训练,T-val用于训练提前停止和selecting Cs,T-test仅用于估测试模型。

经过训练,模型的准确率达到了87.5%。

最后实现的功能就是,当学生提交作业时,该网络会将其与以前的作业进行比较。对于每个作业,神经网络都会计算出一个百分数,用于表示新旧作业的相似性。然后,通过综合考虑新旧作业相似性、交作业时间等多种因素计算出一个加权平均值。这个最终值就可以用来表示新作业和学生写作风格之间的相似性。

这一研究已经被发表在一篇名为《识别高中代写“枪手”》的论文中。

除了论文,还能与警方合作筛查伪造文本

除了代写作业,Ghostwriter的技术也可以应用于社会的其他地方。

例如,该程序可辅助警方的文档审查员执行各类文件的真伪分析任务,比如一份商业合同是否是伪造的;或者一个离奇的自杀案中,死者留下了一封遗书,这封遗书是不是死者本人写的等等。

“与警方合作将是一件有趣的事情。警方现有的方法是聘用文件审查员来定性的比较文本之间的相似性和差异。而我们的方法则适用于大数据并自动找到其中潜藏的模式。我认为结合两者将有利于警察开展工作。”Lorenzen说,他强调这里也同样需要讨论其面临的伦理问题。

这项利用人工智能来检测作业中作弊行为的技术,具有广泛的应用前景。

目前,它还被用来分析Twitter文本,以确定文本内容是由真实用户撰写的,还是由水军或机器人编写的。也就是说,淘宝店铺雇佣水军好评,很有可能也能被识别出来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26443

    浏览量

    264040
  • Twitter
    +关注

    关注

    0

    文章

    175

    浏览量

    15669

原文标题:“翟天临”克星?新开发的反“枪手”AI,识别作业代写准确率接近90%

文章出处:【微信号:smartman163,微信公众号:网易智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    J-FLASH在烧写时会将没有数据的空白地址段写成0x00,是否可以修改J-FLASH配置文件将数据写成0xFF?

    J-FLASH在烧写时,会将没有数据的空白地址段写成0x00,是否可以修改J-FLASH配置文件将数据写成0xFF? 是否有大神知道怎么办?
    发表于 04-19 08:12

    CYUS3014 RAM烧写成功,为什么枚举不起来?

    CYUSB3014 RAM显示烧写成功后,缺不再枚举,技术支持让我更换芯片后,问题依旧,请问是否还有别的方式可以查找问题?
    发表于 02-29 07:13

    CYUSB3014-BZXI RAM烧写成功后PC无法识别设备的原因?怎么解决?

    我设计了一个CYUSB3014的实验板,连接电脑后controlcenter可以显示BootLoader,烧写代码到RAM中,显示烧写成功,但是并没有重枚举。也就是说电脑没有任何反应,包括识别USB
    发表于 02-29 06:02

    Hightec对芯片中断优先级分配时,中断号越高中断优先级越高吗?

    请问大佬,Hightec对芯片中断优先级分配时,中断号越高中断优先级越高吗?看网上的帖子说中断号越低优先级越高。
    发表于 02-27 06:13

    浅谈flash存储器的特点和优缺点

    Flash存储器的写操作具有特殊性,它只能将数据位从1写成0,而不能从0写成1。因此,在对存储器进行写入操作之前,必须先执行擦除操作,将预写
    的头像 发表于 02-19 11:37 894次阅读
    浅谈flash存储器的特点和优缺点

    进行OTA刷写成功后进行复位,控制器不在进行工作的原因?

    现象:在进行OTA刷写成功后进行复位,控制器不在进行工作。出现概率很小,不容易复现。 原因:通过测试发现是在进行AB分区映射后程序直接跑飞。 请教一下应该如何解决这个问题?
    发表于 02-01 07:36

    XMC7200-SPI在cyhal_hw_resources.h中代表什么?

    以下定义在 cyhal_hw_resources.h 中代表什么? CY_IP_MXSCB_INSTANCES CY_IP_MXS22SCB_INSTANCES 另外,有人有 SPI 初始化的示例配置吗
    发表于 01-18 08:34

    DAYU200 rk3568板子烧写OpenHarmony镜像resource.img误烧写成ramdisk.img,烧写成功后无法开机无法进入loader模式,求助!!!

    DAYU200 rk3568板子烧写OpenHarmony镜像resource.img误烧写成ramdisk.img,烧写成功后无法开机无法进入loader模式,求助!!! RT,有没有同仁遇到类似问题或者有解决方案的,求拯救。
    发表于 12-15 22:24

    一项新研究有望解决超灵敏量子传感器开发中的关键障碍

    哥本哈根大学尼尔斯-玻尔研究所(NBI)的一项新研究有望解决超灵敏量子传感器开发中的关键障碍。 实验设置示意图 量子传感器在监测胎儿心跳以及其它精密医疗检查方面展示了巨大的潜力。这类传感器利用了原子
    的头像 发表于 11-11 09:03 407次阅读
    一项新研究有望解决超灵敏量子传感器开发中的关键障碍

    谁知道FatFs中代码页存在的意义是什么?

    FatFs中代码页存在的意义是什么?
    发表于 10-16 07:58

    人工智能大学学什么专业

    计算机科学是人工智能大学中最关键的学科之一,因为它是实现人工智能技术的基础。计算机科学的核心是编程,因此,人工智能大学的学生必须深入了解编程语言,并掌握计算机体系结构和操作系统的设计原理。
    的头像 发表于 08-13 16:48 989次阅读

    2023 RT-Thread 操作系统大学生夏令营完美结营

    近日由 RT-Thread 和 南京集成电路培训中心、中科院软件所PLCT实验室、瑞萨电子、英飞凌科技、意法半导体、华南理工大学等合作伙伴 联合发起的 2023 RT-Thread 操作系统大学
    的头像 发表于 08-03 20:05 604次阅读
    2023 RT-Thread <b class='flag-5'>操作</b>系统<b class='flag-5'>大学</b>生夏令营完美结营

    量子技术突破测量极限有望应用于智能手机

    据麦姆斯咨询报道,丹麦哥本哈根大学(University of Copenhagen)的研究人员发明了一种“量子鼓(quantum drum)”,可以极其精确地测量压力、气体泄漏、热量、磁性等。该量子鼓甚至可以扫描出单个病毒的形状。
    的头像 发表于 07-18 09:06 614次阅读

    吉林师范大学选购我司HS-100C高低温试验箱

    吉林师范大学(JilinNormalUniversity),简称为“吉林师大”,位于吉林省四平市,是吉林省重点大学,也是教育部卓越教师培养计划实施院校,更是吉林省高中骨干教师培养中心、高校师资
    的头像 发表于 06-14 15:51 244次阅读
    吉林师范<b class='flag-5'>大学</b>选购我司HS-100C高低温试验箱

    安森德高中低压MOSFET在适配器、充电器上的应用

    安森德高中低压MOSFET在适配器、充电器上的应用
    的头像 发表于 05-26 16:54 563次阅读
    安森德<b class='flag-5'>高中</b>低压MOSFET在适配器、充电器上的应用