0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

Hf1h_BigDataDig 来源:fqj 2019-06-06 14:17 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,哥本哈根大学的研究人员的最新研究称,刚刚开发出一款“反枪手代写”的AI系统。这款系统意图通过智能写作分析技术,来检测论文作弊。可以根据你的写作习惯,确定论文究竟是你自己写的作业还是由他人代写。根据对13万份书面作业的分析,科学家们可以以近90%的准确率检测出学生究竟是自己写的作业,还是由代笔撰写。基本上可以达到“代写”作业一抓一个准的结果了。

高中代写成风,哥本哈根大学的神操作。这套针对学生论文作弊行为的研究,已经在哥本哈根大学计算机科学系(DIKU)进行了几年了,最初,这款研究是针对丹麦的高中生进行的。在丹麦,高中目前主要使用的作业查重平台叫做Lectio,可以用来检查学生的作业中是否有段落是直接复制先前提交的作业的。然而,随着各类线上服务平台的盛行,在丹麦高中生中,找人代写作业变得越发容易。面对这种情况,学校一直缺乏有效的检测手段。

学习轨迹项目或“SRP”(丹麦语的“Studie Retnings Projekt”)是丹麦高中毕业生的必修跨学科课程,也是一项非常重要的书面作业。在这个项目中的作弊现象尤其引人注目。由于SRP对于毕业十分重要,很多学生们在丹麦竞拍网站Den Bla Avis上发布他们的写作任务来找人代写。和中国的老师和大多数查重系统一样,Lectio只能查重,没法判断一份作业是否是找人代写的。哥本哈根大学的一些院系一直和很多高中有着SRP项目的合作,深受代写作弊行为之害,一直在探究解决之道。这所大学的计算机科学系DABAI项目组决定教教这些偷懒的高中生们“做人”。

DABAI(丹麦大数据分析驱动创新中心)是一个成立于2016年的丹麦国家研究中心。除了研究机器学习的高效算法,这个研究小组本来就对学生教育特别关注。之前,他们曾研究了“优化学生的个性化学习”、“提高教师洞察力”等教育项目。

名叫“枪手”的反枪手神器

这个防作弊程序被叫做Ghostwriter(枪手),它本质上属于一种基于机器学习和神经网络技术的一款文本分析程序。

项目组成员Stephan Lorenzen博士称,这款程序可以比较该学生最近提交和以前提交的文章来识别写作风格的差异。

“程序会关注单词长度、句子结构以及单词的使用方式等诸多特征。例如,它会察觉‘for example’被写成了‘ex’,还是‘e.g.,’。”

其数据集来自为丹麦高中提供Lectio平台的MaCom公司,该公司覆盖了丹麦90%以上的高中,他们为GhostWriter项目的研究人员提供了13万份不同高中学生书面作业。

这个研究组认为,这款产品非常具有实际效用,很多学校对于找出“论文究竟是谁写的”这个问题有着越来越高的技术需求。

但Stephan Lorenzen博士也认为,“在此之前,还需要认真讨论一下应用这项技术所面临的伦理问题。我们不能把这个程序得到的结论作为判别是否作弊的唯一标准,更应该把它看作一份辅助性的证据。”

Ghostwriter是怎么工作的?

Ghostwriter程序使用Siamese 神经网络来区分不同文本的写作风格:通过大量数据的训练,学习不同写作风格的外在表现(representation),然后进行比对。

这个项目分两步来解决作者身份验证问题。首先是解决了计算两个文本之间写作风格相似性的问题,主要通过使用Siamese网络学习相似度函数s:T×T→[0,1]。其次是再解决作者A的验证问题,通过比对未知作者文本X和已知是作者A的文本T之间的相似性。

在网络方面,他们考虑使用不同的输入通道考虑几种不同的体系结构(例如,char,word,POS-tags),最终确定了一种表现最佳的网络架构:

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

Best performing network

编码部分包括一个字符嵌入(Embd),然后是两个不用的卷积层,每个卷积层后面都有一个全局最大池化层(GMP)。

在比较部分,他们首先计算合并层中的编码之间的绝对差值,然后,应用4个密集层,每层有500个神经元,最后使用具有两个输出的softmax层来进行归一化。

他们将数据集分为三份,T-train用于训练,T-val用于训练提前停止和selecting Cs,T-test仅用于估测试模型。

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

经过训练,模型的准确率达到了87.5%。

哥本哈根大学开发反“枪手”AI 识别作业代写准确率接近90%

最后实现的功能就是,当学生提交作业时,该网络会将其与以前的作业进行比较。对于每个作业,神经网络都会计算出一个百分数,用于表示新旧作业的相似性。然后,通过综合考虑新旧作业相似性、交作业时间等多种因素计算出一个加权平均值。这个最终值就可以用来表示新作业和学生写作风格之间的相似性。

这一研究已经被发表在一篇名为《识别高中代写“枪手”》的论文中。

除了代写作业,Ghostwriter的技术也可以应用于社会的其他地方。

例如,该程序可辅助警方的文档审查员执行各类文件的真伪分析任务,比如一份商业合同是否是伪造的;或者一个离奇的自杀案中,死者留下了一封遗书,这封遗书是不是死者本人写的等等。

“与警方合作将是一件有趣的事情。警方现有的方法是聘用文件审查员来定性的比较文本之间的相似性和差异。而我们的方法则适用于大数据并自动找到其中潜藏的模式。我认为结合两者将有利于警察开展工作。”Lorenzen说,他强调这里也同样需要讨论其面临的伦理问题。

这项利用人工智能来检测作业中作弊行为的技术,具有广泛的应用前景。

目前,它还被用来分析Twitter文本,以确定文本内容是由真实用户撰写的,还是由水军或机器人编写的。也就是说,淘宝店铺雇佣水军好评,很有可能也能被识别出来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49772

    浏览量

    261720
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136245

原文标题:“翟天临”克星?哥本哈根大学开发反“枪手”AI,识别作业代写准确率接近90%

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    看到,拍照比较模糊,然而仍然比较精准地被识别出来。 我们在上个强度,识别手写文本 原图: 识别结果: 只有很少量的识别错误(写的比较潦草),整体
    发表于 11-01 22:12

    除了准确率,电能质量在线监测装置在谐波源识别方面还有哪些重要指标?

    除了识别准确率,电能质量在线监测装置在谐波源识别方面的核心价值还依赖于 识别效率、定位精度、抗干扰能力、场景适配性 等关键指标,这些指标直接决定装置能否在复杂现场环境中 “快速找对、精
    的头像 发表于 10-22 16:22 795次阅读

    电能质量在线监测装置识别谐波源的准确率有多高?

    电能质量在线监测装置识别谐波源的准确率受电网结构、监测方案、设备性能等多重因素影响,呈现显著的 场景化差异 。根据行业研究与工程实践,其准确率通常在 **65%~95%** 之间波动,具体可分为以下
    的头像 发表于 10-22 16:18 692次阅读

    【Sipeed MaixCAM Pro开发板试用体验】+ 02 + 基础功能测试

    、基础功能测试 1.人脸表情情绪检测 通过开发板自带的应用程序实测发现识别准确率非常的高(但需在离人脸较近的地方进行识别,如果识别
    发表于 07-19 22:50

    无人机AI识别巡检系统解决方案

    :人工巡检依赖经验判断,缺陷识别准确率不足60%;高空、高危区域作业风险高,年均因巡检引发的安全事故超千起;海量数据依赖纸质记录,分析滞后导致隐患处置不及时。        在此背景下,无人机
    的头像 发表于 07-18 14:02 615次阅读

    【嘉楠堪智K230开发板试用体验】K230 AI 功能体验

    YOLOv8n模型时,帧率只有11帧左右。可能是这个模型识别的目标比较多,推理时间也变长了。 总结 K230开发板的AI例程丰富,能够使用例程快速完成自己的开发需求,同时性能不错,在
    发表于 07-15 15:24

    【「零基础开发AI Agent」阅读体验】+Agent的案例解读

    ,智能助手能够迅速匹配相关的古籍段落,提高检索效率。​ 2)语义理解增强 支持用户多样化表述,减少手动筛选时间,提升了检索准确率。 提升学术研究效率​ 1)学术研究辅助增强 AI 提供的自动检索与解析
    发表于 05-14 11:23

    海思SD3403边缘计算AI数据训练概述

    模型,将模型转化为嵌入式AI模型,模型升级AI摄像机,进行AI识别应用。 AI训练模型是不断迭代优化过程,譬如,100个数据样本模型的
    发表于 04-28 11:11

    关联具体场景(如AI、智慧城市),强调部署效率

    道路隐患(如视距不良、路面破损),效率提升至传统人工的2倍。 实时事故感知‌:AI系统可在1分钟内准确识别交通事故并推送告警,避免拥堵蔓延,已应用于30余个城市,准确率
    的头像 发表于 04-23 07:42 444次阅读
    关联具体场景(如<b class='flag-5'>AI</b>、智慧城市),强调部署效率

    RK3588核心板在边缘AI计算中的颠覆性优势与场景落地

    。 RK3588方案:单板集成8路1080P视频结构化分析,通过NPU运行LPR算法,功耗<10W,识别准确率从92%提升至98%。 成本优化:硬件成本降低40%,无需散热风扇,寿命延长3倍。 工业
    发表于 04-15 10:48

    浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用准确率

    结合,深度开发模型潜力,快速实现本地化部署DeepSeek,构建准确率高、安全稳定的专属智能应用。实测数据显示,DeepSeek在元脑企智EPAI上开发的企业应用回答准确率达到95%。
    的头像 发表于 02-23 07:32 892次阅读
    浪潮信息:元脑EPAI已接入DeepSeek,大幅提升DeepSeek企业应用<b class='flag-5'>准确率</b>

    AI赋能边缘网关:开启智能时代的新蓝海

    准确率达到99.9%。 这一技术革新正在创造巨大的商业价值。在智慧城市领域,AI边缘网关可以实现交通流量实时分析、违章行为智能识别;在工业互联网中,能够实现设备预测性维护、生产工艺优化;在智慧能源领域
    发表于 02-15 11:41

    Meta非入侵式脑机技术:AI读取大脑信号打字准确率80%

    脑机技术主要通过AI模型与特定硬件的结合,将用户的大脑信号映射成具体的键盘字符。该技术的准确率高达约80%,能够准确判断用户在“敲击”的按键,从而实现文字输入。 值得注意的是,这项设备完全依靠外部脑机读取用户的大脑信号,无需进行
    的头像 发表于 02-11 15:45 1042次阅读

    请问AFE4400 SPO2精度和准确率如何?

    请问用TI 的AFE4400 EVM 测量SPO2 的值,有没有详细的说明其测量的准确率和精度,抗弱灌注等。谢谢! 比如如下类似: SpO2 测量范围 0~100% 分辨 1% 精度 70~100%, 2%
    发表于 01-15 07:02