0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT推新型机器算法,可破译消失已久的古语言

如意 来源:开源中国 作者:白开水不加糖 2020-10-28 14:54 次阅读

麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人员最近开发出了一种新的计算机算法,可以帮助语言学家自动破译历史上消失已久失的古语言。

官方指出,该系统能够自动破译已消失的语言,且无需对这一语言与其他语言的关系有深入的了解。他们还表明,该系统自身就可以确定语言之间的关系,并可以用它来证实最近的一项表明 Iberian 语言实际上与 Basque 语言无关的学术研究。

CSAIL 方面称,最近的研究表明,大多数曾经存在过的语言已经不再被使用。其中有数十种已灭绝语言也已被认为是“未破译”的语言。这就意味着,大众对它们的语法(grammar)、词汇(vocabulary)或句法(syntax)都了解不足,也无法理解其文本的意思。

而研究这些“未破译”的语言,除了是出于学术上的好奇心。还在于,不理解语言我们就会错过与讲这些语言的人有关的一整套知识体系。然而不幸的是,大多数灭绝语言的相关记录都非常的少,导致科学家无法使用谷歌翻译之类的机器翻译工具或 AI 算法来对其进行解密。

因此,此次 CSAIL 团队推出这一新算法的最终目的就是,旨在只用几千个单词,就可以破译语言学家几十年来难以理解的失传语言。

本次研究由 MIT 教授 Regina Barzilay 牵头,依赖于基于历史语言学(historical linguistics)见解的几项原则。例如,语言通常仅以某些可预测的方式发展。具体表现为:一种给定的语言很少会直接添加或删除整个音节,但是很可能会发生某些近似发音的替换。像母语中带有“p”发音的单词就可能会在其后代演变中变为“b”,但是由于明显的发音差异,变为“k”的可能性则较小。

通过整合这些原则和其他语言学约束,Barzilay 和 MIT 博士生 Jiaming Luo 开发了一种解密算法,该算法可以处理可能的转换的巨大空间以及输入中引导信号的稀缺性。该算法学习将语言声音嵌入多维空间,在该多维空间中,相应矢量之间的距离反映了不同发音的差异。这种设计使他们能够捕获语言变化的相关模式,并将其表达为计算约束(computational constraints)。生成的模型可以将古代语言中的单词进行细分,并将其映射到相关语言中的对应单词。

该项目建立在 Barzilay 和 Luo 去年写的一篇论文的基础上, 这篇论文解密了已灭绝的 Ugaritic 和 Linear B 语言,后者以前需要数十年的时间才能被人类解码。但是,两个项目之间的主要区别在于,该团队此前就已经知道这些语言分别与希伯来语和希腊语的早期形式有关。

新算法可以推断语言之间的关系,这是语言解密中的最大挑战之一。该算法可以评估两种语言之间的相似度,当对已知语言进行测试时,它甚至可以准确地识别出该语言属于哪个语系(language families)。不仅如此,算法生成的模型可以将古语言中的单词进行细分,并将其一一映射到“相关”语言中的对应单词上去。

在未来的工作中,该团队希望扩展到将文本与已知语言的相关单词相关联的范围之外,这种方法被称为“基于同源的破译方法”。其表示,“例如,我们可以识别文本中涉及到的所有人或地点的信息,然后可以根据已知的历史证据对其进行进一步的调查。这些实体识别(entity recognition)方法如今已广泛用于各种文本处理应用程序中,并且具有很高的准确性。但是关键的研究问题在于,在没有任何古代语言训练数据的情况下,这项任务是否可行? ”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4455

    浏览量

    90750
  • MIT
    MIT
    +关注

    关注

    3

    文章

    253

    浏览量

    23248
  • 机器翻译
    +关注

    关注

    0

    文章

    138

    浏览量

    14793
收藏 人收藏

    评论

    相关推荐

    基于机器翻译增加的跨语言机器阅读理解算法

    近日,阿里云人工智能平台 PAI 与华南理工大学朱金辉教授团队、达摩院自然语言处理团队合作在自然语言处理顶级会议 EMNLP2023 上发表基于机器翻译增加的跨语言
    的头像 发表于 12-12 10:28 356次阅读
    基于<b class='flag-5'>机器</b>翻译增加的跨<b class='flag-5'>语言</b><b class='flag-5'>机器</b>阅读理解<b class='flag-5'>算法</b>

    178个C语言算法源码下载

    电子发烧友网站提供《178个C语言算法源码下载.zip》资料免费下载
    发表于 11-21 09:35 3次下载
    178个C<b class='flag-5'>语言</b><b class='flag-5'>算法</b>源码下载

    CMU、MIT、清华联合发布全球首个生成式机器人智能体RoboGen

    CMU、MIT、清华联合发布了全球首个生成式机器人智能体RoboGen,可以无限生成数据,让机器人7*24小时永不停歇地训练。为机器人进入通用场景迈出坚实一步。
    的头像 发表于 11-09 10:19 666次阅读

    单片机ADC,十大C语言滤波算法

    单片机ADC,十大C语言滤波算法
    的头像 发表于 10-24 15:53 648次阅读

    C语言经典算法大全

    C语言经典算法,详细解析算法过程及算法思想,给读者具有启发意义,教程包含C语言大部分常用算法,仅
    发表于 10-07 08:16

    经典C语言接口与实现:创建重用软件的技术

    C语言接口与实现(创建重用软件的技术)概念清晰、内容新颖、实例详尽,是一本有关设计、实现和有效使用C语言库函数,掌握创建重用C语言软件模
    发表于 09-25 06:42

    DSP算法大全C语言版本

    DSP算法大全C语言版本
    发表于 09-13 16:43 9次下载

    请问如何将C语言算法移植到FPGA上?

    确定算法:首先,你需要确保要移植的C语言算法是合适的。FPGA适合并行计算和高度可定制的应用。因此,你需要选择一个适合FPGA实现的算法
    发表于 09-12 17:20 1032次阅读

    机器学习有哪些算法机器学习分类算法有哪些?机器学习预判有哪些算法

    机器学习有哪些算法机器学习分类算法有哪些?机器学习预判有哪些算法
    的头像 发表于 08-17 16:30 1395次阅读

    机器学习算法入门 机器学习算法介绍 机器学习算法对比

    机器学习算法入门 机器学习算法介绍 机器学习算法对比 机器
    的头像 发表于 08-17 16:27 625次阅读

    机器学习算法总结 机器学习算法是什么 机器学习算法优缺点

    机器学习算法总结 机器学习算法是什么?机器学习算法优缺点?
    的头像 发表于 08-17 16:11 1071次阅读

    机器学习算法汇总 机器学习算法分类 机器学习算法模型

    机器学习算法汇总 机器学习算法分类 机器学习算法模型 机器
    的头像 发表于 08-17 16:11 724次阅读

    人工智能学习什么语言

    对于机器学习而言,编程语言是非常重要的,因为机器学习的实现需要大量的算法和模型。而编程语言的选择,除了开发效率上的因素外,还会影响到模型的速
    的头像 发表于 08-14 14:40 550次阅读

    MIT的射频讲义

    大家好,这里是射频学堂。 今天分享一份MIT的射频讲义:Receivers, Antennas,and Signals,来自于MIT David H. Staelin 教授。 MIT讲义
    的头像 发表于 06-29 09:49 365次阅读
    <b class='flag-5'>MIT</b>的射频讲义

    机器人控制算法简述

    随着机器人技术的不断进步,机器人控制算法也越来越复杂和精细。机器人控制算法的研究是机器人技术发展
    的头像 发表于 05-19 16:27 2684次阅读
    <b class='flag-5'>机器</b>人控制<b class='flag-5'>算法</b>简述