0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

MIT推新型机器算法,可破译消失已久的古语言

如意 来源:开源中国 作者:白开水不加糖 2020-10-28 14:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory,CSAIL)的研究人员最近开发出了一种新的计算机算法,可以帮助语言学家自动破译历史上消失已久失的古语言。

官方指出,该系统能够自动破译已消失的语言,且无需对这一语言与其他语言的关系有深入的了解。他们还表明,该系统自身就可以确定语言之间的关系,并可以用它来证实最近的一项表明 Iberian 语言实际上与 Basque 语言无关的学术研究。

CSAIL 方面称,最近的研究表明,大多数曾经存在过的语言已经不再被使用。其中有数十种已灭绝语言也已被认为是“未破译”的语言。这就意味着,大众对它们的语法(grammar)、词汇(vocabulary)或句法(syntax)都了解不足,也无法理解其文本的意思。

而研究这些“未破译”的语言,除了是出于学术上的好奇心。还在于,不理解语言我们就会错过与讲这些语言的人有关的一整套知识体系。然而不幸的是,大多数灭绝语言的相关记录都非常的少,导致科学家无法使用谷歌翻译之类的机器翻译工具或 AI 算法来对其进行解密。

因此,此次 CSAIL 团队推出这一新算法的最终目的就是,旨在只用几千个单词,就可以破译语言学家几十年来难以理解的失传语言。

本次研究由 MIT 教授 Regina Barzilay 牵头,依赖于基于历史语言学(historical linguistics)见解的几项原则。例如,语言通常仅以某些可预测的方式发展。具体表现为:一种给定的语言很少会直接添加或删除整个音节,但是很可能会发生某些近似发音的替换。像母语中带有“p”发音的单词就可能会在其后代演变中变为“b”,但是由于明显的发音差异,变为“k”的可能性则较小。

通过整合这些原则和其他语言学约束,Barzilay 和 MIT 博士生 Jiaming Luo 开发了一种解密算法,该算法可以处理可能的转换的巨大空间以及输入中引导信号的稀缺性。该算法学习将语言声音嵌入多维空间,在该多维空间中,相应矢量之间的距离反映了不同发音的差异。这种设计使他们能够捕获语言变化的相关模式,并将其表达为计算约束(computational constraints)。生成的模型可以将古代语言中的单词进行细分,并将其映射到相关语言中的对应单词。

该项目建立在 Barzilay 和 Luo 去年写的一篇论文的基础上, 这篇论文解密了已灭绝的 Ugaritic 和 Linear B 语言,后者以前需要数十年的时间才能被人类解码。但是,两个项目之间的主要区别在于,该团队此前就已经知道这些语言分别与希伯来语和希腊语的早期形式有关。

新算法可以推断语言之间的关系,这是语言解密中的最大挑战之一。该算法可以评估两种语言之间的相似度,当对已知语言进行测试时,它甚至可以准确地识别出该语言属于哪个语系(language families)。不仅如此,算法生成的模型可以将古语言中的单词进行细分,并将其一一映射到“相关”语言中的对应单词上去。

在未来的工作中,该团队希望扩展到将文本与已知语言的相关单词相关联的范围之外,这种方法被称为“基于同源的破译方法”。其表示,“例如,我们可以识别文本中涉及到的所有人或地点的信息,然后可以根据已知的历史证据对其进行进一步的调查。这些实体识别(entity recognition)方法如今已广泛用于各种文本处理应用程序中,并且具有很高的准确性。但是关键的研究问题在于,在没有任何古代语言训练数据的情况下,这项任务是否可行? ”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 算法
    +关注

    关注

    23

    文章

    4762

    浏览量

    97247
  • MIT
    MIT
    +关注

    关注

    3

    文章

    254

    浏览量

    24926
  • 机器翻译
    +关注

    关注

    0

    文章

    141

    浏览量

    15469
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    C语言的常见算法

    # C语言常见算法 C语言中常用的算法可以分为以下几大类: ## 1. 排序算法 ### 冒泡排序 (Bubble Sort) ```
    发表于 11-24 08:29

    C语言和单片机C语言有什么差异

    汇编语言机器才能读懂,所以每个平台的编译器编译成对应平台汇编的程序,每个平台的汇编不一样,当然编译器也不一样。 DOS上的TC2 TC3 WINDOWS上的VC 8051的C51都有自已的编译器。具体
    发表于 11-14 07:55

    复杂的软件算法硬件IP核的实现

    具体方法与步骤 通过 C 语言实现软件算法,并验证了算法的有效性以后,就可以进行算法的 HDL 转化工作了。通过使用 Altium Designer 的 CHC 编译器(C to H
    发表于 10-30 07:02

    巡检机器人落地攻略:RK3576驱动12路低延迟视觉

    场景化 · 可执行 · 指标清晰 · 调优复用01|从“人巡”到“机巡”:电力站一周上线纪实周一,项目组进场。需求很直接:变电站夜间值守薄弱、盲区多、报警后回看取证慢;希望一台巡检机器人替代夜巡
    发表于 10-24 16:53

    AES和SM4算法重构分析

    一、AES和SM4算法特点分析 基于前面几篇分享,我们对AES和SM4的算法流程有了较为清晰的认识,接下来对AES和SM4算法的共同点进行分析,得出二者的重构设计思路。 首先,这里
    发表于 10-23 07:26

    现在rtsp流还是只能向局域网流吗?

    现在rtsp流还是只能向局域网流吗
    发表于 08-08 06:07

    智能复合机器人:纠偏算法如何重塑工业精度与效率?

    在智能制造领域,复合机器人正成为柔性生产与高精度作业的核心载体。面对“复合机器人有纠偏算法吗?”这一行业高频问题,富唯智能以多模态纠偏技术体系给出了答案——通过自研的AI驱动纠偏算法
    的头像 发表于 05-29 17:01 703次阅读
    智能复合<b class='flag-5'>机器</b>人:纠偏<b class='flag-5'>算法</b>如何重塑工业精度与效率?

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    的本质是解决“鸡与蛋”问题:机器人需要地图来定位,又需要准确定位来构建地图。书中从前端(传感器数据处理)和后端(位姿优化)两个层面解析了SLAM的算法逻辑。 激光雷达和视觉SLAM各有优劣,例如激光
    发表于 05-03 19:41

    复合机器人为什么要使用单点纠偏算法

    复合机器人单点纠偏算法
    的头像 发表于 04-20 14:59 515次阅读
    复合<b class='flag-5'>机器</b>人为什么要使用单点纠偏<b class='flag-5'>算法</b>?

    机场智能指路机器人支持那些语言

    指路机器人作为提升旅客出行体验的关键一环,其支持的语言种类成为衡量服务质量的重要指标。那么,这些叁仟智能指路机器人究竟能够跨越多少语言的界限,为旅客提供精准、便捷的服务呢?接下来,我们
    的头像 发表于 04-07 10:49 518次阅读

    请问STM32部署机器学习算法硬件至少要使用哪个系列的芯片?

    STM32部署机器学习算法硬件至少要使用哪个系列的芯片?
    发表于 03-13 07:34

    限时免积分下载:增量式与位置式PID算法的C语言实现分享

    前面咱们有分享对PID算法离散化和增量式PID算法原理进行来探索,之后又使用Matlab进行了仿真实验,对PID三个参数又有了更深入的认识,接下来我们来使用C语言进行PID算法实现,并
    发表于 03-05 18:32

    用于黑暗中视觉自我运动估计的新型主动照明框架

    本文提出一种新型主动照明框架,通过动态控制移动光源主动照亮高纹理区域,显著提升VO与VSLAM算法在极端光照条件下的性能。在真实机器人平台上进行的实验表明,相比传统固定照明方法,本文
    的头像 发表于 02-28 14:29 683次阅读
    用于黑暗中视觉自我运动估计的<b class='flag-5'>新型</b>主动照明框架

    PID控制算法的C语言实现:PID算法原理

    在工业应用中 PID 及其衍生算法是应用最广泛的算法之一,是当之无愧的万能算法,如果能够熟练掌握 PID 算法的设计与实现过程,对于一般的研发人员来讲,应该是足够应对一般研发问题了,而
    发表于 02-26 15:24

    E Ink元太科技与MIT Solve合作推动创新技术奖

    Ink元太科技将设立“E Ink创新奖”,在未来三年内提供总计高达30万美元(每年最高10万美元)的奖励基金。这一举措旨在支持和鼓励那些致力于解决全球关键问题的创新团队,推动他们在技术研发和应用上取得更大突破。 E Ink元太科技表示,此次与MIT Solve的合作,是其在
    的头像 发表于 02-13 10:19 687次阅读