0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

无法被AI识别翻译的古老语言,将去何方?

如意 来源:OFweek电子工程网 作者:学术头条 2020-10-26 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

语言是文化的有机组成部分,也是文化的载体,世界文明的多样性在很大程度上表现为世界语言的多样性。而在 21 世纪的今天,语言学家们显然已经不满足于传统的、对已知语言的研究。相反,许多科学家开始利用计算机技术,去探索已经消失的、几乎成为谜底的灭绝古老语言。

近日,麻省理工学院计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory 简称 CSAIL)的研究人员就开发出一种计算机算法,旨在帮助语言学家破译历史上已消失的语言。

无法“谷歌翻译”的古老语言

如今,世界上现存约有 7100 种语言。然而,古时存在的大多数语言都已不再使用,几近灭绝。数十种已灭绝语言也被认为是“未破译”的语言,也就是说,我们对它们的语法(grammar)、词汇(vocabulary)或句法(syntax)了解不足,也无法理解其文本的意思。

图 | 世界语言分布地图 2018

而研究这些“未破译”的语言,不仅仅是处于学术上的好奇心。还是因为,不理解语言,我们就会错过与讲这些语言的人有关的一整套知识体系。不幸的是,大多数灭绝语言的相关记录极少,因此,科学家无法使用谷歌翻译之类的机器翻译工具或AI算法来对其进行解密。

而传统的研究方法是,找出目标语言的“相关”语言来作比较研究,例如同一语系或相似度较高的现存语言。然而,有些语言并没有对应的、已被深入研究过的“相关”语言,并且它们通常缺少诸如空格和标点符号之类的传统分隔符(想像一下,要解密出用这种语言写出的文字该有多么令人头秃)。

但是,CSAIL 的研究人员发明的新系统,已被证明能够自动破译消失的语言,且无需对其与其他语言的关系有深入的了解。他们还表明,该系统自身就可以确定语言之间的关系,并可以用它来证实最近的一项表明 Iberian 语言实际上与 Basque 语言无关的学术研究。

语言破译:从文本到矢量的转变

此研究由 MIT 教授 Regina Barzilay 牵头,依赖于基于历史语言学(historical linguistics)见解的几项原则。其中一条原则是,一种给定的语言很少会直接添加或删除整个音节,但是很可能会发生某些近似发音的替换。比如,母语中带有“ p”发音的单词可能会在其后代演变中变为“ b”,但是由于明显的发音差异,变为“ k”的可能性则较小。

通过整合这些原则和其他语言学约束,Barzilay 等人的新算法学习将语言发音嵌入多维向量空间,在该多维空间中,相应矢量之间的距离反映了不同发音的差异。这种设计使他们能够捕获语言变化的相关特征,并将这些特征表达为计算约束(computational constraints)。因此,它可以评估两种语言之间的相似度。实际上,当对已知语言进行测试时,它甚至可以准确地识别出该语言属于哪个语系(language families)。例如英语、德语同属于日耳曼语系。

不仅如此,算法生成的模型可以将古语言中的单词进行细分,并将其一一映射到“相关”语言中的对应单词上去。研究团队的最终目标是使该系统仅仅使用几千个单词,就能够破译数十年来语言学家们都无法理解的古语言。

机器翻译相关研究

实际上,这并非 MIT 首个使用计算机技术破译已消失语言的研究。

早在 2010 年,Barzilay 就和其他合作者一起,开发出一个新的计算机算法,该算法在几个小时内就破解了古老的犹太语言乌加里特语(Ugaritic)。除了帮助破译“神秘的”八种左右古老语言外,这项工作还可以扩大自动翻译系统可以处理的语言数量。例如目前,谷歌翻译支持103种语言,而破译系统中使用的技术可以帮助其为数千种语言构建词典。

去年,Barzilay 等人也发表过一篇论文,文中使用改进的计算机算法破译了线形文字 B(Linear B,出现在公元前 1400 年左右)。他们说,“我们的翻译脚本能够以 67.3%的准确率将线性文字 B 的同源词转换成对应的希腊语。据我们所知,该试验是自动解读线性文字 B 的第一次尝试。”

在未来的工作中,该团队希望扩展到将文本与已知语言的相关单词相关联的范围之外,这种方法被称为“基于同源的破译方法”。

Barzilay 说:“例如,我们可以识别文本中涉及到的所有人或地点的信息,然后可以根据已知的历史证据对其进行进一步的调查。这些实体识别(entity recognition)方法如今已广泛用于各种文本处理应用程序中,并且具有很高的准确性 。”
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6246

    浏览量

    110335
  • 算法
    +关注

    关注

    23

    文章

    4762

    浏览量

    97247
  • AI
    AI
    +关注

    关注

    90

    文章

    38303

    浏览量

    297387
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    视美泰发布AI即时翻译机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    在全球化深入推进与AI技术规模化商用的双重驱动下,跨语言沟通需求正迎来爆发式增长。近日,视美泰正式发布AI即时翻译机解决方案,以“核心硬件+智能算法+多模态交互”的完整技术矩阵,依托在
    的头像 发表于 12-03 10:50 761次阅读
    视美泰发布<b class='flag-5'>AI</b>即时<b class='flag-5'>翻译</b>机解决方案,硬核配置+多语种覆盖破解跨<b class='flag-5'>语言</b>沟通难题

    VS680 HDMI AI分析解决方案 #目标识别 #视频翻译 #AI #芯片

    AI
    深蕾半导体
    发布于 :2025年11月12日 10:29:33

    【飞凌OK-MX9596-C开发板试用】③云端AI拍照识别

    ://cloud.baidu.com/ 可以看到功能丰富,有语音技术、文字识别、人脸识别、自然语言处理(翻译)等。 注册账号后 创建应用——>文字
    发表于 11-01 22:12

    声智科技AI翻译耳机重塑智能听觉体验

    在日益紧密的全球化浪潮中,跨语言沟通的障碍正在被前沿的声学AI技术逐步瓦解。声智AI翻译耳机,凭借深厚的声学AI积累,率先实现了“跨语种音色
    的头像 发表于 10-21 15:28 664次阅读
    声智科技<b class='flag-5'>AI</b><b class='flag-5'>翻译</b>耳机重塑智能听觉体验

    国庆出国游,时空壶新T1翻译机,首个端侧模型突破助力跨语言交流

    国庆将至,众多游客计划出国旅行,跨语言交流的顺畅与否成为影响旅行体验的重要因素。时空壶新T1翻译机作为行业技术领先产品,凭借其独特优势,为游客在海外的沟通交流保驾护航。新T1作为时空壶翻译机品类中
    的头像 发表于 09-12 12:20 860次阅读
    国庆出国游,时空壶新T1<b class='flag-5'>翻译</b>机,首个端侧模型突破助力跨<b class='flag-5'>语言</b>交流

    翻译失去网络,时空壶新T1翻译机开创首个离线模型赋能全球沟通新体验

    全球首创的离线端侧AI翻译模型,这一技术突破堪称行业变革性创举。与传统依赖网络或仅靠静态离线语言包的翻译设备不同,T1的离线模型基于先进的端侧大模型轻量化技术搭建
    的头像 发表于 09-08 16:52 941次阅读
    当<b class='flag-5'>翻译</b>失去网络,时空壶新T1<b class='flag-5'>翻译</b>机开创首个离线模型赋能全球沟通新体验

    声智科技出席2025年北京市多语种AI语音翻译大赛

    8月20日,由北京市科委、中关村管委会主办,北京语言大学、北京第二外国语学院、北京市翻译协会、中国人工智能百人会共同承办的“2025年北京市多语种AI语音翻译大赛”在中关村展示中心顺利
    的头像 发表于 08-25 17:18 1055次阅读

    RK3576助力智慧安防:8路高清采集与AI识别

    )多路视频整合难:不同摄像头采集的画面需要实时拼接,普通平台处理延迟高。 2)智能化程度低:缺乏AI分析能力,无法自动识别异常事件。 3)远程调度受限:视频传输延迟大,无法实时远程干预
    发表于 08-22 17:41

    KitProg3无法编程器正确识别怎么解决?

    KitProg3 默认处于正确的 CMSIS DAP/bulk 模式。 问题:更改端口后,编程器无法正确识别 KitProg3, 采取的措施:更新 kitprog3 固件,根据
    发表于 07-23 08:12

    AI耳机变身翻译官+会议总结大师?涂鸦AI音频开发方案,让耳机升级到下一个level

    在接入AI能力后,耳机这种日常化的产品,能有多大的想象空间?它不仅能帮你轻松听懂全球外语和地方方言,还能将语音转化为文字、翻译成不同语言,甚至自动总结会议要点、生成思维导图,适配办公、学习、跨
    的头像 发表于 07-10 18:47 1597次阅读
    <b class='flag-5'>AI</b>耳机变身<b class='flag-5'>翻译</b>官+会议总结大师?涂鸦<b class='flag-5'>AI</b>音频开发方案,让耳机升级到下一个level

    安信可AI人脸识别方案

    作为神仙世界的高科技,"无接触式开锁",人脸识别技术也广泛应用在现代生活中,安信可也有AI人脸识别方案!
    的头像 发表于 02-25 14:39 748次阅读
    安信可<b class='flag-5'>AI</b>人脸<b class='flag-5'>识别</b>方案

    Meta与UNESCO合作推动多语言AI发展

    Meta最近宣布了一项与联合国教科文组织(UNESCO)合作的全新计划——语言技术伙伴计划。该计划旨在收集多种语言的语音录音和文字记录,以推动未来开放可用的人工智能(AI)技术的发展,特别关注那些
    的头像 发表于 02-08 11:04 915次阅读

    AI助力实时翻译耳机

    你是否曾经因为语言障碍而无法与外国人顺畅交流?或者在旅行中因为语言不通而错过了一些精彩的经历?现在,随着AI技术的发展,实时翻译耳机可以帮你
    的头像 发表于 01-24 11:14 3394次阅读
    <b class='flag-5'>AI</b>助力实时<b class='flag-5'>翻译</b>耳机

    大模型进化论:AI产业落地将卷向何方

    大模型进化论:AI产业落地将卷向何方
    的头像 发表于 01-24 09:28 517次阅读