电子发烧友网 > 人工智能 > 正文

MIT和谷歌开发失传语言的机器翻译系统

2019年07月17日 10:56 次阅读

1886年,英国考古学家亚瑟伊万斯偶然间发现了一块刻印着未知语言的石头。得知这块石头来源于地中海的克里特岛后,伊万斯立马动身前往此处以搜寻更多证据。在那里,他马上就发现了许多笔迹相似的石碑,这些石碑能追溯到公元前1400年左右,这些刻字也就成为目前发现的最早的书写形式之一。伊万斯表示,这种线形形式是从早期艺术中粗糙的线条画演变而来,在语言史上占有重要地位。

伊万斯等人后来证实,石碑上的刻字是两种不同的文字系统。稍古老的一种称为A类线形文字,可以追溯到公元前1800年至1400年,此时克里特岛还处于青铜时代的米诺文明阶段。时间上更近一点的文字系统称为B类线形文字,公元前1400年后才出现,此时的克里特岛正被希腊大陆的迈锡尼人统治着。

MIT和谷歌开发失传语言的机器翻译系统

许多年来,伊万斯等人一直试图翻译这些古老的文字,但都无疾而终。

这个问题直到1953年,一个名叫迈克尔文特里斯的业余语言学家成功翻译B类线形文字之后,才得到解决。

两个假设

文特里斯的成功建立在两个决定性突破上。第一,他假设B类线形文字中重复出现的词语是克里特岛的地名这在其后被证明是正确的。第二,他假设这些刻字是古希腊语的早期形式这让他能够立即翻译出B类线形文字的其他部分。在翻译过程中,文特里斯表示,古希腊语的书面表达形式比之前预想的还要早几个世纪。

文特里斯的工作成果是一项巨大的成就。但像A类线形文字这样的更为古老的文字系统,到今天为止仍然是语言学上一个亟需解决的难题。

通过机器学习绘制特定语言的联结

不难想象,近年来机器翻译的最新进展对此有所帮助。

短短几年内,注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。尽管翻译质量有待提高,但这也提供了思考语言的一个全新角度。

来自麻省理工学院的罗家明(音译)和雷吉纳巴尔齐莱,以及来自加州山景城谷歌人工智能实验室的曹源(音译),由他们组成的团队研发出了能够翻译失传语言的机器学习系统,并且使其翻译B类线形文字第一次完全自动翻译证明了系统可行性。

他们所利用的方法与标准机器翻译技术有着显着区别。首先需要知道,不管哪种语言,机器翻译的关键都在于认识到文字间联结的相似性。因此整个过程是从绘制特定语言的联结开始,这需要庞大的文本数据库,机器在这个文本数据库中查验每个字符与其他字符在多大频率上联结在一起。这种表现非常独特,它在多重参数空间上定义了这个词语。实际上,这个词语可以视为空间内一个向量,这个向量在机器对任何语言的翻译结果中都起到重要的约束作用。

这些向量遵循着简单的数学规则,举例而言,国王(king)-男性(man)+女性(woman)=王后(queen)。所以,一句话可以认为是由一系列向量排列形成的一条跨越空间的轨迹。

完全对应地翻译

机器翻译的关键洞见在于,不同语言中的词语在各自的参数空间内占据着相同位置。这使得一种语言能够完全对应地被翻译成另一种语言。在这个意义上,翻译句子就变成寻找那些跨越空间的相似轨迹的过程,机器甚至不需要“知道”句子的具体含义。

这个过程需要依赖大数据[注]集。但几年前,德国的一个研究者团队利用小型数据库协助翻译缺少大型文本数据库的稀有语言(+本站微信networkworldweixin),其中的窍门在于找到一种除数据库之外能够约束机器的方法。

利用语言进化的约束

罗家明团队已经进一步展示了机器是怎样翻译一门失传语言的,他们使用的约束与语言随时间的变化相关。任何语言都是以某种方式变化的,比如,亲属语言中的符号以相似的分布出现,相关词语有相同顺序的字符,等等。有了这些规则的约束,如果已知某种古老的语言形式,那么翻译就会轻松许多。

罗家明团队利用这项技术测试了两种失传语言,B类线形文字和乌加里特语。语言学家已经知道,古希腊语的早期形式是由B类线形文字编码得到,而在1929年发现的乌加里特语则是希伯来语的早期形式。

利用这些信息和语言进化的约束,罗家明团队研发的机器能够以相当高的准确度完成上述两种语言的翻译。“我们能够正确地将67.3%的B类线形文字中的同源词翻译成对应的希腊语”,他们说,“据我们所知,本次实验是最早尝试自动翻译B类线形文字的。”而出色的工作成果将机器翻译提高到新的水平。但这也引发了关于其它失传语言的疑问尤其是从未被翻译过的语言,如A类线形文字。

在这篇文章中,A类线形文字的缺席显而易见,罗家明团队甚至没有提及A类线形文字,但和所有语言学家一样,它肯定在他们心中挥之不去。不过可以确定的是,在A类线形文字能够被机器准确翻译之前,我们还需要一些重要的突破。举个例子,没人知道A类线形文字编码了哪种语言,将它翻译成古希腊语的尝试都失败了。如果不知道祖语言,新技术也起不了作用。

但是基于机器的方法存在一个明显的优势,机器可以快速而不知疲倦地对每种语言进行测试。因此罗家明团队或许可以用一种粗暴的方法攻克A类线形文字的翻译难关尝试将它翻译成机器已经掌握的每种语言。如果最终成功,那一定是一项伟大的成就,一项足以另迈克尔文特里斯赞叹不已的成就。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

【5月12】不懂编程没关系,邀请您来学AI

不懂编程没关系,邀请您来学AI活动概述:本活动是现场讲座,由台湾知名AI教育专家、金门创新学院院长、台湾Android技

发烧友学院 发表于 2019-05-24 00:00 0次阅读
【5月12】不懂编程没关系,邀请您来学AI

AI也需要做梦吗

处于“清醒”或在线状态的人工智能神经网络总是在学习新的信息模式。

发表于 2019-07-17 15:22 0次阅读
AI也需要做梦吗

下次如何加薪将由AI和算法说了算

用过去的方法来评估员工的绩效,意味着要从几套不同的人力资源部门记录中挖掘出每份直接报告中蕴含的信息。

发表于 2019-07-17 14:20 7次阅读
下次如何加薪将由AI和算法说了算

医疗和技术的加速融合,带动产业进入“AI+医疗”...

人工智能等前沿技术正在快速迭代,医疗领域的智能升级是大势所趋。

发表于 2019-07-17 10:51 105次阅读
医疗和技术的加速融合,带动产业进入“AI+医疗”...

法律会是AI将革新的又一产业吗

我们这个软件驱动的世界,正在给法律行业带来革命性的变化,并产生了所谓的“法律工程师”。

发表于 2019-07-17 10:39 55次阅读
法律会是AI将革新的又一产业吗

科创板报道:倒计时!首批25家公司如何前瞻和选择

7月22日(下周一),科创板首批25家公司将在上交所鸣锣上市,成为中国资本市场的新生力量。 从201...

发表于 2019-07-17 10:34 217次阅读
科创板报道:倒计时!首批25家公司如何前瞻和选择

边缘计算时代的到来会给AI带来哪些影响

随着5G、人工智能和物联网时代的到来,传统的云计算技术已经无法满足人工智能终端“大连接、低时延、大带...

发表于 2019-07-17 10:33 15次阅读
边缘计算时代的到来会给AI带来哪些影响

5G与AI的碰撞会发生什么化学反应

5G尚处于商用初期,AI也处于发展初级阶段。

发表于 2019-07-17 10:00 22次阅读
5G与AI的碰撞会发生什么化学反应

利用语音直接画出人脸,AI再添新能力

听声辨人,利用声纹进行解锁,这种技术已广泛应用,人类的声音含有该个体的一定特征,从而可以进行区分。

发表于 2019-07-17 09:54 111次阅读
利用语音直接画出人脸,AI再添新能力

中国车联网规模突破2000亿,5G和AI融合推动...

7月9-10日,由国泰君安证券与中移(上海)产业研究院、浦发硅谷银行共同主办的国泰君安2019年信息...

发表于 2019-07-17 09:32 258次阅读
中国车联网规模突破2000亿,5G和AI融合推动...

人工智能能实现无人物流体系吗

无人科技背后的大数据、AI算法等科技成果还促进建立了以消费者个性化需求为核心的C2M反向定制、物流价...

发表于 2019-07-16 17:27 79次阅读
人工智能能实现无人物流体系吗

产业互联网时代到来科技是最大筹码

当产业互联网的风口到来,这些企业未来的发展路径又是怎样的?

发表于 2019-07-16 17:06 147次阅读
产业互联网时代到来科技是最大筹码

物业公司如何面对社区物联化大势所趋

随着人工智能、大数据、物联网等科技发展,传统行业也开始借助这些技术进行转型升级。

发表于 2019-07-16 15:24 50次阅读
物业公司如何面对社区物联化大势所趋

“G往开来,为AI出行”——长城汽车告别传统功能...

7月15日,“G往开来,为AI出行”——长城汽车GTO全域智慧生态战略在保定哈弗技术中心正式发布。

发表于 2019-07-16 15:12 157次阅读
“G往开来,为AI出行”——长城汽车告别传统功能...

AI音乐家将在这四个方面掀起革新浪潮

就像在其他行业一样,在音乐领域,AI也在帮助服务自动化,在庞大的数据集中发现模式和洞见,并帮助提高创...

发表于 2019-07-16 14:12 31次阅读
AI音乐家将在这四个方面掀起革新浪潮

Facebook AI又出新作:性能翻倍,计算成...

Facebook AI又出新作,在神经网络中加入一个结构化存储器层,极大扩充了网络容量和参数数量,性...

发表于 2019-07-16 10:56 180次阅读
Facebook AI又出新作:性能翻倍,计算成...

用AI对抗AI——基于视频人脸篡改的检测

Deepfake有救了!

发表于 2019-07-16 10:10 165次阅读
用AI对抗AI——基于视频人脸篡改的检测

如果你将踏上机器学习工程师就可能遇到 Danie...

如果未来的你将踏上机器学习工程师这条道路,那你很大可能将遇到和机器学习工程师 Daniel Bour...

发表于 2019-07-16 09:57 192次阅读
如果你将踏上机器学习工程师就可能遇到 Danie...

人民日报社与中国联通在建设5G新媒体平台方面正式...

根据战略合作协议,双方将以建设5G新媒体平台为目标,充分运用5G、4K超高清视频,虚拟现实(VR),...

发表于 2019-07-16 09:46 150次阅读
人民日报社与中国联通在建设5G新媒体平台方面正式...

热点 | 工信部:加快5G、AI等新型基础设施建...

7月9日第18届中国互联网大会召开,工业和信息化部副部长陈肇雄出席大会并致辞。

发表于 2019-07-16 08:52 134次阅读
热点 | 工信部:加快5G、AI等新型基础设施建...

从场景出发的计算架构才能真正满足AI大规模应用需...

来自学术界、工业界、投资界的重磅嘉宾齐聚CCF-GAIR 2019 AI芯片专场共同探讨芯片的前沿技...

发表于 2019-07-16 08:35 164次阅读
从场景出发的计算架构才能真正满足AI大规模应用需...

人工智能如何分辨谣言

即以AI技术打假为主、以人工审核为辅,AI还不能替代专家。

发表于 2019-07-15 16:30 39次阅读
人工智能如何分辨谣言

如何解锁AI医疗落地之难

在众多落地场景中,目前AI医学影像是最为成熟的一个。

发表于 2019-07-15 16:26 33次阅读
如何解锁AI医疗落地之难

如何用AI打造线上社群的西部世界

构建在区块链之上的“AI机器人管家”Jarvis+,在满足社群运营的基础之上,将用户和平台进行链接,...

发表于 2019-07-15 15:49 29次阅读
如何用AI打造线上社群的西部世界

是什么让Facebook AI副总裁夜不能寐?

Facebook 人工智能副总裁Jérôme Pesenti,首次在公开演讲中亮相,表达了对日益增长...

发表于 2019-07-15 15:05 93次阅读
是什么让Facebook AI副总裁夜不能寐?

AI护士小姐姐可以帮护士多少忙

机器人队友在这方面真的会是一个有趣而巨大的进步。

发表于 2019-07-15 11:32 60次阅读
AI护士小姐姐可以帮护士多少忙

从头开始构建最先进的深度学习模型

Deep Learning from the Foundations

发表于 2019-07-15 10:02 179次阅读
从头开始构建最先进的深度学习模型

Al人工智能比特币矿机兴起原因是什么

一方面AI需要大量的算力,另一方面挖矿正在造成大量算力的浪费。

发表于 2019-07-15 09:47 36次阅读
Al人工智能比特币矿机兴起原因是什么

AI创造性的工作都已经不在话下了吗

未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完...

发表于 2019-07-14 11:04 69次阅读
AI创造性的工作都已经不在话下了吗

AI是每个企业的机会吗

只有把握人工智能机遇,企业才能掌握高质量发展的“利器”。

发表于 2019-07-14 10:44 66次阅读
AI是每个企业的机会吗

现在看病还需要像以前那样排队吗

开发出了全球领先的下一代微特征识别FVR技术,把浩瀚的手掌脉络“微特征”编码为高密度、高容量的超级“...

发表于 2019-07-14 10:38 48次阅读
现在看病还需要像以前那样排队吗

AI是怎样从你的声音听出你的长相的

随着人工智能技术的不断发展,AI似乎变得越来越“无所不能”

发表于 2019-07-14 10:30 50次阅读
AI是怎样从你的声音听出你的长相的

如何让AI技术尽快应用于实际

自然语言处理(NLP)和自然语言理解,特别是语音转文字技术将成为2019年企业AI中最主要的产品呈现...

发表于 2019-07-14 09:54 51次阅读
如何让AI技术尽快应用于实际

带你详细了解科沃斯机器人DEEBOT T5

目前,扫地机器人已经成为很多一二线城市家中必备的产品,而平时工作、生活比较忙碌的人群成为扫地机器人的...

发表于 2019-07-14 09:26 64次阅读
带你详细了解科沃斯机器人DEEBOT T5

未来的人工智能研究会在非洲吗

尽管存在极大困难,非洲的机器学习依然在过去几年里迅速发展。

发表于 2019-07-14 09:18 35次阅读
未来的人工智能研究会在非洲吗

阿里达摩院刷新纪录,开放域问答成绩比肩人类水平

这是继 2018 年《Multi-granularity hierarchical attentio...

发表于 2019-07-13 08:26 192次阅读
阿里达摩院刷新纪录,开放域问答成绩比肩人类水平

AI看了100部电影,学会了接吻是什么样子

这项研究来自Netflix的高级数据科学家Amir Ziai,他正在斯坦福大学攻读AI专业研究生。Z...

发表于 2019-07-13 08:19 207次阅读
AI看了100部电影,学会了接吻是什么样子

AI虽然不能产生万物,但是正在“唤醒万物”

现场的演示视频显示,搭载百度自主泊车功能的汽车可以在人类司机驾驶的车流里,自动排队开往地下停车场;车...

发表于 2019-07-13 08:12 866次阅读
AI虽然不能产生万物,但是正在“唤醒万物”

AutoML,AI“兵家必争”之技,谁是最强王者...

这是一项国际性的大数据分析竞赛,共有来自中国、美国、英国、德国等 7 个国家,来自华为、京东、滴滴等...

发表于 2019-07-13 07:47 300次阅读
AutoML,AI“兵家必争”之技,谁是最强王者...

大家一起体验AI和群如何改变一个大学新生!

微信成为社会的温情连接器。但每个人都被自己所处的城市、学校和企业圈住了,很难跨出原有的社交圈层,找到...

发表于 2019-07-13 07:40 360次阅读
大家一起体验AI和群如何改变一个大学新生!

腾讯已经变得越来越开放,开源已在路上

近日,腾讯在开源上有了一次大动作,首次全面公开了其整体的开源路线图。据了解,基于代码开放和社区运营,...

发表于 2019-07-13 07:24 1585次阅读
腾讯已经变得越来越开放,开源已在路上

CCF-GAIR全球人工智能与机器人峰会今日开幕...

7月12日-14日,2019年全球人工智能与机器人峰会(CCF-GAIR)正式开幕,该如何锚定人工智...

发表于 2019-07-12 20:38 151次阅读
CCF-GAIR全球人工智能与机器人峰会今日开幕...

人工智能投资迎来拐点

人工智能投资的热潮席卷全球,风险资金不断涌入,尽管在人工智能创业公司和总股本交易数量方面,美国仍然在...

发表于 2019-07-12 17:08 60次阅读
人工智能投资迎来拐点

AI机器人将带给人们惊喜和欢乐

Takara Tomy宣布在日本发售小型AI机器人“Cozmo”。这是一款编程机器人,旨在激发中小学...

发表于 2019-07-12 15:52 47次阅读
AI机器人将带给人们惊喜和欢乐

Google 翻译大更新:打开相机,能让 88 ...

去不讲英文的国家也不愁了。

发表于 2019-07-12 11:45 298次阅读
Google 翻译大更新:打开相机,能让 88 ...

人工智能将会是未来所向

AI近年大热,但它的技术并非一夜爆红,而是新世纪以来,IT技术在运算、存储、传输、安全等几大核心环节...

发表于 2019-07-12 10:53 57次阅读
人工智能将会是未来所向

旷视再推鼻纹识别,让AI寻宠成为可能

人脸识别已经out啦

发表于 2019-07-12 10:42 208次阅读
旷视再推鼻纹识别,让AI寻宠成为可能

AI动作能帮助人类做到什么

伴随着AI动作预测在技术上越来越完备,这一技术的应用场景也被开发的越来越多。

发表于 2019-07-12 10:33 47次阅读
AI动作能帮助人类做到什么

丹麦花卉公司用机器人对植物进行采摘及包装

Rosborg Greenhouse公司是在丹麦生产薄荷最多的一家企业,该企业为了提高生产性及节约费...

发表于 2019-07-12 10:20 38次阅读
丹麦花卉公司用机器人对植物进行采摘及包装

人工智能会取代人类的艺术创造力吗

无论是今天的被动输出,还是未来通过持续深度学习实现主动表达,人工智能为人类的文艺创作都提供了多种可能...

发表于 2019-07-12 10:18 90次阅读
人工智能会取代人类的艺术创造力吗

高考志愿填写你会相信人工智能吗

所谓“AI”,就是人工智能软件的缩写,它包括十分广泛的科学,由不同的领域组成。

发表于 2019-07-12 10:12 54次阅读
高考志愿填写你会相信人工智能吗

DeepMind刚向星际争霸 II 的玩家们下了...

是时候跟AI打一场比赛了!

发表于 2019-07-12 10:09 182次阅读
DeepMind刚向星际争霸 II 的玩家们下了...

基于5G+云+AI技术将重塑泛互联网形态

首先,在5G这条高速公路上,由于带宽将不再是制约瓶颈,云端强大的计算力将得以充分利用,促使移动应用加...

发表于 2019-07-12 09:05 81次阅读
基于5G+云+AI技术将重塑泛互联网形态

人工智能星座到达终点了吗

通过自主感知计算负载实现智能管理、调度计算资源,在轨完成大部分数据处理工作,省去了大量不必要的数据传...

发表于 2019-07-12 08:58 36次阅读
人工智能星座到达终点了吗

耐能夺得全球轻量级人脸识别第一名

近日,美国国家标准与技术研究院(NIST)公布了全球权威人脸识别比赛FRVT(Face Recogn...

发表于 2019-07-12 08:55 261次阅读
耐能夺得全球轻量级人脸识别第一名

遥不可及的真相 AI来探索

喜欢登高望远的我们从未停止感知世界的脚步,随着航空技术和摄影技术的诞生和兴起,在 20 世纪 60 ...

发表于 2019-07-12 08:51 239次阅读
遥不可及的真相 AI来探索

中国在智能芯片的发展路上有偏科吗

只看设计架构层面,国内的人工智能芯片并不比国外差,但这是不够的。

发表于 2019-07-12 08:43 34次阅读
中国在智能芯片的发展路上有偏科吗

从8小时到80秒,NVIDIA如何实现AI训练用...

通过完成全部6项MLPerf基准测试,NVIDIA展现出了全球一流的性能表现和多功能性。NVIDIA...

发表于 2019-07-11 17:29 864次阅读
从8小时到80秒,NVIDIA如何实现AI训练用...

Intel将打造AI训练嵌入式处理器Nervan...

Intel也强调将以软体驱动硬件运算性能,因此也说明此次与百度合作的战略意义,借此透过软件定义方式让...

发表于 2019-07-11 17:11 41次阅读
Intel将打造AI训练嵌入式处理器Nervan...

机器学习让计算机更智能

近日,在“Google Solve with AI”活动上,Google 资深研究员、Google ...

发表于 2019-07-11 16:46 214次阅读
机器学习让计算机更智能

抓住重要战略机遇期 推动工业互联网快速发展

日前,首届中新工业APP创新应用大赛启动仪式在重庆举行,工业和信息化部总经济师王新哲表示,工业互联网...

发表于 2019-07-11 16:36 236次阅读
抓住重要战略机遇期 推动工业互联网快速发展