人工智能破译三千年前的古文字

大数据文摘 2019-07-16 10:42 次阅读

1886年,英国考古学家亚瑟·伊万斯偶然间发现了一块刻印着未知语言的石头。得知这块石头来源于地中海的克里特岛后,伊万斯立马动身前往此处以搜寻更多证据。在那里,他马上就发现了许多笔迹相似的石碑,这些石碑能追溯到公元前1400年左右,这些刻字也就成为目前发现的最早的书写形式之一。伊万斯表示,这种线形形式是从早期艺术中粗糙的线条画演变而来,在语言史上占有重要地位。

伊万斯等人后来证实,石碑上的刻字是两种不同的文字系统。稍古老的一种称为A类线形文字,可以追溯到公元前1800年至1400年,此时克里特岛还处于青铜时代的米诺文明阶段。时间上更近一点的文字系统称为B类线形文字,公元前1400年后才出现,此时的克里特岛正被希腊大陆的迈锡尼人统治着。

许多年来,伊万斯等人一直试图翻译这些古老的文字,但都无疾而终。

这个问题直到1953年,一个名叫迈克尔·文特里斯的业余语言学家成功翻译B类线形文字之后,才得到解决。

两个假设

文特里斯的成功建立在两个决定性突破上。第一,他假设B类线形文字中重复出现的词语是克里特岛的地名——这在其后被证明是正确的。第二,他假设这些刻字是古希腊语的早期形式——这让他能够立即翻译出B类线形文字的其他部分。在翻译过程中,文特里斯表示,古希腊语的书面表达形式比之前预想的还要早几个世纪。

文特里斯的工作成果是一项巨大的成就。但像A类线形文字这样的更为古老的文字系统,到今天为止仍然是语言学上一个亟需解决的难题。

通过机器学习绘制特定语言的联结

不难想象,近年来机器翻译的最新进展对此有所帮助。

短短几年内,注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。尽管翻译质量有待提高,但这也提供了思考语言的一个全新角度。

来自麻省理工学院的罗家明(音译)和雷吉纳·巴尔齐莱,以及来自加州山景城谷歌人工智能实验室的曹源(音译),由他们组成的团队研发出了能够翻译失传语言的机器学习系统,并且使其翻译B类线形文字——第一次完全自动翻译——证明了系统可行性。

他们所利用的方法与标准机器翻译技术有着显著区别。首先需要知道,不管哪种语言,机器翻译的关键都在于认识到文字间联结的相似性。因此整个过程是从绘制特定语言的联结开始,这需要庞大的文本数据库,机器在这个文本数据库中查验每个字符与其他字符在多大频率上联结在一起。这种表现非常独特,它在多重参数空间上定义了这个词语。实际上,这个词语可以视为空间内一个向量,这个向量在机器对任何语言的翻译结果中都起到重要的约束作用。

这些向量遵循着简单的数学规则,举例而言,国王(king)-男性(man)+女性(woman)=王后(queen)。所以,一句话可以认为是由一系列向量排列形成的一条跨越空间的轨迹。

完全对应地翻译

机器翻译的关键洞见在于,不同语言中的词语在各自的参数空间内占据着相同位置。这使得一种语言能够完全对应地被翻译成另一种语言。在这个意义上,翻译句子就变成寻找那些跨越空间的相似轨迹的过程,机器甚至不需要“知道”句子的具体含义。

这个过程需要依赖大数据集。但几年前,德国的一个研究者团队利用小型数据库协助翻译缺少大型文本数据库的稀有语言,其中的窍门在于找到一种除数据库之外能够约束机器的方法。

利用语言进化的约束

罗家明团队已经进一步展示了机器是怎样翻译一门失传语言的,他们使用的约束与语言随时间的变化相关。任何语言都是以某种方式变化的,比如,亲属语言中的符号以相似的分布出现,相关词语有相同顺序的字符,等等。有了这些规则的约束,如果已知某种古老的语言形式,那么翻译就会轻松许多。

罗家明团队利用这项技术测试了两种失传语言,B类线形文字和乌加里特语。语言学家已经知道,古希腊语的早期形式是由B类线形文字编码得到,而在1929年发现的乌加里特语则是希伯来语的早期形式。

利用这些信息和语言进化的约束,罗家明团队研发的机器能够以相当高的准确度完成上述两种语言的翻译。“我们能够正确地将67.3%的B类线形文字中的同源词翻译成对应的希腊语”,他们说,“据我们所知,本次实验是最早尝试自动翻译B类线形文字的。”而出色的工作成果将机器翻译提高到新的水平。但这也引发了关于其它失传语言的疑问——尤其是从未被翻译过的语言,如A类线形文字。

在这篇文章中,A类线形文字的缺席显而易见,罗家明团队甚至没有提及A类线形文字,但和所有语言学家一样,它肯定在他们心中挥之不去。不过可以确定的是,在A类线形文字能够被机器准确翻译之前,我们还需要一些重要的突破。举个例子,没人知道A类线形文字编码了哪种语言,将它翻译成古希腊语的尝试都失败了。如果不知道祖语言,新技术也起不了作用。

但是基于机器的方法存在一个明显的优势,机器可以快速而不知疲倦地对每种语言进行测试。因此罗家明团队或许可以用一种粗暴的方法攻克A类线形文字的翻译难关——尝试将它翻译成机器已经掌握的每种语言。如果最终成功,那一定是一项伟大的成就,一项足以另迈克尔·文特里斯赞叹不已的成就。

原文标题:三千年前的古文字被AI破译,MIT和谷歌开发失传语言的机器翻译系统

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

四轴机器人编程与应用

主题简介:本次直播主要讲解四轴机器人控制器基本原理及组成。四轴机器人的核心技术内嵌人工智能算法的工业级运动控制技术和伺服
发表于 10-30 00:00 11587次 阅读
四轴机器人编程与应用

物联网只是多种技术的结合吗

随着廉价传感器和低成本连接的出现,物联网设备正在激增。
发表于 10-22 17:27 25次 阅读
物联网只是多种技术的结合吗

人工智能和5G对于银行业带来了什么

我国银行业已引入人工智能(AI)技术,同时5G技术渐渐成熟,为金融业态的转型奠定了基础。
发表于 10-22 17:10 30次 阅读
人工智能和5G对于银行业带来了什么

人工智能与实体经济想要融合还需要做什么

人工智能在工业的深度应用是基于工业互联网,工业互联网带来工业互联以后会产生大量数据,数据可能发掘新的....
发表于 10-22 17:05 15次 阅读
人工智能与实体经济想要融合还需要做什么

人工智能+高端制造业有什么独特的优势

山东人工智能发展最大的优势在于,具有广阔的人工智能应用场景。
发表于 10-22 17:02 55次 阅读
人工智能+高端制造业有什么独特的优势

英特尔坚持物联网进化的原因是什么

以数据为中心的理念正在不断驱动产业变革。与此同时,随着人工智能、5G等技术的快速发展,物联网正迎来战....
发表于 10-22 16:59 32次 阅读
英特尔坚持物联网进化的原因是什么

人工智能将会让我们的生活变得更加美好

科大讯飞是国家发改委公布的第一批国家战略性新兴产业集群中人工智能集群的代表性企业,在语音合成、语音识....
发表于 10-22 16:46 70次 阅读
人工智能将会让我们的生活变得更加美好

一种基于人工智能的脑图像处理方法

基于深度学习的工作流程系统DeNeRD,框图显示了由神经元检测器(TOP)单元处理的来自不同出生后(....
发表于 10-22 16:41 16次 阅读
一种基于人工智能的脑图像处理方法

提高边缘精度对于AI芯片的发展有什么意义

只有通过对基础技术的深耕,才能贯穿人工智能产业链纵向的基础架构、通用技术以及行业应用三个层面,真正将....
发表于 10-22 16:18 18次 阅读
提高边缘精度对于AI芯片的发展有什么意义

有关于人工智能的专利如何申请

涉及人工智能的专利申请,虽然是一类新的应用领域,但还是要遵从一般的撰写原则,此外就是在应对个案时候需....
发表于 10-22 16:15 143次 阅读
有关于人工智能的专利如何申请

我们来聊聊AI的未来

人工智能最终是要落到产业中解决实际问题的,绝对不能停留在算法训练这一步。
发表于 10-22 16:12 18次 阅读
我们来聊聊AI的未来

在未来人工智能的发展将会造福于人类

随着网络的不断发展,现在中国人的吃穿住行相比10年前都已经发生了非常大的变化。现在不管是出门还是宅在....
发表于 10-22 16:08 36次 阅读
在未来人工智能的发展将会造福于人类

Python对于人工智能来说是什么地位

随着“大数据”“云计算”“人工智能”等等科技的兴起,IT行业在今后三到五年将会迎来一个高速发展期。
发表于 10-22 15:43 25次 阅读
Python对于人工智能来说是什么地位

呼叫中心怎样加入人工智能技术

呼叫中心依赖于复杂的交换机技术,对客户旅程的洞察力很少,无法智能地路由呼叫或监控情绪。
发表于 10-22 15:28 19次 阅读
呼叫中心怎样加入人工智能技术

今年的乌镇大会,大佬们都在关心这些话题

来源:全天候科技 10月21日,主题为智能互联 开放合作 携手共建网络空间命运共同体的第六届世界互联....
的头像 刘伟DE 发表于 10-22 11:34 485次 阅读
今年的乌镇大会,大佬们都在关心这些话题

具有情感识别的人工智能将以最新趋势迅速发展

随着人工智能被用来做出关于我们生活的更多决定,工程师们寻求了使其更具情感智能的方法。这意味着要自动执....
发表于 10-22 10:44 77次 阅读
具有情感识别的人工智能将以最新趋势迅速发展

人工智能的服务市场即将迎来突破性的发展

人工智能即服务使人们和组织可以针对不同目的探索有关AI的不同途径,而无需进行大量的先发猜测,并且机会....
发表于 10-22 10:35 162次 阅读
人工智能的服务市场即将迎来突破性的发展

人工智能时代下实体零售如何实现数字化创新

5G+AI赋能实体零售将成为可以落地的切实措施,随着AI+的不断实践应用,国内的人工智能企业逐渐摸索....
发表于 10-22 10:25 32次 阅读
人工智能时代下实体零售如何实现数字化创新

飞利浦技术专家分享:10多年学习、职场进阶之路

我总结了10多年的学习和实践经验,把他打造成了完整的学习路线提供给大家,希望能够最终让大家快速入门,....
的头像 Duke 发表于 10-22 09:48 0次 阅读
飞利浦技术专家分享:10多年学习、职场进阶之路

ZCU102,ZCU104和ZCU106有什么区别?

嗨, 看起来ZCU104是ZCU102和ZCU106的升级版本,具有支持机器学习的额外功能,但更便宜? 最好的祝愿, 花环...
发表于 10-22 09:19 23次 阅读
ZCU102,ZCU104和ZCU106有什么区别?

将嵌入式引进机器学习这样eIQ就足够了吗

各个领域都需要创新,都需要发展,同时随着产品越来越复杂,具有了更强大的处理能力和更高的速度,使得机器....
发表于 10-22 08:56 15次 阅读
将嵌入式引进机器学习这样eIQ就足够了吗

新一代信息技术与制造业融合将成为推动我国经济高质量发展的重要动力

苗圩指出,当前,新一轮科技革命和产业变革孕育兴起,以5G、人工智能、虚拟现实等为代表的新一代信息技术....
发表于 10-22 08:49 32次 阅读
新一代信息技术与制造业融合将成为推动我国经济高质量发展的重要动力

无人机融合人工智能可以得到什么好处

在人工智能得到高速发展的新时代,以人工智能为核心的新经济,推动着传统行业改革,发展,走上一条更智能的....
发表于 10-21 17:22 63次 阅读
无人机融合人工智能可以得到什么好处

AI和传感器怎样为农业改头换面

AI是人工智能的缩写,它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新....
发表于 10-21 17:17 86次 阅读
AI和传感器怎样为农业改头换面

物联网技术如何进入实体零售行业

智能传感器对于收集整个商店信息并帮助商店管理层及时做出反应也至关重要。
发表于 10-21 17:02 174次 阅读
物联网技术如何进入实体零售行业

当通信网络引入人工智能技术会怎么样

移动通信产业30年以来,从来没有哪一代移动通信技术像5G这样,在短短一年时间内就实现了标准、频谱、终....
发表于 10-21 16:26 42次 阅读
当通信网络引入人工智能技术会怎么样

人工智能下一个春天的领域在哪里

情感计算研究就是试图创建一种能感知、识别和理解人的情感,并能针对人的情感做出智能、灵敏、友好反应的计....
发表于 10-21 15:36 47次 阅读
人工智能下一个春天的领域在哪里

工程院院士倪光南:新一代技术能提高人民经济和生活到一个新的阶段

10月20日消息,第六届世界互联网大会在乌镇开幕。在中外部长高峰论坛上,中国工程院院士倪光南发表演讲....
的头像 牵手一起梦 发表于 10-21 14:32 262次 阅读
工程院院士倪光南:新一代技术能提高人民经济和生活到一个新的阶段

中国移动杨杰:构建智慧社会要推动新一代信息通讯技术融入民生

10月20日消息,第六届世界互联网大会在乌镇开幕。在中外部长高峰论坛上,中国移动董事长杨杰发表演讲称....
的头像 牵手一起梦 发表于 10-21 14:28 172次 阅读
中国移动杨杰:构建智慧社会要推动新一代信息通讯技术融入民生

AI换身体的背后是什么

“深度伪造”(Deepfake)是英文“deep learning”(深度学习)和“fake”(伪造....
发表于 10-21 14:27 31次 阅读
AI换身体的背后是什么

人工智能带来了是简单工作还是失业

新的AI技术必然有新增资本进入,就带来了全新的工作职位,这是AI的第二个影响——技术变革补充劳动力。
发表于 10-21 14:23 49次 阅读
人工智能带来了是简单工作还是失业

高通通过“发明-分享-协作”的商业模式加速实现“万物智能互连”

2019年10月18日,“AI物联·智慧世界”——2019智能物联网大会在潍坊盛大开幕。此次大会由潍....
的头像 牵手一起梦 发表于 10-21 14:21 365次 阅读
高通通过“发明-分享-协作”的商业模式加速实现“万物智能互连”

荣耀集团总裁赵明:5G相关产业将会是百万亿人民币级别的大市场

10月21日消息,第六届互联网大会在乌镇举行,在网络文化与青年分论坛上,荣耀集团总裁赵明发表演讲称,....
的头像 牵手一起梦 发表于 10-21 14:07 269次 阅读
荣耀集团总裁赵明:5G相关产业将会是百万亿人民币级别的大市场

2020年的医疗面临什么问题

健康数据在网络犯罪世界中是一种有价值的商品,这自然而然的使它成为了盗窃的目标。
发表于 10-21 11:56 24次 阅读
2020年的医疗面临什么问题

济南市已率先实现了基于5G应用的智慧化物流园区

这一物流园区是济南市率先实现5G应用的智慧化物流园区,园区利用5G、人工智能和大数据等先进技术,采用....
发表于 10-21 11:38 273次 阅读
济南市已率先实现了基于5G应用的智慧化物流园区

采矿行业的现状还可以通过AI技术改变吗

即使是在这个非常具体的行业当中,人工智能与机器学习同样有望成为提高效率、有效性、改善环境以及安全问题....
发表于 10-21 11:08 34次 阅读
采矿行业的现状还可以通过AI技术改变吗

360借条是如何利用AI技术解决难题的

通过人工智能的广泛应用,360借条将在解决暴力催收的行业乱象中,走出一条属于自己的科技之路,为用户带....
发表于 10-21 10:50 226次 阅读
360借条是如何利用AI技术解决难题的

广电媒体新闻在人工智能的时代有了什么改变

数据是新闻生产的新思维、新资源,人工智能技术的应用是以大数据资源和内容资源为基础的。
发表于 10-21 10:45 137次 阅读
广电媒体新闻在人工智能的时代有了什么改变

通用人工智能什么时候才能实现

智能机器人未来发展的趋势是基于认知脑计算模型、类脑信息处理技术来构建机器脑,利用机器脑直接控制机器人....
发表于 10-21 10:39 67次 阅读
通用人工智能什么时候才能实现

机器人如何读懂文字中的情感

以人工智能技术助力更多行业、机构及个人拥抱AI时代,分享AI发展的红利。
发表于 10-21 10:24 34次 阅读
机器人如何读懂文字中的情感

AI给市场营销带来了什么改变

互联网通信和交互式媒体的发展使营销进入数字化时代——数字营销已成为品牌借助科技力量进行营销的主要模式....
发表于 10-21 10:18 36次 阅读
AI给市场营销带来了什么改变

智慧银行有什么新的创新应用

人工智能技术和应用的蓬勃发展为银行行业带来了新动力,但在实际的场景落地过程中,仍然充满挑战。
发表于 10-21 10:13 50次 阅读
智慧银行有什么新的创新应用

人工智能医疗现在有什么“错位”

中国AI医疗发展有“四个错位”,分别在应用场景、商业模式、数据质量和相关人工智能政策四个方面。
发表于 10-21 10:08 166次 阅读
人工智能医疗现在有什么“错位”

人工智能最大的作用应该是帮助人类进行决策

人说到底还是一种环境适应性动物,在本能状态下,给一个刺激就会有一个对应的反应,情绪是这种反应之一,而....
发表于 10-21 10:06 84次 阅读
人工智能最大的作用应该是帮助人类进行决策

人工智能视频检索技术或将诞生新的曙光

在社会高速发展的今天,互联网数据催生出人工智能、大数据和云计算等信息技术,也催生出了诸如旷视科技、商....
发表于 10-21 10:01 33次 阅读
人工智能视频检索技术或将诞生新的曙光

互联网升级如何利用好人工智能技术

在大数据、人工智能等新兴技术与教学深度结合的大背景下,尚德机构通过数据化、智能化提升教学水平和效率。
发表于 10-21 09:57 20次 阅读
互联网升级如何利用好人工智能技术

如何推动人工智能系统的发展

人工智能正在改变世界各地的产业,无论是零售业的个性化消费体验、工业的预测维修、交通行业的舱内体验、智....
发表于 10-21 09:52 359次 阅读
如何推动人工智能系统的发展

人工智能时代开始来了吗

如果按照人工智能会取代人工的想法,其实所有的工作都是能够被取代的。
发表于 10-21 09:47 48次 阅读
人工智能时代开始来了吗

人工智能是什么,它是如何定义的

查找各种资料后你会发现,对于人工智能并没有一个清晰而明确的定义。部分人认为“人工智能就是对理性主体的....
发表于 10-21 09:41 136次 阅读
人工智能是什么,它是如何定义的

基于5G新空口的NR-V2X车联网技术的发展阶段探讨

从应用角度讲,LTE-V2X的设计目标主要是支持辅助驾驶,提升道路安全及提高效率和舒适性;NR-V2....
发表于 10-21 09:40 220次 阅读
基于5G新空口的NR-V2X车联网技术的发展阶段探讨

人工智能在行业中的应用是怎样的

人工智能实现计算机视觉,图像检测和深度学习,以制造能够自动检测物体并在无人干预的情况下行驶的汽车。
发表于 10-21 09:40 444次 阅读
人工智能在行业中的应用是怎样的

基于ARM9内核的智能灭火机器人怎么设计?

人工智能也称机器智能,是一门研究人类智能机理和如何用计算机模拟人类智能活动的学科。经过50多年的发展,人工智能已形成极广泛...
发表于 10-21 06:39 85次 阅读
基于ARM9内核的智能灭火机器人怎么设计?

深入浅出学习机器学习

万万没想到,枯燥的“机器学习”还可以这样学!...
发表于 10-18 14:17 28次 阅读
深入浅出学习机器学习

AI的核心是什么?

AI概念笼统,范围广大,到底什么才是AI的核心? ...
发表于 10-18 06:39 51次 阅读
AI的核心是什么?

什么是Cortex-A75?

时光飞逝,好像在昨天我们才刚发布ARM Cortex-A73这款最节能的高效能Cortex应用处理器,转眼之间我们就看到Cortex-A73量...
发表于 10-15 08:28 64次 阅读
什么是Cortex-A75?

用机器学习对人脸进行打分

利用机器学习进行人脸颜值评分
发表于 10-12 15:11 40次 阅读
用机器学习对人脸进行打分

为什么说FPGA是机器深度学习的未来?

  最近几年数据量和可访问性的迅速增长,使得人工智能的算法设计理念发生了转变。人工建立算法的做法被计算机从大量数据中自动...
发表于 10-10 06:45 91次 阅读
为什么说FPGA是机器深度学习的未来?

机器学习在即时配送领域的应用

机器学习在美团配送系统的实践:用技术还原真实世界...
发表于 10-09 06:10 56次 阅读
机器学习在即时配送领域的应用

50个机器学习实用API干货

还在为找不到机器学习的API而烦恼吗?本篇文章将介绍一个包含50+关于人脸和图像识别,文本分析,NLP,情感分析,语言翻译,...
发表于 10-06 08:00 249次 阅读
50个机器学习实用API干货

通过Excel表格来学习机器学习算法

五步解析机器学习难点—梯度下降【转】
发表于 09-27 11:12 56次 阅读
通过Excel表格来学习机器学习算法