张飞软硬开源基于STM32 BLDC直流无刷电机驱动器开发视频套件,👉戳此立抢👈

人工智能破译三千年前的古文字

大数据文摘 2019-07-16 10:42 次阅读

1886年,英国考古学家亚瑟·伊万斯偶然间发现了一块刻印着未知语言的石头。得知这块石头来源于地中海的克里特岛后,伊万斯立马动身前往此处以搜寻更多证据。在那里,他马上就发现了许多笔迹相似的石碑,这些石碑能追溯到公元前1400年左右,这些刻字也就成为目前发现的最早的书写形式之一。伊万斯表示,这种线形形式是从早期艺术中粗糙的线条画演变而来,在语言史上占有重要地位。

伊万斯等人后来证实,石碑上的刻字是两种不同的文字系统。稍古老的一种称为A类线形文字,可以追溯到公元前1800年至1400年,此时克里特岛还处于青铜时代的米诺文明阶段。时间上更近一点的文字系统称为B类线形文字,公元前1400年后才出现,此时的克里特岛正被希腊大陆的迈锡尼人统治着。

许多年来,伊万斯等人一直试图翻译这些古老的文字,但都无疾而终。

这个问题直到1953年,一个名叫迈克尔·文特里斯的业余语言学家成功翻译B类线形文字之后,才得到解决。

两个假设

文特里斯的成功建立在两个决定性突破上。第一,他假设B类线形文字中重复出现的词语是克里特岛的地名——这在其后被证明是正确的。第二,他假设这些刻字是古希腊语的早期形式——这让他能够立即翻译出B类线形文字的其他部分。在翻译过程中,文特里斯表示,古希腊语的书面表达形式比之前预想的还要早几个世纪。

文特里斯的工作成果是一项巨大的成就。但像A类线形文字这样的更为古老的文字系统,到今天为止仍然是语言学上一个亟需解决的难题。

通过机器学习绘制特定语言的联结

不难想象,近年来机器翻译的最新进展对此有所帮助。

短短几年内,注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。尽管翻译质量有待提高,但这也提供了思考语言的一个全新角度。

来自麻省理工学院的罗家明(音译)和雷吉纳·巴尔齐莱,以及来自加州山景城谷歌人工智能实验室的曹源(音译),由他们组成的团队研发出了能够翻译失传语言的机器学习系统,并且使其翻译B类线形文字——第一次完全自动翻译——证明了系统可行性。

他们所利用的方法与标准机器翻译技术有着显著区别。首先需要知道,不管哪种语言,机器翻译的关键都在于认识到文字间联结的相似性。因此整个过程是从绘制特定语言的联结开始,这需要庞大的文本数据库,机器在这个文本数据库中查验每个字符与其他字符在多大频率上联结在一起。这种表现非常独特,它在多重参数空间上定义了这个词语。实际上,这个词语可以视为空间内一个向量,这个向量在机器对任何语言的翻译结果中都起到重要的约束作用。

这些向量遵循着简单的数学规则,举例而言,国王(king)-男性(man)+女性(woman)=王后(queen)。所以,一句话可以认为是由一系列向量排列形成的一条跨越空间的轨迹。

完全对应地翻译

机器翻译的关键洞见在于,不同语言中的词语在各自的参数空间内占据着相同位置。这使得一种语言能够完全对应地被翻译成另一种语言。在这个意义上,翻译句子就变成寻找那些跨越空间的相似轨迹的过程,机器甚至不需要“知道”句子的具体含义。

这个过程需要依赖大数据集。但几年前,德国的一个研究者团队利用小型数据库协助翻译缺少大型文本数据库的稀有语言,其中的窍门在于找到一种除数据库之外能够约束机器的方法。

利用语言进化的约束

罗家明团队已经进一步展示了机器是怎样翻译一门失传语言的,他们使用的约束与语言随时间的变化相关。任何语言都是以某种方式变化的,比如,亲属语言中的符号以相似的分布出现,相关词语有相同顺序的字符,等等。有了这些规则的约束,如果已知某种古老的语言形式,那么翻译就会轻松许多。

罗家明团队利用这项技术测试了两种失传语言,B类线形文字和乌加里特语。语言学家已经知道,古希腊语的早期形式是由B类线形文字编码得到,而在1929年发现的乌加里特语则是希伯来语的早期形式。

利用这些信息和语言进化的约束,罗家明团队研发的机器能够以相当高的准确度完成上述两种语言的翻译。“我们能够正确地将67.3%的B类线形文字中的同源词翻译成对应的希腊语”,他们说,“据我们所知,本次实验是最早尝试自动翻译B类线形文字的。”而出色的工作成果将机器翻译提高到新的水平。但这也引发了关于其它失传语言的疑问——尤其是从未被翻译过的语言,如A类线形文字。

在这篇文章中,A类线形文字的缺席显而易见,罗家明团队甚至没有提及A类线形文字,但和所有语言学家一样,它肯定在他们心中挥之不去。不过可以确定的是,在A类线形文字能够被机器准确翻译之前,我们还需要一些重要的突破。举个例子,没人知道A类线形文字编码了哪种语言,将它翻译成古希腊语的尝试都失败了。如果不知道祖语言,新技术也起不了作用。

但是基于机器的方法存在一个明显的优势,机器可以快速而不知疲倦地对每种语言进行测试。因此罗家明团队或许可以用一种粗暴的方法攻克A类线形文字的翻译难关——尝试将它翻译成机器已经掌握的每种语言。如果最终成功,那一定是一项伟大的成就,一项足以另迈克尔·文特里斯赞叹不已的成就。

原文标题:三千年前的古文字被AI破译,MIT和谷歌开发失传语言的机器翻译系统

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

四轴机器人编程与应用

主题简介:本次直播主要讲解四轴机器人控制器基本原理及组成。四轴机器人的核心技术内嵌人工智能算法的工业级运动控制技术和伺服
发表于 10-30 00:00 11587次 阅读
四轴机器人编程与应用

人工智能的升级会导致部分人类失业吗

最近几个月很多人都看到了现在有很多方法解决人工智能“大数据问题”从而带给人工智能巨大推动力,并且已经....
发表于 08-17 10:12 21次 阅读
人工智能的升级会导致部分人类失业吗

人工智能让制造变得更加智能

2016年对于人工智能来说是一个“里程碑”式的年份。年初,AlphaGo大胜围棋九段李世石,让近10....
发表于 08-17 10:07 20次 阅读
人工智能让制造变得更加智能

看3D视觉传感技术如何引领人工智能行业新革命

自2019年以来,随着AI从技术驱动向商业化落地快速演进,人工智能技术与产业结合将迎来爆发式增长。作....
发表于 08-17 09:00 23次 阅读
看3D视觉传感技术如何引领人工智能行业新革命

机器人行业急需AI视觉技术突破瓶颈,解决现有问题

随着材料科学、感知人工智能以及5G、云等网络技术的不断进步,将出现护理机器人、仿生机器人、社交机器人....
发表于 08-17 08:26 27次 阅读
机器人行业急需AI视觉技术突破瓶颈,解决现有问题

中国首批机器人交警在邯郸上岗,摩点助力高科技产品落地成真

在日前,“机器人交警”在河北邯郸正式“上岗”,这是由邯郸市公安局主导研发、经过公安部认证并列装的交管....
发表于 08-17 07:56 25次 阅读
中国首批机器人交警在邯郸上岗,摩点助力高科技产品落地成真

工业物联网成功的商业模式分析

幸运的是,工业物联网不再是一个技术问题,制造商也不必在内部开发任何东西。今天,交付运行良好的连网系统....
发表于 08-16 17:34 39次 阅读
工业物联网成功的商业模式分析

李开复:人工智能进入赋能传统行业的阶段,即将开花结果

8月16日下午消息,2019 DeeCamp人工智能训练营成果展示暨结营典礼在中国科学院大学雁栖湖校....
的头像 电子发烧友网工程师 发表于 08-16 16:12 118次 阅读
李开复:人工智能进入赋能传统行业的阶段,即将开花结果

AI与工业互联网的碰撞会擦出怎样的火花

企业在应用工业互联网的时候,对数据的智能化分析以及决策优化的需求越来越高。在这个过程中,工业互联网与....
发表于 08-16 15:57 107次 阅读
AI与工业互联网的碰撞会擦出怎样的火花

人工智能是一种改善数据处理的好方法

早期的机器很笨,只能按照定义明确的指令运行。但是,随着计算机和处理网络功能的不断增强,现在可以创建和....
发表于 08-16 15:54 33次 阅读
人工智能是一种改善数据处理的好方法

人工智能和机器学习的QA测试有何不同

智能手机、智能音箱、智能汽车、智能咖啡机,物品被赋予智能的例子不胜枚举,似乎周围的一切都获得了生命和....
发表于 08-16 15:50 21次 阅读
人工智能和机器学习的QA测试有何不同

DeeCamp创新工场深度学习暑期夏令营结营,找的下一个“李开复”

8月14日,首次在广州举办的DeeCamp创新工场深度学习暑期夏令营结营,资料显示,DeeCamp训....
的头像 大数据文摘 发表于 08-16 15:49 159次 阅读
DeeCamp创新工场深度学习暑期夏令营结营,找的下一个“李开复”

人工智能鉴定大师“包小鉴”准确率达到95%以上

8月12日,苹果商店(App Store)上线了一款新应用,利用人工智能技术,它可以帮助用户秒速鉴定....
的头像 RFID头条 发表于 08-16 15:30 77次 阅读
人工智能鉴定大师“包小鉴”准确率达到95%以上

中国第一台美女机器人,外观甜美,还能与人做简单的交流

现在全世界各国都在致力于人工智能的研发工作,掌握人工智能的先进程度,成了衡量一个国家发达程度的标准之....
的头像 旺材芯片 发表于 08-16 15:16 192次 阅读
中国第一台美女机器人,外观甜美,还能与人做简单的交流

Firefly集群服务器解决方案

方案背景 移动互联应用的快速发展和云计算、大数据应用的拓展和深化,数据中心已由传统的大型机、小型机逐步转移到x86服务器,...
发表于 08-16 15:09 149次 阅读
Firefly集群服务器解决方案

微软宣布小冰历史上最大的一次升级,全新人工智能框架

第七代微软小冰,为我们带来了全新的人工智能通用框架 Avatar Framework——现在,每个人....
的头像 一牛网在线 发表于 08-16 15:01 174次 阅读
微软宣布小冰历史上最大的一次升级,全新人工智能框架

又曝光了一家伪AI明星公司,AI可能是泡沫?

这家总部设在美国洛杉矶和英国伦敦的公司,一直以来都声称:使用AI技术在很大程度上实现了移动App的自....
的头像 一牛网在线 发表于 08-16 14:54 162次 阅读
又曝光了一家伪AI明星公司,AI可能是泡沫?

未来图灵&大众网签约仪式 图灵指数AI明星企业排行榜对外发布

8月15日,未来图灵&大众网签约仪式在北京举行,由财视传媒打造的图灵指数AI明星企业排行榜正式对外发....
的头像 狂飙LED网 发表于 08-16 14:48 252次 阅读
未来图灵&大众网签约仪式 图灵指数AI明星企业排行榜对外发布

Dbrain正在利用区块链给没有银行账户的人群提高生活标准的机会

80%的人工智能都是由数据组成。目前 用于机器学习的数据集仍需手动标 记,并且耗费大量的人力。我们为....
发表于 08-16 14:27 35次 阅读
Dbrain正在利用区块链给没有银行账户的人群提高生活标准的机会

机器学习经验总结

面试经验(机器学习)
发表于 08-16 14:20 36次 阅读
机器学习经验总结

谷歌超700名员工集体请愿,呼吁放弃政府合同竞标

据消息报道,超过700名谷歌员工集体请愿,要求谷歌公司不要参与美国海关和边境保护局(CBP)云计算合....
的头像 电子发烧友网工程师 发表于 08-16 12:34 247次 阅读
谷歌超700名员工集体请愿,呼吁放弃政府合同竞标

人工智能芯片明明是硬件,和软件又有什么关系?

对于人工智能芯片产业来说,仅有好的硬基础是不够的,在硬基础上再做出好的软件,才能做得更好。”在日前举....
的头像 瓦力工厂机器人 发表于 08-16 11:39 148次 阅读
人工智能芯片明明是硬件,和软件又有什么关系?

“智能人工”代替“人工智能”还赚了1.6亿元 65%来自于印度

据《华尔街日报》报道,总部在伦敦和洛杉矶的Engineer.ai公司由两名印度人创建,号称可以通过人....
的头像 全球人工智能 发表于 08-16 10:57 310次 阅读
“智能人工”代替“人工智能”还赚了1.6亿元 65%来自于印度

创新工场AI子公司计划2021年在国内上市,估值将达到10-20亿美元

据国外媒体报道,李开复说的这家人工智能子企业名为创新奇智公司(AInnovation),公司成立于2....
的头像 移动支付网 发表于 08-16 10:11 313次 阅读
创新工场AI子公司计划2021年在国内上市,估值将达到10-20亿美元

人工智能将以什么样的方式来变革制造业

IDC数据显示,到2021年,20%的领先制造企业将通过嵌入式智能、人工智能、物联网和区块链等技术实....
发表于 08-16 10:07 39次 阅读
人工智能将以什么样的方式来变革制造业

发展人工智能芯片必须得软硬兼施

人工智能芯片明明是硬件,和软件又有什么关系?人工智能芯片本身只起到加速的作用。除了少量定制化人工智能....
发表于 08-16 10:02 35次 阅读
发展人工智能芯片必须得软硬兼施

工信部闻库对我国5G与垂直行业融合应用的发展提出了三点建议

闻库称,我国正处于5G网络建设和应用培育的发展初期,下大力气研究5G创新应用发展是当前的一项重要任务....
发表于 08-16 09:34 138次 阅读
工信部闻库对我国5G与垂直行业融合应用的发展提出了三点建议

机器人的自主决策可靠吗?机器视觉在智能领域占据什么地位?

工业视觉中,机器人视觉领域在技术和商用程度上均有较好的表现。本文从机器人视觉的市场需求、技术原理以及发展趋势三个层面,深...
发表于 08-16 04:00 96次 阅读
机器人的自主决策可靠吗?机器视觉在智能领域占据什么地位?

成都建设全国首个5G规模组网试验体系,已经走在全国前列

近日,由成都市互联网信息办公室、成都市经济和信息化局委托中国互联网络信息中心、成都市移动互联网协会联....
的头像 电子发烧友网工程师 发表于 08-16 02:15 96次 阅读
成都建设全国首个5G规模组网试验体系,已经走在全国前列

“天机芯”有望促进人工通用智能发展

13年前,正在新加坡科学院数据存储研究院从事信息存储的施路平做梦也没有想到,自己的大胆设想在今天不仅....
的头像 新材料在线 发表于 08-15 18:19 364次 阅读
“天机芯”有望促进人工通用智能发展

行业 | 中国人工智能市场现状与趋势

2018年中国人工智能产业市场规模继续保持稳定增长,整体市场规模达到383.8亿元,同比增长27.6....
的头像 WPR 发表于 08-15 17:24 149次 阅读
行业 | 中国人工智能市场现状与趋势

三大驱动因素推动发展,全球AI市场规模持续增长

目前全球人工智能市场仍呈现加速增长态势,主力厂商着重抢先布局人工智能产业生态链。
的头像 机器人大讲堂 发表于 08-15 16:58 96次 阅读
三大驱动因素推动发展,全球AI市场规模持续增长

去第六届上海科博会“玩转”5G、垃圾分类、人工智能等展品

本届科博会根据两个“3+X”的布展思路,在展示内容安排上以“社区书院”“科创上海”和“青少年科普教育....
的头像 人工智能学家 发表于 08-15 16:34 154次 阅读
去第六届上海科博会“玩转”5G、垃圾分类、人工智能等展品

距离人工智能普及化还有多远

引爆AI技术的Alphago与李世石的“人工智能”世纪大战已经过去三年,与三年前Alphago大胜李....
发表于 08-15 16:15 26次 阅读
距离人工智能普及化还有多远

人工智能其实带来的不是失业而是就业

未来几年,由人工智能引发的失业潮将会令人恐慌。但正如每一次工业革命一样,技术的变革将会替换到一些行业....
发表于 08-15 16:12 34次 阅读
人工智能其实带来的不是失业而是就业

微软投向OpenAI投资10亿美元 推动通用人工智能的研究

物理学家霍金、微软创始人比尔·盖茨、硅谷“钢铁侠”埃隆·马斯克是“AI威胁论”三位最著名的鼓吹手。然....
的头像 视听前线音响短评 发表于 08-15 15:54 321次 阅读
微软投向OpenAI投资10亿美元 推动通用人工智能的研究

在“5G”加持,人工智能、汽车会碰撞出怎样的火花?

随着中国、韩国、英国、美国等国家均已启动5G技术的商用,自动驾驶和智能网联汽车在“5G时代”也有了加....
的头像 视听前线音响短评 发表于 08-15 15:54 508次 阅读
在“5G”加持,人工智能、汽车会碰撞出怎样的火花?

2019世界人工智能大会将在金山区的华东无人机基地举行

2019世界人工智能大会,将成为AI创新创业项目落地应用的“加速器”。
的头像 视听前线音响短评 发表于 08-15 15:49 187次 阅读
2019世界人工智能大会将在金山区的华东无人机基地举行

王者荣耀也是与人工智能息息相关的!

据消息报道,《王者荣耀》作为当下最火爆的游戏之一,受到的关注自然也是非常大的,最近王者荣耀可以说是又....
的头像 Midifan 发表于 08-15 15:36 133次 阅读
王者荣耀也是与人工智能息息相关的!

RPA是企业在人工智能时代抢占先机的关键

2019年,RPA突然间就火了... UiPath在2019年5月宣布获得5.8亿美元融资,估值70亿美元,成为国际AI领域估值最高的企业之一...
发表于 08-15 15:01 149次 阅读
RPA是企业在人工智能时代抢占先机的关键

构建机器学习产品必需的数学背景

必读  我们该如何学习机器学习中的数学...
发表于 08-15 11:44 27次 阅读
构建机器学习产品必需的数学背景

行业 | 运行在GPU上的四种不同的推理方式

从Alexa和谷歌地图导航等语音助手,到Bing的对话搜索,人工智能已经成为许多人日常生活的一部分。
的头像 人工智能学家 发表于 08-15 11:07 263次 阅读
行业 | 运行在GPU上的四种不同的推理方式

如何提前预防机器学习模型受到攻击产生严重的后果?

机器学习是人工智能的核心,也是使计算机具有智能的根本途径。
的头像 人工智能学家 发表于 08-15 10:53 91次 阅读
如何提前预防机器学习模型受到攻击产生严重的后果?

关于人工智能未来的发展趋势

与其他技术和软件工具不同,人工智能主要依赖专业的处理器。为了适应人工智能的复杂需求,芯片制造商将研发....
发表于 08-15 10:11 69次 阅读
关于人工智能未来的发展趋势

人工智能与量子计算将碰撞出无限火花

人工智能的进步令人惊叹,但依靠现在的计算机及传统算法,已无法满足人工智能的研究甚至发展需求。而量子计....
发表于 08-15 09:59 31次 阅读
人工智能与量子计算将碰撞出无限火花

第三代AI要处理“可解释性”问题

语言是人类智能的重要标志,在人类文明中的地位与作用毋庸置疑,自然语言处理,通俗地解释就是“让计算机学....
的头像 人工智能学家 发表于 08-15 09:41 206次 阅读
第三代AI要处理“可解释性”问题

神奇的GAN,基于生成的探索

科学家认为机器学习和人工智能所运用的前沿技术,是一种研究科学的全新方法。
的头像 人工智能学家 发表于 08-15 09:36 154次 阅读
神奇的GAN,基于生成的探索

可借助日常物品来打造新工具的机器人

得益于技术和相关算法的进展,机器人正变得越来越聪明。佐治亚理工学院的一支研究团队,刚刚开发出了一款能....
发表于 08-15 09:31 26次 阅读
可借助日常物品来打造新工具的机器人

AI赌神赢的背后,只是8天的训练

Facebook与CMU学Noam Brown、Tuomas Sandholm的最新研究成果——Pl....
的头像 人工智能学家 发表于 08-15 09:06 101次 阅读
AI赌神赢的背后,只是8天的训练

Twitter推出一些新的举措,该公司正在测试让我们拭目以待吧!

Twitter正在计划推出一些新的举措,让用户更容易看到与特定主题相关的内容,而不是一定要关注哪些用....
的头像 电磁兼容EMC 发表于 08-15 09:04 114次 阅读
Twitter推出一些新的举措,该公司正在测试让我们拭目以待吧!

“下半场”来临,中国彩电行业亟待凤凰涅槃

新型显示技术在与人工智能、物联网、5G、4K/8K超高清等技术融合发展,电视机的属性正在发生改变。
的头像 流媒体网 发表于 08-14 17:02 446次 阅读
“下半场”来临,中国彩电行业亟待凤凰涅槃

机器学习算法帮助我们做出更好的决定

机器学习算法,可以帮助我们做出更好的决策,通过将人类的偏见最小化,使用更完整的数据集,或者弥补我们决....
的头像 视听前线音响短评 发表于 08-14 16:47 119次 阅读
机器学习算法帮助我们做出更好的决定

人工智能和机器学习怎么应用于医学?

经美国食品药品监督管理局(FDA)批准后,第一批可穿戴式数字健康监测仪目前刚刚上市,并集成在诸如智能手表之类的消费产品中。...
发表于 08-13 07:22 17次 阅读
人工智能和机器学习怎么应用于医学?

人工智能后续以什么形式发展?

从2014年开始,人工智能逐渐成为科技领域最热门的概念,被科技界,企业界和媒体广泛关注。作为一个学术领域,人工智能是在1956年...
发表于 08-12 07:53 110次 阅读
人工智能后续以什么形式发展?

AI发展对芯片技术有什么影响?

现在说AI是未来人类技术进步的一大方向,相信大家都不会反对。说到AI和芯片技术的关系,我觉得主要体现在两个方面:第一,A...
发表于 08-12 06:38 201次 阅读
AI发展对芯片技术有什么影响?

AI在智能手机有什么玩法?

下一波新体验将源自支持智能手机中 AI 新使用情形的应用,其中包括语言处理、人类活动预测和增强型数据加密等。...
发表于 08-12 06:35 131次 阅读
AI在智能手机有什么玩法?