0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

人工智能破译三千年前的古文字

Hf1h_BigDataDig 来源:YXQ 2019-07-16 10:42 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

1886年,英国考古学家亚瑟·伊万斯偶然间发现了一块刻印着未知语言的石头。得知这块石头来源于地中海的克里特岛后,伊万斯立马动身前往此处以搜寻更多证据。在那里,他马上就发现了许多笔迹相似的石碑,这些石碑能追溯到公元前1400年左右,这些刻字也就成为目前发现的最早的书写形式之一。伊万斯表示,这种线形形式是从早期艺术中粗糙的线条画演变而来,在语言史上占有重要地位。

伊万斯等人后来证实,石碑上的刻字是两种不同的文字系统。稍古老的一种称为A类线形文字,可以追溯到公元前1800年至1400年,此时克里特岛还处于青铜时代的米诺文明阶段。时间上更近一点的文字系统称为B类线形文字,公元前1400年后才出现,此时的克里特岛正被希腊大陆的迈锡尼人统治着。

许多年来,伊万斯等人一直试图翻译这些古老的文字,但都无疾而终。

这个问题直到1953年,一个名叫迈克尔·文特里斯的业余语言学家成功翻译B类线形文字之后,才得到解决。

两个假设

文特里斯的成功建立在两个决定性突破上。第一,他假设B类线形文字中重复出现的词语是克里特岛的地名——这在其后被证明是正确的。第二,他假设这些刻字是古希腊语的早期形式——这让他能够立即翻译出B类线形文字的其他部分。在翻译过程中,文特里斯表示,古希腊语的书面表达形式比之前预想的还要早几个世纪。

文特里斯的工作成果是一项巨大的成就。但像A类线形文字这样的更为古老的文字系统,到今天为止仍然是语言学上一个亟需解决的难题。

通过机器学习绘制特定语言的联结

不难想象,近年来机器翻译的最新进展对此有所帮助。

短短几年内,注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。尽管翻译质量有待提高,但这也提供了思考语言的一个全新角度。

来自麻省理工学院的罗家明(音译)和雷吉纳·巴尔齐莱,以及来自加州山景城谷歌人工智能实验室的曹源(音译),由他们组成的团队研发出了能够翻译失传语言的机器学习系统,并且使其翻译B类线形文字——第一次完全自动翻译——证明了系统可行性。

他们所利用的方法与标准机器翻译技术有着显著区别。首先需要知道,不管哪种语言,机器翻译的关键都在于认识到文字间联结的相似性。因此整个过程是从绘制特定语言的联结开始,这需要庞大的文本数据库,机器在这个文本数据库中查验每个字符与其他字符在多大频率上联结在一起。这种表现非常独特,它在多重参数空间上定义了这个词语。实际上,这个词语可以视为空间内一个向量,这个向量在机器对任何语言的翻译结果中都起到重要的约束作用。

这些向量遵循着简单的数学规则,举例而言,国王(king)-男性(man)+女性(woman)=王后(queen)。所以,一句话可以认为是由一系列向量排列形成的一条跨越空间的轨迹。

完全对应地翻译

机器翻译的关键洞见在于,不同语言中的词语在各自的参数空间内占据着相同位置。这使得一种语言能够完全对应地被翻译成另一种语言。在这个意义上,翻译句子就变成寻找那些跨越空间的相似轨迹的过程,机器甚至不需要“知道”句子的具体含义。

这个过程需要依赖大数据集。但几年前,德国的一个研究者团队利用小型数据库协助翻译缺少大型文本数据库的稀有语言,其中的窍门在于找到一种除数据库之外能够约束机器的方法。

利用语言进化的约束

罗家明团队已经进一步展示了机器是怎样翻译一门失传语言的,他们使用的约束与语言随时间的变化相关。任何语言都是以某种方式变化的,比如,亲属语言中的符号以相似的分布出现,相关词语有相同顺序的字符,等等。有了这些规则的约束,如果已知某种古老的语言形式,那么翻译就会轻松许多。

罗家明团队利用这项技术测试了两种失传语言,B类线形文字和乌加里特语。语言学家已经知道,古希腊语的早期形式是由B类线形文字编码得到,而在1929年发现的乌加里特语则是希伯来语的早期形式。

利用这些信息和语言进化的约束,罗家明团队研发的机器能够以相当高的准确度完成上述两种语言的翻译。“我们能够正确地将67.3%的B类线形文字中的同源词翻译成对应的希腊语”,他们说,“据我们所知,本次实验是最早尝试自动翻译B类线形文字的。”而出色的工作成果将机器翻译提高到新的水平。但这也引发了关于其它失传语言的疑问——尤其是从未被翻译过的语言,如A类线形文字。

在这篇文章中,A类线形文字的缺席显而易见,罗家明团队甚至没有提及A类线形文字,但和所有语言学家一样,它肯定在他们心中挥之不去。不过可以确定的是,在A类线形文字能够被机器准确翻译之前,我们还需要一些重要的突破。举个例子,没人知道A类线形文字编码了哪种语言,将它翻译成古希腊语的尝试都失败了。如果不知道祖语言,新技术也起不了作用。

但是基于机器的方法存在一个明显的优势,机器可以快速而不知疲倦地对每种语言进行测试。因此罗家明团队或许可以用一种粗暴的方法攻克A类线形文字的翻译难关——尝试将它翻译成机器已经掌握的每种语言。如果最终成功,那一定是一项伟大的成就,一项足以另迈克尔·文特里斯赞叹不已的成就。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1813

    文章

    49783

    浏览量

    261889
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136271

原文标题:三千年前的古文字被AI破译,MIT和谷歌开发失传语言的机器翻译系统

文章出处:【微信号:BigDataDigest,微信公众号:大数据文摘】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    挖到宝了!人工智能综合实验箱,高校新工科的宝藏神器

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:30

    挖到宝了!比邻星人工智能综合实验箱,高校新工科的宝藏神器!

    家人们,最近在研究人工智能相关设备,挖到了一款超厉害的宝藏——比邻星人工智能综合实验箱,必须来给大伙分享分享!可☎(壹捌伍 柒零零玖 壹壹捌陆) 一、开箱即学,便捷拉满 这个实验箱真的是为使用者
    发表于 08-07 14:23

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能

    迅为RK3588开发板Linux安卓麒麟瑞芯微国产工业AI人工智能
    发表于 07-14 11:23

    最新人工智能硬件培训AI 基础入门学习课程参考2025版(大模型篇)

    人工智能大模型重塑教育与社会发展的当下,无论是探索未来职业方向,还是更新技术储备,掌握大模型知识都已成为新时代的必修课。从职场上辅助工作的智能助手,到课堂用于学术研究的智能工具,大模型正在工作生活
    发表于 07-04 11:10

    高光谱成像技术:解锁墨书古文字的“科技密钥”

    引言: 4 月20日谷雨节气之际,我们迎来了第十六个联合国中文日;紧随其后的4月23日世界 读书日,则进一步凸显了文字与阅读对人类文明的意义。近年来,随着“中文热”在全球的持 续升温,国家主席多次
    的头像 发表于 06-26 15:53 1027次阅读
    高光谱成像技术:解锁墨书<b class='flag-5'>古文字</b>的“科技密钥”

    小米智能插座评测拆解 10年前的小米智能插座 用料比现在99%的同类产品都能打

    小米智能插座评测拆解 10年前的小米智能插座 用料比现在99%的同类产品都能打
    的头像 发表于 06-12 09:28 3536次阅读
    小米<b class='flag-5'>智能</b>插座评测拆解 10<b class='flag-5'>年前</b>的小米<b class='flag-5'>智能</b>插座 用料比现在99%的同类产品都能打

    开售RK3576 高性能人工智能主板

    ,HDMI-4K 输出,支 持千兆以太网,WiFi,USB 扩展/重力感应/RS232/RS485/IO 扩展/I2C 扩展/MIPI 摄像头/红外遥控 器等功能,丰富的接口,一个全新八核拥有超强性能的人工智能
    发表于 04-23 10:55

    斯坦福大学发布《2025 人工智能指数报告》

    20254月,斯坦福2025HAI报告重磅发布。由李飞飞联合领导的斯坦福大学以人为本人工智能研究所(StanfordHAI)发布了《2025人工智能指数报告
    的头像 发表于 04-11 11:08 1387次阅读
    斯坦福大学发布《2025 <b class='flag-5'>年</b><b class='flag-5'>人工智能</b>指数报告》

    广电计量亮相2025广州市人工智能与企业数据治理研讨会

    的深度融合,共同探讨数智融合的前沿趋势与发展机遇,吸引了广州重点行业企业、电子信息行业、人工智能与大数据产业的200多名企业代表参会,为广州这座千年商都焕新升级注入“数智动能”。
    的头像 发表于 03-25 11:44 807次阅读

    2024年前视摄像头市场分析

    据佐思汽研统计,2024年前视摄像头安装量达1733万颗,同比增长29.8%。平均单车安装量由2023的0.6颗增至0.8颗。预计2025年前视摄像头安装量将超2550万颗,同比增长47.2%,最新发布的比亚迪天神之眼C方案有
    的头像 发表于 03-03 10:24 1477次阅读
    2024<b class='flag-5'>年前</b>视摄像头市场分析

    人工智能大模型年度发展趋势报告

    202412月的中央经济工作会议明确把开展“人工智能+”行动作为2025要抓好的重点任务。当前,以大模型为代表的人工智能正快速演进,激发全球科技之变、产业之变、时代之变,
    的头像 发表于 02-13 10:57 1548次阅读
    <b class='flag-5'>人工智能</b>大模型年度发展趋势报告

    2025人工智能会发生哪些变化

    2025人工智能会发生哪些革命性的变化?斯坦福大学以人为中心的人工智能研究所的领先专家表示,2025 人工智能的一个主要趋势是协作
    的头像 发表于 01-21 11:28 1586次阅读

    中科曙光荣获2024年度人工智能卓越奖

    近日,第八届海南人工智能与大数据产业发展大会在海口市召开,中科曙光荣获“2024年度人工智能卓越奖”,中科曙光控股公司中科天玑凭借天罗舆情监测分析系统荣获“2024年年度优秀数据产品奖”。
    的头像 发表于 01-07 09:36 1157次阅读

    2024年前三季度半导体收入增长26%

    的持续攀升。 数据显示,2024年前三个季度,全球半导体市场的总收入约为4940亿美元,这一数字已经超过了2020全年半导体市场的总收入,显示出半导体市场的蓬勃发展和强劲增长势头。 特别值得一提的是,在人工智能领域的推动下,全
    的头像 发表于 12-25 10:01 1474次阅读

    2025六大技术趋势:空间计算、人工智能、IT升级……

    12月13日,德勤发布《2025技术趋势》(TechTrends2025)报告,深入探讨了人工智能在日常生活中逐步应用的广度与深度。报告指出,未来人工智能将成为我们生活中的核心组成部分。届时
    的头像 发表于 12-18 13:15 2428次阅读
    2025<b class='flag-5'>年</b>六大技术趋势:空间计算、<b class='flag-5'>人工智能</b>、IT升级……