0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“现代版罗塞塔石碑”,MIT&谷歌大脑用AI破解失传的古代文字

jmiy_worldofai 来源:YXQ 2019-07-10 17:25 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

漫漫尘埃下,掩藏了许多曾经辉煌灿烂古代文明,但我们现在却无法清晰地知道,这些地方究竟发生了什么。

搞懂这些历史的最佳方式,就是找到他们的文字记载。However,记载文字的石碑可以被考古学家们挖出来,但这些古文字究竟啥意思,现代的人们看不懂,需要语言学家们耗尽青春来推测。

现在,MIT CSAIL和谷歌大脑的研究者出手了,他们用机器学习破译了乌加里特文和线性文字B。

△ 乌加里特王宫

乌加里特文,Ugaritic,是一种楔形文字,属于闪米特语族。从字面上来看,就知道它是一个叫做乌加里特(Ugarit)的文明使用的语言,这个文明位于当今地中海沿岸的叙利亚,在公元前6000年前后就初现踪迹,在公元前1190年前后灭亡。

△ 乌加里特文

线性文字B,Linear B,由一种人类还没有破译出来的线性文字A演化而来,主要存活于公元前1500年到公元前1200年的克里特岛和希腊南部,是希腊语的一种古代书写形式。

△ 线性文字B

研究者们利用同一语族内不同语言之间的联系,用机器学习的方法来破译这两种失传的语言,这是破译古代语言的新方法,也将对罗曼语族的语言学研究有巨大的影响和提升。

这个方法让许多人惊叹:

简直是现代版的罗塞塔石碑!

PS,罗塞塔石碑是一块用3种语言写了同一个内容的石碑,帮助语言学家们读懂古文字。

希望能先把动物和植物的语言破译了,可以发现打开新世界的大门。

人类语言总相通

这项研究的核心方法,是借助人类语言的相似性。

比如,知乎用户@拉队短 在介绍欧洲语言相似性的时候,举了这么个栗子:

句子“那是六月末潮湿阴沉的一个夏日。”

英语:It was a humid, grey summer day at the end of June.

丹麦语:Det var en fugtig, grå sommerdag i slutningen af juni.

瑞典语:Det var en fuktig, grå sommardag i slutet av juni.

挪威语:Det var en fuktig, grå sommerdag i slutten av juni.

冰岛语:Það var rakur, grár sumardagur í lok júní.

看,长得差不多嘛,毕竟同属印欧语系日耳曼语族,单词的分布位置、句子的结构都很相似,如果你能看懂一种语言,就能大致猜测和它“血缘”关系近的另一种语言。

模型训练

为了破解这两种文字,研究者们提出了一个基于字符的seq2seq模型。

模型主要包含通用字符嵌入、剩余连接、单调排列正则化几个部分。

其中,线性文字B的字母和希腊文需要进行对应。

之后,借助神经解密算法,在具有不同语言特征的多种语言中提供强大的性能。

你懂的语言,和你不懂的语言

在算法模型的基础之下,需要的语料库除了待破解的乌加里特文和线性文字B,还需要一些现在的人类能看懂的语言。

研究团队选择了罗曼语族的数据库,包含意大利语、西班牙语和葡萄牙语三种语言的同源语音转录,需要对它们进行同源检测。

因此,数据集就用到上面这些,Symbols指的是语言中的字符,Token则是语言学中类似于单词的存在。

准确率

运行成果还不错,乌加里特文在无噪声条件下优于现有方法3.1%,在有噪声条件下优于现在的贝叶斯方法5.5%。

而线性文字B,在无噪声条件下准确率高达84.7%,在更具挑战性的LinearB名称数据集中达到67.3%的准确度。

在罗曼语族同源识别任务中,西班牙语准确度提升3.4%,葡萄牙语提升1.6%。

线性文字B的祖先,线性文字A还没有被人类破译,它被誉为考古界圣杯。

未来,在这项研究起作用的情况下,或许可以像借助罗曼语族三种语言的数据库一样,直接用机器借助其他已知的人类语言,实现暴力破解。

想破脑壳的语言学家们,可以把工作重心放到别的事情上了。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112217
  • MIT
    MIT
    +关注

    关注

    3

    文章

    255

    浏览量

    25057

原文标题:MIT&谷歌大脑用AI破解失传的古代文字,被称“现代版罗塞塔石碑”丨ACL 2019

文章出处:【微信号:worldofai,微信公众号:worldofai】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ASML与电子签署谅解备忘录

    近日,荷兰光刻机巨头阿斯麦(ASML)与印度集团旗下电子(Tata Electronics)正式签署谅解备忘录。ASML将支持
    的头像 发表于 05-18 10:57 1283次阅读

    洲明集团智显大脑AI峰会圆满收官

    4月17日,北京国家体育场(鸟巢)金色大厅,洲明集团“智显大脑 AI峰会”主题活动在此隆重举办。
    的头像 发表于 04-20 17:52 1623次阅读

    德与施瓦茨和KT联合演示AI增强的无线传输性能

    在6G AI概念验证联合演示中,德与施瓦茨(以下简称“R&S”)CMX500一体化测试仪显示基于AI的无线传输相比传统技术可显著提升下行吞吐量。演示还直观展现了这一性能提升如
    的头像 发表于 03-16 11:28 1598次阅读
    <b class='flag-5'>罗</b>德与施瓦茨和KT联合演示<b class='flag-5'>AI</b>增强的无线传输性能

    没有AI大脑,别叫全屋智能

    打破伪智能困境,美的为家装上AI大脑MevoX
    的头像 发表于 03-16 09:13 1275次阅读
    没有<b class='flag-5'>AI</b><b class='flag-5'>大脑</b>,别叫全屋智能

    姆功率半导体技术助力应对AI数据中心电力难题

    随着AI的惊人发展,支撑其运转的数据中心的电力消耗量急剧攀升,这一严峻课题也日益突出。如何破解这一难题,已成为产业发展的关键。本文将聚焦姆SiC等功率器件及解决方案,并介绍其在革新服务器电源系统、助力数据中心提升算力与能效方面
    的头像 发表于 02-25 09:42 1020次阅读
    <b class='flag-5'>罗</b>姆功率半导体技术助力应对<b class='flag-5'>AI</b>数据中心电力难题

    气密性检测仪怎么-岳信仪器

    ”进行质量检验。那么,这种设备究竟该怎么?下面为您详细介绍基本操作流程。首先:准备工作在使用检测仪前,首先要确认待测尾已正确安装在电缆或壳体上。检查仪器电源是否
    的头像 发表于 01-24 17:14 304次阅读
    尾<b class='flag-5'>塞</b>气密性检测仪怎么<b class='flag-5'>用</b>-岳信仪器

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    德与施瓦茨宣布推出新频段 R&amp;amp;amp;S ZNB3000 矢量网络分析仪,频率高达 54 GHz

    R&amp;SZNB3000以业界领先的测量速度、出色的扩展能力及一流射频性能,为中端矢量网络分析仪市场树立了新标杆。随着高频型号的加入,R&amp;SZNB3000将覆盖更广泛的应用场景。德与施
    的头像 发表于 12-04 17:04 898次阅读
    <b class='flag-5'>罗</b>德与施瓦茨宣布推出新频段 R&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;S ZNB3000 矢量网络分析仪,频率高达 54 GHz

    英伟达发布 NVQLink 开放系统架构;国内首个汽车芯片标准验证平台投入使用

    计算机相连接。   英伟达首席执行官黄仁勋在主题演讲中表示,该系统有望奠定混合量子-经典计算系统的技术基础,并将其比作“量子时代的石碑”(Rosetta Stone)。   “在
    发表于 10-29 10:33 1417次阅读

    麦斯MST8011AI-21系列晶振:自动驾驶的高精度“节拍器”

    在自动驾驶技术飞速发展的今天,车辆的智能化程度越来越高,而高精度的传感器和稳定的信号处理系统成为了自动驾驶汽车的“眼睛”和“大脑”。 麦斯MST8011AI-21系列晶振:自动驾驶的高精度“节拍器
    的头像 发表于 09-30 14:53 925次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+化学或生物方法实现AI

    21世纪是生命科学的世纪,生物技术的潜力将比电子技术更深远----- 里卡多-戈蒂尔 半导体实现AI应该没什么疑问了吧?化学、生物怎么实现AI呢? 生物大脑是一个由无数神经元通过突触连接而成的复杂
    发表于 09-15 17:29

    【「AI芯片:科技探索与AGI愿景」阅读体验】+可期之变:从AI硬件到AI湿件

    想到,除了研究大脑的抽象数学模型外,能否抛弃传统的芯片实现方式,以化学物质和生物组件、材料及相关现象来构建人工神经网络或提取其功能来用于AI处理,甚至直接生物体来实现AI功能,这就是
    发表于 09-06 19:12

    德与施瓦茨发布全新UDS系列数字万

    德与施瓦茨(以下简称“R&amp;S”)推出全新R&amp;S UDS数字万表系列。该紧凑型仪器系列可同步显示三项测量结果,配备多样化测量功能及多种远程控制接口。产品提供5½位和6
    的头像 发表于 07-03 18:18 1766次阅读

    怎么labview实现语音转文字

    请问怎么labview实现语音转文字
    发表于 07-01 16:27

    飞腾软件支持平台即将正式上线AI智能大脑

    遇到棘手的技术问题却无人解答?搜索文档耗时长?飞腾软件支持平台即将正式上线AI智能大脑,让技术难题实现“秒回应”!
    的头像 发表于 06-13 11:37 1320次阅读