0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google:将AI 应用到语言翻译上,进而弥平语言不通的问题

yrlT_lianggezhi 2018-01-29 14:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Google 的使命是汇集全球资讯,并且让所有人都能使用这些资讯,不过要能理解各式资讯,最困难的就是语言隔阂,因此在东京举办#MadeWithAI 亚太区媒体活动请来了Google 语言研究计画总经理Linne Ha 来谈谈怎么将AI 应用到语言翻译上,进而弥平语言不通的问题。

受惠于智慧型手机的普及,网路人口在最近这几年高速成长,不过网路上有接近50% 的内容仍是以英文为主,对于非以英文为母语的人来说,想要获得资料就多了一道门槛,能让每个人自在的用自己的原生语言在网路上搜集或提供资料是Google 的目标,因此在推动语言翻译或发展上Google 做了非常多的努力。

▲Google语言研究计画总经理Linne Ha。

推动各种语言上网,统一码(Unicode)是重点

不同语言要能在网路上流动,最重要的就是该语言要能被阅读,若是出现乱码或空白文字就容易成为阅读或理解的障碍,因此Google 长期和统一码(Unicode)联盟合作,鼓励更多国家利用统一码的编码系统上网,例如Google 大力鼓励缅甸不要再使用非统一码的字型。

有了统一码这项文字系统后,电脑文字编码就有了一套标准,下一个挑战就是要确保自行能正确地被转为网路或手机上的文字,去年Google 推出开放的Noto 字型,可以支援800 种语言、11 亿个文字,可呈现各式各样的文字。

但这样还不够,虽然文字能呈现,但却不是每个人都知道如何输入文字,因此除了Gboard 提供300 多种键盘、 97 种手写系统、语音输入等方法让使用者可以依照自己方便的方式来输入文字。

在开发手写系统上,Google 也花了一番心力,由于每个人的字迹都不同,因此Google 导入人工智慧技术,搜集很多自愿者的手写范本,让机器学习来辨认文字和书写风格,进而达到更精确的手写辨识。语音输入方面则是透过GOOG-411 的服务来搜集语音资料,类似我们的查号台,当有人打电话进去问问题查电话,GOOG-411 就会帮忙转接,在这样的过程中Google 建立了大量的语音资料库范本,英文语音搜集还算满顺利的。不过其他语言就没这么容易了,虽然说Google 有和专门经营文字和语音资料库的业者合作,但有些语言本身的资料库就较少,例如广东话,因此Google 又开启了下一阶段的任务。

语音搜寻实验,搜集准确的语音资料

既然缺乏语音资料,Google 就开始想方法来搜集各种语言的语音讯息,比方说2010 年Google 推出了荷兰语的Word of Mouth 计画,提供参与实验的使用者手机来搜集他们和亲友间的对话样本,进而得到准确的语音资料。

有了语音资料之后下个问题则是口音和俗语,关于这方面的资料目前Google 仍正在努力发展中,不过经过过去这么长一段时间的努力,到2012 年之后,语音搜寻已可支援到50 种语言,Google 也导入了深度神经网路提升语音辨识的准确性,今年则再新增30 多种的语音输入,甚至包含了非洲两种主要语言,斯瓦希里语(Swahili)和阿姆哈拉语(Amharic),对于弥平语言隔阂来说,这是一个重要的里程碑。

怎么将机器学习应用在语音服务上

既然有了机器学习这项技术,也就意味着Google 能透过演算以及建构更有效的模型来解决语音辨识问题。

Google 这回用了一个超级低成本的预算(2000 美金)来增加孟加拉语的文字转语音服务,首先先准备一套麦克风、USB 转接器和前置声音放大器,并建立一组便携式的录音工作室「ChitChat」让实验者可以录音。

工具有了,下一步就是找来15 名孟加拉的Googler,录制了2000 多个从维基百科撷取出来的孟加拉语和英语,实验者每隔30 分钟至60 分钟就录制250 多个句子,平衡的混音成几个不同的声音后,再交给Google 社群投票看看大家最偏好哪一个声音,最终产出的声学模型刚好就可以代表平均型的人声,成功推出了孟加拉语的文字转语音服务。

除了把更多语言放到网路上,Google 也着手发展方言领域,像是英文就分成美式英文、英式英文、澳洲英文等等,最近Google 正着手处理新加坡式英语,另外,西班牙语、阿拉伯语也是Google 努力的方向。

Google 的中文语音什么时候会有更多突破?

至于***人最常用的中文呢?Google 语言研究计画总经理Linne Ha 不讳言,中文真的是很有挑战的语言,比方说中国人说着中文、写着简体中文,***人说也说着中文、但写的是繁体中文,香港人写的也是繁体中文、不过说的是广东话,繁体中文、简体中文、广东话间各有连结但又不尽相似。

过去Google 是使用「单一语言模式」来处理,比方说***人说的中文就套用繁体中文资料库,香港人说广东话则套用另外一个繁体中文资料库,但这样的语音辨识效果发展有限,近期Google 尝试着将相近的语言加进同一个模型中,目前的实验结果还不错。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1817

    浏览量

    60659
  • AI
    AI
    +关注

    关注

    91

    文章

    41479

    浏览量

    302803
  • 语言
    +关注

    关注

    1

    文章

    97

    浏览量

    24879

原文标题:【Google 谈人工智慧】有了机器学习后,语言还会是隔阂吗

文章出处:【微信号:lianggezhizi,微信公众号:两个质子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Cadence 与 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 扩展 AI 驱动的芯片设计

    合作,利用 Google Cloud 的 Gemini 模型优化 Cadence® ChipStack™ AI Super Agent。此次合作使 Cadence 站在向代理式设计自动化转型的前沿
    的头像 发表于 04-24 13:22 170次阅读

    Cadence与Google合作,利用ChipStack AI Super Agent在Google Cloud扩展AI驱动的芯片设计

    设计 AI 计算软件领域的行业领导者楷登电子(美国 Cadence 公司,NASDAQ:CDNS)近日宣布与 Google Cloud 达成战略合作 ,利用 Google Cloud
    的头像 发表于 04-24 10:36 1470次阅读

    ETHERNET IP转MODBUS RTU解决注塑生产线语言不通案例

    ETHERNET IP转MODBUS RTU解决注塑生产线语言不通案例 我是一条服役了八年的注塑生产线,负责为某汽车零部件厂生产精密连接器外壳。我的“大脑”是一台罗克韦尔PLC,只懂EtherNet
    的头像 发表于 04-15 14:54 144次阅读
    ETHERNET IP转MODBUS RTU解决注塑生产线<b class='flag-5'>语言不通</b>案例

    亮亮视野联合智谱AI推出AR+AI会议翻译系统

    大模型能力,可支持54种语言实时翻译,延迟小于1秒,单次续航8小时,并可7×24小时稳定运行。这标志着国际会议翻译从传统设备和人工依赖,迈向更高效率、更低成本、更强普惠性的 AR+AI
    的头像 发表于 03-30 11:39 517次阅读

    视美泰发布AI即时翻译机解决方案,硬核配置+多语种覆盖破解跨语言沟通难题

    在全球化深入推进与AI技术规模化商用的双重驱动下,跨语言沟通需求正迎来爆发式增长。近日,视美泰正式发布AI即时翻译机解决方案,以“核心硬件+智能算法+多模态交互”的完整技术矩阵,依托在
    的头像 发表于 12-03 10:50 1308次阅读
    视美泰发布<b class='flag-5'>AI</b>即时<b class='flag-5'>翻译</b>机解决方案,硬核配置+多语种覆盖破解跨<b class='flag-5'>语言</b>沟通难题

    智能“翻译官”:MODBUS转PROFIBUS网关,解锁搅拌站无人装载新纪元

    智能“翻译官”:MODBUS转PROFIBUS网关,解锁搅拌站无人装载新纪元 在工业自动化的浪潮中,数据协议的“语言不通”常常成为系统联通的绊脚石。在一家现代化搅拌站内,就上演了这样一场精彩的“沟通
    的头像 发表于 11-21 14:38 373次阅读
    智能“<b class='flag-5'>翻译</b>官”:MODBUS转PROFIBUS网关,解锁搅拌站无人装载新纪元

    告别协议“语言不通”!Modbus转Profinet伺服电机接入的终极解决方案

    在自动化产线的调试现场,您是否曾为不同协议设备间的“语言障碍”而焦头烂额?当手头的优质伺服电机仅支持Modbus,而您的主控系统却基于Profinet,这道协议鸿沟是否让您夜不能寐?别担心
    的头像 发表于 10-22 15:05 350次阅读
    告别协议“<b class='flag-5'>语言不通</b>”!Modbus转Profinet伺服电机接入的终极解决方案

    声智科技AI翻译耳机重塑智能听觉体验

    在日益紧密的全球化浪潮中,跨语言沟通的障碍正在被前沿的声学AI技术逐步瓦解。声智AI翻译耳机,凭借深厚的声学AI积累,率先实现了“跨语种音色
    的头像 发表于 10-21 15:28 1184次阅读
    声智科技<b class='flag-5'>AI</b><b class='flag-5'>翻译</b>耳机重塑智能听觉体验

    国庆出国游,时空壶新T1翻译机,首个端侧模型突破助力跨语言交流

    的旗舰机型,最大亮点是搭载业内首个端侧AI翻译模型。这一模型原本依赖云端算力的复杂AI翻译模型,通过先进的模型剪枝、量化压缩等技术,巧妙部
    的头像 发表于 09-12 12:20 1198次阅读
    国庆出国游,时空壶新T1<b class='flag-5'>翻译</b>机,首个端侧模型突破助力跨<b class='flag-5'>语言</b>交流

    工业自动化中的协议转换:Modbus RTU转Profinet网关在涡街流量计与西门子PLC通信中的应用

    在工业自动化领域,实现不同协议设备间的无缝通信是提升生产效率的关键。当涡街液体流量计这类高精度仪表需要与西门子PLC的Profinet网络对接时,Modbus RTU转Profinet网关便成为了一座“翻译桥梁”,两种语言不通
    的头像 发表于 07-30 16:41 800次阅读
    工业自动化中的协议转换:Modbus RTU转Profinet网关在涡街流量计与西门子PLC通信中的应用

    水表界的“翻译官”:让CCLinkIE和Modbus TCP“无障碍聊天”!

    在水处理车间,工程师们常遇到这样的尴尬:先进的控制系统用着“高速实时语”CCLinkIE,而老资格的水表却坚持说“经典通用语”Modbus TCP。两者“语言不通”,数据传输出现“鸡同鸭讲”的窘境
    发表于 07-10 15:43

    CC-Link IE 转 Modbus TCP,阀门通讯的“双语翻译官”

    在工业自动化现场,设备间的“语言不通”是工程师们时常遇到的挑战。例如,一套先进的控制系统可能采用高速的 CC-Link IE 网络,而现场大量的阀门、仪表却只支持经典的 Modbus TCP 协议
    的头像 发表于 07-09 09:46 686次阅读

    Modbus TCP转Profibus网关如何快速把流量计接入到DCS?

    在工业自动化领域,设备间的协议互通往往如同语言不通的对话者,需要一位“翻译官”才能实现高效协作。本文围绕Modbus TCP转Profibus网关的应用,解析如何通过这一技术桥梁,
    的头像 发表于 07-07 16:50 696次阅读
    Modbus TCP转Profibus网关如何快速把流量计接入到DCS?

    CC\\-Link IE “牵手” DeviceNet:让你的压力变送器老树开新花!

    对工程师来说,少踩坑、多干活、数据稳,才是硬道理。下次再遇上设备“语言不通”的事儿,不妨试试这招“协议翻译术”,说不定能解锁新副本。
    发表于 06-13 14:05

    【教程】使用NS1串口服务器对接智普清言免费AI语言模型

    AI语言模型可以帮助我们解决各种问题,如翻译、写文案、创作诗歌、解决数学问题、情感陪伴等等。今天教大家如何使用NS1串口服务器模块实现对接智普清言AI
    的头像 发表于 06-12 19:33 952次阅读
    【教程】使用NS1串口服务器对接智普清言免费<b class='flag-5'>AI</b>大<b class='flag-5'>语言</b>模型