0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里研发全球首个实时翻译直播

hl5C_deeptechch 来源:DeepTech深科技 作者:DeepTech深科技 2020-10-30 10:28 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近几年来,直播电商到处开花,但绝大多数都是国内的中文直播。如果想买外国电商主播推荐的商品,语言不通怎么办?

这一难题已被阿里巴巴(下称 “阿里”)攻克,阿里速卖通是面向全球海外消费者设立的电商平台,它和淘宝一样,也面向所有终端消费者,但区别是速卖通是面向全球 200 多个国家和地区的电商平台。

直播电商动辄 “几亿元带货” 的高歌猛进,也让跨境电商卖家对这一模式心动不已。然而,由于不同国家和地区的语言不同、文化不同、消费习惯也不同,所以要想在速卖通做直播,语言、物流、支付和技术都是非常复杂的系统,其中语言是最急需攻克的难题。

而在近日,阿里达摩院联合速卖通推出 AI 实时翻译直播,可同时进行中文到英、俄、西三种语向的翻译。据悉,这是全球首个启用 AI 实时翻译的电商直播,中国商家只需用中文一键开播,就能同时覆盖全球英语、西班牙语、俄语区的逾十亿人口。

“被迫” 研发的翻译引擎

两年前,速卖通开始探索直播,然而不同于淘宝直播的是,高峰期涌到直播间的用户来自 19 个国家,且说着不同的语言。当时,没有多元实时翻译,要么全部用英文直播,要么面向某一语言地区的用户专门用某种语言直播,比如法语或西班牙语。

据速卖通官方直播负责人陆嬿介绍,大部分实力雄厚的商家会请外国主播,而中小商家要么放弃,要么无声直播或用中式英语(Chinglish)尬播。数据显示,速卖通上近九成商家来自中国,而 82% 的中国商家因为语言困难而放弃跨境直播。

相比淘宝直播,速卖通直播更像一个婴儿,她需要强大的 “营养” 才能快速成长。这个营养就是能实现多译多功能的实时翻译工具。

在研发多译多之前,速卖通曾试用过现成的翻译引擎,但对直播间的翻译输出脚本来说,即便是质量最好的翻译引擎,其翻译结果也不合格。当时,还有俄罗斯和西班牙用户受邀参与评测,他们的评价也是完全听不懂。

速卖通研究后发现,这些翻译引擎之所以无法使用海外直播,其一是常规同传有专业的收音设备来保障翻译准确度。但是电商直播的环境很嘈杂,很多商家直接在档口就开始播,这样就难以保证较好的收音。

其二常规的同传词库是固定的,翻译工具得到有效训练后就能保证准确度。但是电商直播商品数量过亿,且每天都在变,根本没有办法让翻译工具快速学习。而且主播每个人都来自不同地方,有的说话还带有方言。并且有些主播语速很快,这都会极大地增加翻译难度。以上原因使得速卖通不得不自研引擎。

没有训练集,商家自己 “造”

随后,速卖通耗时 7 个月开发出中译英引擎,并于 2020 年 5 月份上线。上线后商家开播率已有 65%,今年 “828 大促” 期间线上 90% 的直播间都使用了该功能。

但仍存在不足,即使中译英能力做到极限,直播间里只有 30% 的用户能听得懂主播说的话,因为 AE 是一个跨全球平台,直播间里各种用户都有,英语用户最高比例是 30%,因此亟需推出中译多的功能。

两个月后,中译多功能完成,上线之后用户体验得到较高提升,部分店铺销量随之增加 3 倍。当时,很多商家直播间的购买转化,比达人直播的转化率还高。一些直播达人和海外商家发现后,也要求使用中译多功能,可是很多商家不说中文,为此速卖通增加了多译多功能,并于今年 7 月上线。

研发过程中也有很多困难。第一是跨团队协作,研发团队分布在美国、中国、新加坡三个国家。另外,60 多位研发人员几乎从未见过面,如何让他们快速建立信任、并快速推下去是一大难题。

第二是训练集的收集。跨境直播业务在全球都很少见,市面上没有现存训练集可以直接复用。好在阿里本身拥有较强的商家生态,很多商家都积极帮忙收集训练集。

第三是并发承载点。如果只做一场翻译,根本不会有压力。但是直播每天有上千场,翻译几国语言,这就需要几千个翻译,因此服务器的并发压力非常大。后来,阿里云对此做了改造,使得服务器得以承载得住。

第四个难题是自动化展示。多译多功能可自动识别用户种类,并展示出相应的语言,比如它能识别你是中国人,从而用中文展示主播说的话。之前大家看到同传效果都是在 PC 端上面,但是移动端很复杂,为此研发人员在其中做了不少自适应的工作。

自研更高效算法模型,可 “听懂” 主播口音

达摩院研发的统一多语言多领域融合模型,可把上百个语言,以及每个语言的多个领域压缩到一个神经网络模型中进行翻译,且翻译质量不变。据达摩院骆卫华介绍,达摩院 AI 翻译技术已创下多项业界第一,日均调用量超过 13 亿次,累计 3000 亿单词,可提供 214 种语言的高质量翻译。

据速卖通直播实时翻译产品负责人赵文倩介绍,速卖通上有上亿件商品、数百亿个商品相关的专业名词,对直播实时翻译技术的要求极高,需要克服口音不标准、直播环境复杂、商品专业名词多、新品新词更迭快等问题。

主要负责该难题的是阿里达摩院自然语言处理实验室的研究员樊楷,他表示为解决 AI 听不清、听不懂的问题,达摩院研发出更高效的语音算法模型,它不仅能在嘈杂环境中 “听清” 直播内容,还能 “听懂” 主播的口音。通过将多领域的知识融入翻译模型,该算法模型还能举一反三,无需重新训练便能快速学习不同场景里不断更迭的专业名词。

现在,速卖通平台支持 18 种语言,可以保证设计出来的频道和商品定位,能够符合当地文化,这种 “入乡随俗” 主要体现在以下三方面。

心有灵犀。速卖通上有大量多元的商品,除了给它们做分类,还得容易被搜到。因此平台得根据用户输入的词,马上就能获悉他的搜索目的。在多语言混合下,这种挑战会更大。以 “Case” 为例,它具有箱子和案子的双重意思,用户输入该词语时,到底想买什么,就需要结合具体情景。此外,同样的词在不同语言里的意思也不同,例如 “Basket” 在英语里有 “篮子” 的意思,在法语里还有 “球鞋” 的意思。

可面对数以亿计的商品搜索,全程由人工解决会很慢。为此,速卖通采用人工智能来解决,当然人工智能的初步训练是由算法工程师来解决。训练结束后,速卖通最终可做到无论用户输入什么,都能根据他前后搜索的词语,来知晓其购买意图。

了如指掌。速卖通希望用户能对商品了如指掌,因此商品标题需要承载很多内容。比如,这个商品是什么?怎么找到?为什么买?但是一些商家的标题,有的没有标点符号,标题手法上也没有特别规则。这一问题也可被人工智能解决,它会给标题加上标点符号,并可整理成当地用户熟悉的表达方式。

深信不疑。速卖通是跨境平台,很多商家位于海外,商品需要飘洋过海才能到用户手中。所以,用户对平台信用、商家信用和商品质量都有很高要求。而购买前想知道商品到底好不好?就只能通过用户评价去了解。但是用户评价非常多,涉及的语言种类也非常多。另外,用户会用各种不规范的语言来评价,比如 “Very gooooood” 这样的短语,有的评价还会用到表情符号。而采用 “多到多” 翻译引擎,上述问题也可得到解决。

由于疫情原因,2020 年很多此前从未涉足直播的商家,如中国山区的果农也开始直播卖货。有了速卖通,无论是江西赣南的脐橙、还是河北枣强的貂皮都可以走向全球各地。同样,中国用户也可以买到此前只有靠代购才能买到的产品。科技惠及的从来不只是某一个国家的用户,而是全世界。

-End-

原文标题:日均调用量超13亿次,阿里达摩院研发全球首个实时翻译直播

文章出处:【微信公众号:DeepTech深科技】欢迎添加关注!文章转载请注明出处。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38188

    浏览量

    296983
  • 人工智能
    +关注

    关注

    1813

    文章

    49757

    浏览量

    261676

原文标题:日均调用量超13亿次,阿里达摩院研发全球首个实时翻译直播

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    亮亮视野AR翻译眼镜亮相HICOOL 2025全球创业者峰会

    近日,“HICOOL 2025全球创业者峰会”在北京首都国际会展中心举办,亮亮视野AR翻译眼镜Leion Hey2成为全场焦点,获得持续关注,AR翻译眼镜市场热度随之走高。继日前为北京文化论坛
    的头像 发表于 10-23 17:34 974次阅读

    声智科技AI翻译耳机重塑智能听觉体验

    在日益紧密的全球化浪潮中,跨语言沟通的障碍正在被前沿的声学AI技术逐步瓦解。声智AI翻译耳机,凭借深厚的声学AI积累,率先实现了“跨语种音色与情感复刻技术”在实时翻译场景真实落地。不仅
    的头像 发表于 10-21 15:28 636次阅读
    声智科技AI<b class='flag-5'>翻译</b>耳机重塑智能听觉体验

    国庆出国游,时空壶新T1翻译机,首个端侧模型突破助力跨语言交流

    的旗舰机型,最大亮点是搭载业内首个端侧AI翻译模型。这一模型将原本依赖云端算力的复杂AI翻译模型,通过先进的模型剪枝、量化压缩等技术,巧妙部署于设备本地,并对神经网
    的头像 发表于 09-12 12:20 832次阅读
    国庆出国游,时空壶新T1<b class='flag-5'>翻译</b>机,<b class='flag-5'>首个</b>端侧模型突破助力跨语言交流

    翻译失去网络,时空壶新T1翻译机开创首个离线模型赋能全球沟通新体验

    全球化交流日益紧密的当下,跨语言沟通工具的重要性愈发凸显。近日,时空壶推出的T1翻译机凭借其强大的离线模型与便捷应用,成为市场焦点,为人们在跨国交流场景中带来前所未有的便利。时空壶T1翻译机搭载了
    的头像 发表于 09-08 16:52 917次阅读
    当<b class='flag-5'>翻译</b>失去网络,时空壶新T1<b class='flag-5'>翻译</b>机开创<b class='flag-5'>首个</b>离线模型赋能<b class='flag-5'>全球</b>沟通新体验

    赛思PTP时间同步服务器推荐 赛思×阿里云 |30ns精度编织全球算力无界网

    赛思全球分布式数据中心PTP解决方案,助力阿里云加速构建“全球云计算一张网”。01阿里云,全球云计算一张网近日,依托
    的头像 发表于 08-15 17:59 2090次阅读
    赛思PTP时间同步服务器推荐 赛思×<b class='flag-5'>阿里</b>云 |30ns精度编织<b class='flag-5'>全球</b>算力无界网

    抖音电商API直播数据大屏,实时优化带货策略!

    直播电商迅猛发展的今天,抖音平台已成为众多商家带货的核心阵地。然而,直播数据的实时性不足往往导致策略滞后,错失销售良机。本文将一步步指导您如何利用抖音电商API构建直播数据大屏,实现
    的头像 发表于 08-04 14:43 1119次阅读

    首个HDR Vivid 4K超高清直播频道诞生

    2025年6月28日,深圳卫视4K超高清直播频道正式上线,这是全国首个全链路应用HDR Vivid(菁彩影像)技术标准的4K超高清直播频道,标志着深圳卫视率先迈入超高清视听新时代。
    的头像 发表于 07-04 10:19 1801次阅读

    全球首个胃癌影像筛查AI模型发布

    浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE,首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。 相关论文在24日登
    的头像 发表于 06-30 14:37 3683次阅读

    AKOOL发布全球首款实时摄像头

    近日,硅谷新锐公司AKOOL发布全球首款实时摄像头Akool Live Camera,集虚拟数字人、AI视频翻译实时换脸、实时AI视频生成
    的头像 发表于 06-09 16:30 1900次阅读

    XMOS直播声卡——可支持实时音频DSP处理的低延迟音频方案

    XMOS所提供的具有DSP处理功能的直播声卡解决方案凭借卓越的音质和超低延迟,非常适合用于诸如直播、播客广播、唱播(K歌)和游戏等实时应用。
    的头像 发表于 04-21 15:47 854次阅读
    XMOS<b class='flag-5'>直播</b>声卡——可支持<b class='flag-5'>实时</b>音频DSP处理的低延迟音频方案

    可支持实时音频DSP处理的低延迟直播声卡方案

    本篇介绍直播声卡——具有实时音频DSP处理的低延迟音频设备。对于游戏玩家和短视频直播工作者来说,声卡不可或缺。它除了能将计算设备的数字信号转换为声音信号,还能够提供各种逼真的或者定制的3D音效,提升
    的头像 发表于 03-29 15:19 909次阅读
    可支持<b class='flag-5'>实时</b>音频DSP处理的低延迟<b class='flag-5'>直播</b>声卡方案

    AI助力实时翻译耳机

    你是否曾经因为语言障碍而无法与外国人顺畅交流?或者在旅行中因为语言不通而错过了一些精彩的经历?现在,随着AI技术的发展,实时翻译耳机可以帮你轻松解决这些问题。 1 什么是实时翻译耳机
    的头像 发表于 01-24 11:14 3313次阅读
    AI助力<b class='flag-5'>实时</b><b class='flag-5'>翻译</b>耳机

    焊点压力实时监测装置的研发与应用

    焊点压力实时监测装置的研发与应用是现代焊接技术领域的重要创新之一。随着工业自动化水平的不断提高,对焊接质量的要求也越来越高。传统的焊接过程中,焊点的压力控制主要依赖于操作者的经验和手工调节,这种
    的头像 发表于 01-16 14:13 541次阅读

    雷鸟创新与阿里云达成战略合作,引领 AI大模型与AR眼镜融合新纪元

    大模型与AI眼镜硬件厂商开展的深度定制合作,阿里云通义系列大模型将为雷鸟创新的AI眼镜提供全套AI技术和产品支持。这也是阿里云在AI眼镜领域的首个战略级合作,双方将以AI眼镜为核心载体,共同投入
    发表于 01-03 13:45 528次阅读
    雷鸟创新与<b class='flag-5'>阿里</b>云达成战略合作,引领 AI大模型与AR眼镜融合新纪元

    影目科技发布全球首款同传翻译眼镜INMO GO2

    近日,搭载紫光展锐W517芯片平台的INMO GO2由影目科技正式推出。作为全球首款专为商务场景设计的智能翻译眼镜,INMO GO2 以“快、准、稳”三大核心优势,突破传统翻译产品局限,为全球
    的头像 发表于 12-11 10:00 1966次阅读