谷歌正在开发各种人工智能技术,其中包括一个通用语音模型,这是该公司试图建立一个可以理解世界上1000种最常用语言的模型的一部分。
有传言称,除了计划在今年的年度 I/O 活动中展示20多款人工智能产品外,谷歌正在朝着构建支持1,000种不同语言的人工智能语言模型的目标迈进。在周一发布的更新中,谷歌分享了有关通用语音模型 (USM) 的更多信息,该系统被谷歌描述为实现其目标的“关键的第一步”。

去年11月,该公司宣布计划创建一个支持1,000种世界上使用最广泛的语言的语言模型,同时还展示其 USM 模型。谷歌将 USM 描述为“最先进的语音模型家族”,有20亿个参数,经过1200万小时的语音和280亿个句子的训练,涵盖300多种语言。
USM 已被 YouTube 用于生成隐藏式字幕,它还支持自动语音识别 (ASR),支持自动检测和翻译语言,包括英语、普通话、阿姆哈拉语等。

目前,谷歌表示 USM 支持100多种语言,并将作为构建更广泛系统的“基础”。另外,Meta 也正在开发一种类似的 AI 翻译工具,该工具仍处于早期阶段。
审核编辑黄宇
-
谷歌
+关注
关注
27文章
6244浏览量
110242 -
AI
+关注
关注
89文章
38090浏览量
296458 -
USM
+关注
关注
0文章
7浏览量
7379
发布评论请先 登录
当翻译失去网络,时空壶新T1翻译机开创首个离线模型赋能全球沟通新体验
谷歌AI模型点亮开发无限可能
HarmonyOS AI辅助编程工具(CodeGenie)代码续写
Matter 智能家居的通用语言
首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手
《AI Agent 应用与项目实战》----- 学习如何开发视频应用
《AI Agent 应用与项目实战》第1-2章阅读心得——理解Agent框架与Coze平台的应用
新品| LLM630 Compute Kit,AI 大语言模型推理开发平台

翻译要失业了?谷歌正在开发“能够理解1000种常用语言”的AI模型
评论