很多时候,机器学习和人工智能像是在远程、复杂的超级计算机上运行的高端技术,以解决棘手的问题。然而最近,我有幸与一群了不起的工程师和科学家合作,共同开展了一个将人工智能融入日常生活的重大项目。
从2019年开始,在ML Commons的支持下成立了一个工作组,旨在通过创建大规模、多样化和公开许可的语音数据集来增强并普及语音识别技术。迄今为止,该项目已经产生了两个顶级数据集,涵盖了全球数十个语种。该小组的成员来自英特尔、哈佛大学、阿里巴巴、甲骨文、Landing AI、密歇根大学、谷歌、百度等。
介绍这些口语数据集的两份白皮书——《人的语言》和《多语种口语语料库》,已于12月7日举办的NeurIPS大会上发布。其中,《人的语言》主要针对“自动语音识别”任务;《多语种口语语料库》则包含“关键词识别”。这两个项目的数据集都贡献了大量丰富的音频数据,且每个数据集在同类中都拥有最大的可用体量。
这将会对人们的日常生活产生哪些影响?通过对这些数据集的训练,计算机或其他设备可以“听到”口头语言并采取适当的行动,例如响应用户的查询或生成自动转录文本。在当今多元化、国际化、多语言的工作环境中,准确转录和翻译的能力愈发重要。
这两个项目都运用了“多样化语音”,这意味着它们更好地展现自然环境音,如背景噪音、非正式语言模式、录音设备混音以及其他声学环境等。这与诸如有声读物之类的高度受控的内容不同,后者产生的声音更加“纯净”。然而,在实际应用中,多样化语音训练有助于提高识别的准确性。
“人的语言”项目内含数万小时的对话音频。如今,它是世界上最大的、可免费下载的、用于学术和商用的英语语音识别数据集之一。
“多语种口语语料库”是一个音频语音数据集,不仅拥有超过30万个关键字的数十种语言,能够通过智能设备访问,还涵盖了50多亿用户的日常对话,有助于推动全球范围内受众语音应用的研发。
开发这些数据集的研究人员来自于一个跨越多个大洲的国际小组。多年来,我们每周通过电话会议会面,每个人都为项目贡献特定专业知识。
这两个数据集都将被研究人员和开发者广泛使用,而且它们包括商用在内的授权许可条款都相对较为宽松。适当开放授权的重要性被无意识地低估了,导致许多有应用前景的数据集在可用性和适用规模方面受到限制。
这两个数据集将由MLCommons进行长期维护。MLCommons是一个由全球技术提供商、学者和研究人员组成的联盟,而英特尔是联盟的创始成员之一。
在语言的人工智能领域,这个项目是一个飞跃,同时它也为未来开启了诸多可能性。未来,我期待与同事们继续合作,将其推向新的阶段。
原文标题:倾听世界:人工智能的突破
文章出处:【微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
审核编辑:汤梓红
原文标题:倾听世界:人工智能的突破
文章出处:【微信号:英特尔中国,微信公众号:英特尔中国】欢迎添加关注!文章转载请注明出处。
相关推荐
近期,上海开启“复工键”,在确保符合疫情防控要求的基础上,以龙头企业为牵引,以点带链、以链带面,不断....
虚拟化技术已经渗透到社会关键行业核心计算业务中,虚拟化的出现改变了传统的单一计算机架构,虚拟化的高可....
发表于 05-23 15:15 •
0次
阅读
首先我们需要了解什么是小型工控机?相比普通工控机,嵌入式工控机就属于小型工控机了。这类工控机是专门为....
发表于 05-23 15:07 •
9次
阅读
由北京市中小企业公共服务平台、北京市软件和信息服务业协会主办的「数字经济生态共建交流会之AI应用创新....
科技见闻网 发表于 05-23 12:34
•
168次
阅读
湖南省专精特新“小巨人”培育是为贯彻落实省第十二次党代会报告关于“促进中小企业‘专精特新’发展”要求....
纳雷科技 发表于 05-23 10:59
•
176次
阅读
青岛市公安局地铁分局与云天励飞签署战略合作协议,并举行“智慧地铁警务联合创新实验室”揭牌仪式。双方将....
云天励飞 发表于 05-23 10:49
•
172次
阅读
强大的社会粘性不断催温数字化发展,目标检测与识别作为计算机视觉领域的一项关键技术,应用场景越发广泛,....
华为计算 发表于 05-23 10:01
•
194次
阅读
在一个由人工智能、数据和不断进步的连接技术主导的世界中,很难将“物联网”从创新和改变游戏规则的技术列....
明道物联网 发表于 05-21 15:06
•
441次
阅读
无论你是否关注新技术,都一定能感受到我们的生活方式发生了翻天覆地的变化。拿起电脑、手机就可以购物、就....
IBM中国 发表于 05-21 12:03
•
351次
阅读
本文转自openEuler,作者:杨延玲近日,欧拉开源操作系统在赛昉科技的昉·星光RISC-V单板计....
Yu张宇 发表于 05-21 09:28
•
11次
阅读
自英特尔加入RISC-V国际基金会以来,英特尔在RISC-V上持续发声,最近也参加了巴黎举办的202....
E4Life 发表于 05-21 00:07
•
958次
阅读
近日,普渡科技正式创立“PUDU-X”创新基金,专门用于支持全国大学生机器人大赛ROBOCON赛事中....
科技绿洲 发表于 05-20 16:13
•
585次
阅读
当辩证性思维遇到机器学习算法时,数据科学可以帮助获得对业务更佳的见解,提高工作效率,并提供业务决....
人工智能不仅仅存在于云中;它将无处不在。本地设备的智能化、缩短的延迟、数据完整性、更快的执行力、....
NVIDIA 的 Kate Kallot 在非洲人工智能博览会上发表的主题演讲重点介绍了新兴地区如何....
在2022世界电信和信息社会日大会期间,中兴通讯与内蒙古大中矿业股份有限公司(简称“大中矿业”)在大....
科技绿洲 发表于 05-20 15:01
•
203次
阅读
经过百度内部 NLP 研究团队的验证,在这个网络环境下的超大规模集群上提交千亿模型训练作业时,同....
如果您向--timingCacheFile选项提供时序缓存文件,则构建器可以从中加载现有的分析数....
数据类型是每个单独值的表示。它的大小决定了取值范围和表示的精度,分别是FP32(32位浮点,或单....
此外,中科创达还在边缘计算方面做了完整的布局,形成了完整的产业链,并基于TurboX平台形成智慧工厂....
科技绿洲 发表于 05-20 14:42
•
176次
阅读
“人才引进落户政策”“企业法人变更登记”“如何办理公积金贷款”……在智慧政务业务中,智能客服能够7*....
发表于 05-20 14:25 •
30次
阅读
2022年5月18日,马萨诸塞州安多弗讯(GLOBE NEWSWIRE):5月18日,Vicor举办....
21克888 发表于 05-20 14:25
•
1146次
阅读
大约在 24 年前,Google 由两名研究生创立,当时 Google 拥有一个产品,以及一个远大的....
谷歌开发者 发表于 05-20 11:31
•
195次
阅读
Cryptolib 还促进了椭圆曲线数字签名算法 (ECDSA)的使用。椭圆曲线加密 (ECC)....
在生命科学、深度学习、冷冻电镜、细胞治疗、分子模拟、蛋白质组学、疾病建模、靶点识别、药物设计、Alp....
近日,捷通华声与麒麟软件完成灵云全智能能力平台10E2、灵云智声一体机解决方案系统软件V6.0与银河....
科技绿洲 发表于 05-19 17:06
•
365次
阅读
上海移动联合华为发布了“自主创新新型算力核心能力”,同时基于华为昇腾AI基础软硬件平台,打造面向未来....
科技绿洲 发表于 05-19 16:55
•
354次
阅读
目前,传统金融机构与新兴金融机构都在积极拥抱人工智能、大数据、区块链、物联网、云计算等新兴科技,以期....
话说科技 发表于 05-19 16:19
•
332次
阅读
2022年5月19日,中国北京——今日,Graphcore®(拟未)携手腾讯云,正式发布腾讯云公有云....
21克888 发表于 05-19 16:16
•
687次
阅读
华为自2008年发布了未来种子、ICT学院等人才项目,150多个国家的154万人已从中受益。2021....
科技绿洲 发表于 05-19 15:48
•
391次
阅读
5月17日,在2022年中国电子信息产业博览会组委会指导下,CITE2022工业互联网发展与安全峰会....
芯盾时代 发表于 05-19 14:29
•
722次
阅读
加利福尼亚州圣克拉拉市—2022年5月18日—边缘人工智能与视觉联盟宣布Blaize荣获2022年边....
21克888 发表于 05-19 10:13
•
1427次
阅读
近日,北京捷通华声科技股份有限公司正式通过全球软件领域难度最大、规格最高的软件开发能力成熟度认证CM....
科技绿洲 发表于 05-18 16:48
•
276次
阅读
“AI再往下一步发展,需要一个具备支撑能力的基础设施,为AI所需要的算力、算法、数据核心三要素提供更....
Small 回流焊计算机具有精度高、多功能、经济实用、节能、性能稳定、寿命长、操作可视化等特点。它不....
陈虹 发表于 05-18 16:18
•
191次
阅读
近日,低压差线性稳压器(LDO)国内市占率领先的豪威集团发布了LDO新品——WL2848D系列。高精....
21克888 发表于 05-18 16:11
•
802次
阅读
此次延长了两家公司的长期合作伙伴关系,并提供了基于Cipia DMS的多神经网络架构的高效服务 (北....
电子行业新闻 发表于 05-18 15:23
•
184次
阅读
近日,中国信通院云大所于“AI工程化论坛”上发布全球首个AI模型开发管理标准——《人工智能研发运营一....
科技绿洲 发表于 05-18 15:21
•
414次
阅读
工控机的设计和组装适合工业应用,并具有久经考验的可靠性。其一体式机箱设计和无风扇冷却可保护计算机免受....
发表于 05-18 15:03 •
4次
阅读
加利福尼亚州埃尔多拉多山—2022年5月18日—全球知名的生物识别技术公司Innovatrics与掀....
21克888 发表于 05-18 14:45
•
444次
阅读
流量红利的见顶,叠加疫情的反复,线上流量争夺持续升温。借助高黏性、强信任、低获客成本的熟人关系链,辅....
思必驰 发表于 05-18 14:40
•
351次
阅读
Kallot 在迄今为止规模最大的一届非洲人工智能博览会开幕当天向一万名线上观众发表了主题演讲。她重....
科技绿洲 发表于 05-18 14:22
•
250次
阅读
云计算、大数据及人工智能企业海航科技股份有限公司发布2022第一季度报告,具体内容如下。 一、 主要....
汽车玩家 发表于 05-18 11:53
•
363次
阅读
2022年5月17日,长沙千博信息技术有限公司、中国科学院自动化所、华为技术有限公司在长沙签署合作协....
科技绿洲 发表于 05-18 11:28
•
345次
阅读
cuBLAS,cuDNN, cuFFT, CUTLASS等运算库勉强算第四层,让用户可以通过调用NV....
佐思汽车研究 发表于 05-18 11:12
•
298次
阅读
IIfConditional实现了一个 if-then-else 流控制结构,该结构提供基于动态布尔....
ZL-620A一体信息化信号采集处理系统采用一体化设计原则,同时集成了可移动实验平台、医学信号采集系....
发表于 05-17 17:17 •
120次
阅读
一说到“机房”二字,我们脑海中总是浮现出计算机房,却不知除它之外,还有很多。“数字化”是现在我们耳熟....
发表于 05-17 15:01 •
15次
阅读
说到智能家居你会想到什么,语音声控、自动感知、人性化设置、住宅家居一体化?随着综合布线技术、网络通信....
发表于 05-17 14:26 •
39次
阅读
硬件平台:迅为-RK3399开发板 系统:ubuntu项目:TensorFlow 测试 配套资料在网盘资料的“iTOP-3399 开发资料汇总(不含...
发表于 05-13 15:41 •
1296次
阅读
每个人毕竟都不是专业摄影师,因为一些取景以及构图或者外在环境的因素,一些人像照片总会产生不很清...
发表于 05-01 13:18 •
4210次
阅读
作者@Sipeed 原文链接:
发表于 04-29 15:06 •
2094次
阅读
使用单片机、ESP8266、PWM驱动器、以及半导体加热片制作一个水温控制系统。
使用钢制器皿作为容器,最少容量100ml。
通过...
发表于 04-27 22:11 •
903次
阅读
计算机的通信(数据交换)方式主要是分为:串行通信与并行通信
串行通信
概念:计算机与I/O设备之间数据传输的各位是按顺序依...
发表于 04-27 10:18 •
3534次
阅读
发表于 04-06 14:11 •
10615次
阅读
英特尔正在使其GPU多样化,以与x86以外架构的处理器兼容,这可能是使其从芯片制造商成为以代工为首要业务的公司的一步。
英特...
发表于 03-29 14:41 •
2452次
阅读
隐藏技术: 一种基于前沿神经网络理论的新型人工智能处理器 Copy
东京理工大学的研究人员开发了一种名为“ Hiddenite”的新型...
发表于 03-17 19:15 •
4651次
阅读
AI教育行业现状是怎样的?
2017年国务院印发《新一代人工智能发展规划》,其中明确指出应在中小学阶段设置人工智能相关课程,...
发表于 03-15 10:54 •
3829次
阅读
如何在RK3288上安装Opencv?
发表于 03-10 06:49 •
1323次
阅读
评论