0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

首个多语种AI 虚拟主播“小晴”亮相两会

电子工程师 来源:杨湘祁 作者:电子发烧友 2019-03-14 17:32 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

正值2019全国两会期间的你

每天都会收到很多专业主持人送上的新闻报道

他们或沉稳大方或幽默智慧

还有的稳中带皮……

咳咳,甚至还有机器人不甘示弱

向著名主持人白岩松老师拜师学艺的——

说的就是咱们的记者助理小白

TA可是会模仿白岩松老师的声音哦

不过有一位特殊的主播

在两会期间也悄悄上岗了

欣赏TA专业而迷人的表现

优秀!这位主播芳名“小晴”

是由科大讯飞推出的

首个多语种A.I.虚拟主播

TA声音动听表情自然

还兼备中、英、日、韩等多种语言的播报能力

没想到是个颜值才气并存的虚拟主播

先闻其声

听到“小晴”的声音,你是不是以为有个真人主播在线读稿?

NONONO! 只需要语音合成技术就可以实现啦

说起语音合成,大家应该都不会感到陌生

不论是平时使用的导航软件里各种播报语音

还是大家喜爱的听书软件里的主播大大们

都蕴藏着语音合成的身影

通过采集录制真人的声音素材

再通过声音标注以及机器的深度学习算法

就可以构建出TA的发音声学模型

在此基础上

输入任意文本即可实现在线播报

虚拟主播“小晴”的声音就是这么来的哦~

去年3月,我们和南方财经

联合复刻主持人俎江涛的声音

打造了一位藏在电台里的A.I.虚拟主播

人工智能虚拟主播“俎江涛”在主持节目

今年2月

我们又在央广中国声音中国年特别节目里

“藏”了一位神秘嘉宾——虚拟主播“央小广”

“央小广”为大家说绕口令

TA可是基于金话筒主播王冠老师的语料库复刻出来的

“央小广”不仅可以开口说话

还可以保持实时在线,随时播报

王冠老师在录音

通过对技术的不断迭代优化

今天我们带来的“小晴”主播不论在声音还是形象上

都有了更好的表现

再观其形

比起纯语音合成播报

“小晴”逼真的形象更加吸睛

播报过程中自然的表情和精准的口型

达到了以假乱真的效果

你能想到这是个AI虚拟主播在为你播报嘛~

虽然在纯语音合成播报的基础上加入了形象

但虚拟主播“小晴”的播报操作依旧简单便捷

只需输入文本就能自动输出播报视频

图像+声音兼备

啧啧啧,这个主播可真不一般~

多语种的TA,是怎么炼成的?

最难能可贵的是“小晴”

会说多种语言

可以实现一个声音多语种播报!

此刻小编流下了学渣的眼泪.jpg

毕竟“小晴”可是融合了

讯飞的语音合成、语音识别以及图像处理等多个技术能力

尤其在多语种播报上

更是依托于讯飞的机器翻译技术

早在2014年和2015年

讯飞就已在国际机器翻译大赛中崭露头角

去年10月,讯飞在IWSLT 2018中

英德方向语音翻译任务上端到端模型显著优势拿下第一

这下你明白“小晴”为什么这么厉害了吧~

这次“小晴”主播虽然现在还只是简单地和大家打了个招呼

未来 TA会慢慢走近你的生活

也许不止出现在电视、广播里

还有可能是在节目舞台

歌唱比赛里

……(此处应有无数脑洞)

所以要不要关注我们,和我们共同见证TA在未来的无限可能呢?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41138

    浏览量

    302608
  • 科大讯飞
    +关注

    关注

    19

    文章

    866

    浏览量

    63938

原文标题:首个多语种A.I.虚拟主播“小晴”向你问好啦!!

文章出处:【微信号:iFLYTEK1999,微信公众号:科大讯飞】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【应用方案】会议 面试记录终结者-艾为AI智能录音卡方案,清晰拾音,解放双手

    实现声音信息的精准记录、智能加工、安全留存与高效复用。作为AI驱动的随身记录终端,智能录音卡突破传统录音笔的功能边界,集高清拾音、实时转写、多语种翻译、声纹区分、
    的头像 发表于 04-08 18:32 323次阅读
    【应用方案】会议 面试记录终结者-艾为<b class='flag-5'>AI</b>智能录音卡方案,清晰拾音,解放双手

    两会解读:影响磁性元件全年走势的五大方向

    2026年全国两会圆满落幕,政府工作报告+代表委员建议,不仅勾勒出中国制造业高质量发展的蓝图,更给磁性元件行业划好了“掘金路线”。本文将拆解两会中透露出的磁性元件行业企业必须抓住的5大核心方向,把政策红利转化为可落地的发展机遇,帮你避开内卷、找对赛道!
    的头像 发表于 03-14 14:21 972次阅读

    2026两会聚焦:智能与安全双轮驱动,中国汽车驶向物理 AI 新纪元

    随着2026年全国两会的召开,汽车产业再次成为代表委员们建言献策的重头戏。在经历了电动化上半场的狂飙突进后,今年两会释放出清晰信号:中国汽车产业已全面进入以智能化为核心、以安全为底线的下半场竞争
    的头像 发表于 03-10 15:10 164次阅读
    2026<b class='flag-5'>两会</b>聚焦:智能与安全双轮驱动,中国汽车驶向物理 <b class='flag-5'>AI</b> 新纪元

    科技云报到:两会“中场时刻”:从技术突破到制度对齐

    科技云报到:两会“中场时刻”:从技术突破到制度对齐
    的头像 发表于 03-06 19:01 965次阅读

    北汽集团新能源汽车连续11年服务北京两会

    日前,北京两会在北京会议中心隆重开幕。北汽集团第11年服务北京两会,提供享界汽车、北汽极狐和北京越野的46辆新能源汽车进行服务保障。
    的头像 发表于 01-27 15:59 506次阅读

    给智能门锁“装个移动硬盘”:广州唯创电子WTV语音芯片外置SPI Flash方案破解多语种语音存储困局

    厂家,以其创新的WTV系列语音芯片外置SPIFlash方案,如同给门锁配备了一个“海量移动硬盘”,彻底破解了智能门锁的多语种语音存储困局。一、行业痛点:智能门锁的“
    的头像 发表于 11-17 07:43 909次阅读
    给智能门锁“装个移动硬盘”:广州唯创电子WTV语音芯片外置SPI Flash方案破解<b class='flag-5'>多语种</b>语音存储困局

    江苏省委书记一行到访思必驰调研

    大模型开启了人工智能发展的新阶段。在思必驰,信长星了解多语种语言大模型、人机对话技术等研发应用,以及向汽车、家电、新能源等行业提供产品解决方案情况。他强调,要推动面向各行业各领域的大模型垂直应用,促进人工智能与实体经济深度融合。
    的头像 发表于 11-11 10:37 938次阅读

    AR智能眼镜定制_ar眼镜PCBA硬件设计与AI赋能

    千问、DeepSeek、豆包等),可以实现智能提词、多语种实时翻译、AI识物、导航、消息提醒和支付等功能,为用户提供更加智能化的交互体验。
    的头像 发表于 11-05 20:27 909次阅读
    AR智能眼镜定制_ar眼镜PCBA硬件设计与<b class='flag-5'>AI</b>赋能

    声智科技多语种AI翻译耳机亮相中美产业交流会

    近日,由商务部投资促进事务局与北京市海淀区人民政府联合主办的“共赴新未来——中美地方产业交流会”在北京中关村展示中心成功举办。声智科技作为人工智能与声学融合领域的领先企业,应邀参会并展示了其面向全球市场的AI声学产品矩阵,彰显出中国科技企业在“出海”过程中日益增强的技术话语权与生态整合能力。
    的头像 发表于 10-14 09:09 944次阅读

    NVIDIA推出多语种语音AI开放数据集与模型

    新发布的 Granary 数据集包含约 100 万小时音频,可用于训练高精度、高吞吐量的 AI 音频转录与翻译模型。
    的头像 发表于 09-23 15:34 1144次阅读

    云知声多项业务营收大涨

    依托山海大模型,云知声不断开拓阵地,开发了面向东盟等海外市场和国内方言市场的语音大模型,模型显著提升了在多语种、多方言环境下的语音识别、语义理解和高质量语音生成能力,改善了多语言、语种环境下的沟通
    的头像 发表于 09-10 15:44 830次阅读

    语种OCR标注效率提升10+倍:PaddleOCR+ERNIE 4.5自动标注实战解析

    与一致性校验,实现高精度、低成本的小语种OCR训练数据生成。该方案将数据准备周期 从数周缩短至数小时 ,为小语种模型的快速迭代与冷启动提供了全新范式 一、引言:小语种OCR的“数据之困” 在跨境支付、
    的头像 发表于 08-29 11:26 3879次阅读
    小<b class='flag-5'>语种</b>OCR标注效率提升10+倍:PaddleOCR+ERNIE 4.5自动标注实战解析

    声智科技出席2025年北京市多语种AI语音翻译大赛

    8月20日,由北京市科委、中关村管委会主办,北京语言大学、北京第二外国语学院、北京市翻译协会、中国人工智能百人共同承办的“2025年北京市多语种AI语音翻译大赛”在中关村展示中心顺利启幕。声智作为
    的头像 发表于 08-25 17:18 1375次阅读

    Votee AI借助NVIDIA技术加速方言小语种LLM开发

    Votee AI 利用 NVIDIA 的 GPU 硬件、NeMo Curator 数据处理软件、NeMo Framework 模型训练框架及 Auto Configurator 优化工具,高效构建
    的头像 发表于 08-20 14:21 1029次阅读

    广和通发布自研端侧语音识别大模型FiboASR

    、高效会议记录、多语种即时翻译等核心领域实现重大技术突破,致力于为终端用户带来更自然、高效、私密的语音交互体验。
    的头像 发表于 08-04 11:43 1769次阅读