0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

搜狗陈伟:AI主播将加入肢体动作,让主播的表达方式更加多元化

产业大视野 来源:杨湘祁 作者:电子发烧友 2019-03-20 10:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2018年底,在第五届世界互联网大会上,“克隆”于真人主播邱浩的全球首个AI合成男主播“首秀”,由新华社联合搜狗发布,很快在全球范围内引起热议。

陈伟,搜狗语音交互技术中心高级总监,同时也是新华社AI主播项目的负责人。他表示,从去年11月到现在,新华社工作的两位AI主播已经播报了几千余条新闻,没有出现过失误。

今年2月19日,男主播升级成为站立式AI合成主播“新小浩”,站立式“新小浩”不仅能坐着播报新闻,还能站起来,带着手势、姿态等多种肢体动作,更接近于真人。与此同时,双方还推出了首个AI合成女主播“新小萌”。

在新华社,基于两位真实主播的声音、表情等真实数据生成模型,工作人员仅需要输入新闻稿,就可以让AI形象自动根据文字播报。并且,无需进行二次视频编辑,AI主播将自动识别语义并配上对应音调及表情。

“我们提供的系统,新华社只要每天在想要播报的新闻,过几秒钟生成一个完整的视频,中文、英文不同类型的新闻视频就可以马上出来。”陈伟表示。我们看到,AI主播的能力在不断进化,2月发布的“新小浩”开始加入肢体动作,让主播的表达方式更加多元化。

AI合成主播来自于搜狗AI分身项目的落地,基于多种模态识别融合的技术,包括语音、手写、唇语等维度的识别和模拟,仅需数个小时的视频资料就可以合成一个比较逼真的真人形象。

“逼真度”是衡量AI主播效果的一个重要指标。陈伟向机器之心表示,在初期,团队采用主观的方式来衡量AI分身的真实度,最近逐渐考虑采用一些客观标准,比如与真人视频每一帧画面进行比对。

近日,一段“换脸杨幂版”的《射雕英雄传》在网上广泛流传,关于AI换脸和模拟真人技术的讨论上升到社会层面,比如将技术用于不正当目的的伦理问题。

陈伟对此回应,首先, “分身”与“换脸”(deepfakes)在技术层面有着本质的差别,“换脸实际上是把一个人脸映射到另一个人脸上,前期投入成本很大,但‘分身’一旦建模之后,只需要输入文字就可以生成视频,不需要任何表演成本在里面。”

在技术使用的规范问题上,陈伟表示, “搜狗选择和明确的公司、在明确的领域合作,尽量通过场景圈定技术的使用范围,这样的好处就是不会把技术滥用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 搜狗
    +关注

    关注

    0

    文章

    91

    浏览量

    14280
  • AI
    AI
    +关注

    关注

    91

    文章

    42155

    浏览量

    303135

原文标题:对话搜狗陈伟:AI合成主播下一步将如何进化?

文章出处:【微信号:robotn,微信公众号:产业大视野】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    飞腾多元化主板持续推进科技强国建设

    全球供应链不确定性持续攀升,国产主板正面临技术自主、架构智能与产业价值重构的三重变革。工业4.0、智慧金融、教育信息等场景对主板的需求呈现多元化趋势:工业场景需要主板具备宽温适配
    的头像 发表于 05-16 16:21 531次阅读

    e络盟客探讨人工智能、脑科学与以人为本创新的下一个前沿

    安富利旗下全球电子元器件产品与解决方案分销商e络盟《发现顶尖技术之声》客第二季强势回归,新推出的两期节目探讨神经科学、人工智能与健康技术如何重塑人们的思维、行为及生活方式
    的头像 发表于 05-14 10:37 709次阅读
    e络盟<b class='flag-5'>播</b>客探讨人工智能、脑科学与以人为本创新的下一个前沿

    权威认证|千视电子深度参编国家广电总局轻量化制官方指南!

    近日,国家广播电视总局正式发布《轻量化制系统技术应用指南(2026版)》(以下简称《指南》),为全国广电媒体轻量化、IP、智能体系建设提供权威指引与实施路径。长沙千视电子科技
    的头像 发表于 05-12 17:41 274次阅读
    权威认证|千视电子深度参编国家广电总局轻量化制<b class='flag-5'>播</b>官方指南!

    NAB Show 2026看点|一整套广播级 IP 制系统如何跑通?千视现场给出答案!

    全链路解决方案亮相N1467展位,围绕IP网络集中管控、远程制作信号回传及一体部署三大核心场景,展开系统演示。开展首日,展位持续保持高关注度。来自电视台、
    的头像 发表于 04-21 17:22 980次阅读
    NAB Show 2026看点|一整套广播级 IP 制<b class='flag-5'>播</b>系统如何跑通?千视现场给出答案!

    多元化PTP时钟设备都有哪些应用,ptp授时模块,ptp授时服务器

    PTP(精确时间协议,IEEE 1588)时钟设备作为分布式系统时间同步的核心中枢,负责生成并分发高精度时间基准,其设备形式需适配不同部署场景与行业需求。同步天下深耕时间频率领域多年,推出包括但不
    的头像 发表于 04-17 16:53 218次阅读

    MathWorks 加入 EDGE AI FOUNDATION,推进面向工程系统的嵌入式 AI 发展

    嵌入式设备,并通过系统级仿真验证其性能。 EDGE AI FOUNDATION 执行董事 Pete Bernard 表示:“MathWorks 的加入进一步强化我们边缘
    的头像 发表于 04-17 15:46 238次阅读

    东风汽车全新天元智驾T500系统重磅亮相

    AI学会“老司机思维”,TA将成为你的下一个驾驶伙伴,行业首个量产级生成式“端到端智驾方案”——东风全新天元智驾T500系统,一个可能彻底改变你开车方式的技术来了,今天就跟东风
    的头像 发表于 03-04 15:53 903次阅读

    CastFox利用Google开放模型Gemma 3n重塑客互动体验

    Guru Network Limited 是一家全球的娱乐与游戏公司,其开发的 CastFox 彻底改变了用户与客的交互方式,应用上线仅 3 周下载量就突破 100 万次。
    的头像 发表于 02-09 14:50 696次阅读

    两个RS485(Modbus RTU)站与站之间如何通讯

    本产品能很好解决Master-1站向模块写入数据,Master-2站读取数据;Master-2站向模块写入数据,Master-1站读取数据。由此解决两个
    的头像 发表于 02-08 15:32 1017次阅读
    两个RS485(Modbus RTU)<b class='flag-5'>主</b>站与<b class='flag-5'>主</b>站之间如何通讯

    IBM Rhapsody AI 助手:系统工程更智能

    IBM Rhapsody AI 能力的加入,标志着系统工程正逐步迈入智能新阶段。它模型不再只是“被动表达设计意图”的工具,而成为能理解、
    的头像 发表于 01-06 11:34 515次阅读
    IBM Rhapsody <b class='flag-5'>AI</b> 助手:<b class='flag-5'>让</b>系统工程更智能

    进迭客 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是AI时代的“终极答案”

    进迭客「RISC-V圆桌白话录」「RISC-V圆桌白话录」第三期客上线!本期客我们邀请到对话进迭时空联合创始人、总裁孙彦邦,一起深入探讨RISC-V如何成为AI时代的"终极答案
    的头像 发表于 11-07 20:26 1003次阅读
    进迭<b class='flag-5'>播</b>客 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是<b class='flag-5'>AI</b>时代的“终极答案”

    进迭客 | Vol.2 对话志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭客「RISC-V圆桌白话录」「RISC-V圆桌白话录」第二期客来啦!本期节目延续上期RISC-V芯片的行业趋势——我们与进迭时空创始人、CEO志坚一起,聊聊他4年的RISC-V芯片创业故事
    的头像 发表于 10-27 18:34 1352次阅读
    进迭<b class='flag-5'>播</b>客 | Vol.2 对话<b class='flag-5'>陈</b>志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭客 |「RISC-V 圆桌白话录」首期正式上线!

    ”解读技术原理,分享真实创业故事,提供前沿行业视角,在AI驱动科技变革的时代,持续追踪开源芯片领域的核心动态与未来趋势。首期亮点特邀进迭时空创始人兼CEO志坚,进
    的头像 发表于 10-16 17:42 1614次阅读
    进迭<b class='flag-5'>播</b>客 |「RISC-V 圆桌白话录」首期正式上线!

    CW32L011电机开发板测评

    都有问题,这里把初始放在这里(因为懒惰,以前比较喜欢cubemax,面对这一堆配置,
    发表于 08-20 19:49

    索尼中标浙江广播电视集团10个制项目

    近日,索尼(中国)有限公司宣布成功核心产品中标浙江广播电视集团10个制相关项目,涵盖了从4K超高清摄像机、转播车视频系统、小型演播室系统到后期制作系统和播出设备等,进一步巩固了其在4K超高清制领域的重要地位。此次中标不仅展示了索尼产品在技术上的优异表现,也体现了索尼产
    的头像 发表于 07-10 17:57 1005次阅读