0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

搜狗陈伟:AI主播将加入肢体动作,让主播的表达方式更加多元化

产业大视野 来源:杨湘祁 作者:电子发烧友 2019-03-20 10:27 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2018年底,在第五届世界互联网大会上,“克隆”于真人主播邱浩的全球首个AI合成男主播“首秀”,由新华社联合搜狗发布,很快在全球范围内引起热议。

陈伟,搜狗语音交互技术中心高级总监,同时也是新华社AI主播项目的负责人。他表示,从去年11月到现在,新华社工作的两位AI主播已经播报了几千余条新闻,没有出现过失误。

今年2月19日,男主播升级成为站立式AI合成主播“新小浩”,站立式“新小浩”不仅能坐着播报新闻,还能站起来,带着手势、姿态等多种肢体动作,更接近于真人。与此同时,双方还推出了首个AI合成女主播“新小萌”。

在新华社,基于两位真实主播的声音、表情等真实数据生成模型,工作人员仅需要输入新闻稿,就可以让AI形象自动根据文字播报。并且,无需进行二次视频编辑,AI主播将自动识别语义并配上对应音调及表情。

“我们提供的系统,新华社只要每天在想要播报的新闻,过几秒钟生成一个完整的视频,中文、英文不同类型的新闻视频就可以马上出来。”陈伟表示。我们看到,AI主播的能力在不断进化,2月发布的“新小浩”开始加入肢体动作,让主播的表达方式更加多元化。

AI合成主播来自于搜狗AI分身项目的落地,基于多种模态识别融合的技术,包括语音、手写、唇语等维度的识别和模拟,仅需数个小时的视频资料就可以合成一个比较逼真的真人形象。

“逼真度”是衡量AI主播效果的一个重要指标。陈伟向机器之心表示,在初期,团队采用主观的方式来衡量AI分身的真实度,最近逐渐考虑采用一些客观标准,比如与真人视频每一帧画面进行比对。

近日,一段“换脸杨幂版”的《射雕英雄传》在网上广泛流传,关于AI换脸和模拟真人技术的讨论上升到社会层面,比如将技术用于不正当目的的伦理问题。

陈伟对此回应,首先, “分身”与“换脸”(deepfakes)在技术层面有着本质的差别,“换脸实际上是把一个人脸映射到另一个人脸上,前期投入成本很大,但‘分身’一旦建模之后,只需要输入文字就可以生成视频,不需要任何表演成本在里面。”

在技术使用的规范问题上,陈伟表示, “搜狗选择和明确的公司、在明确的领域合作,尽量通过场景圈定技术的使用范围,这样的好处就是不会把技术滥用。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 搜狗
    +关注

    关注

    0

    文章

    91

    浏览量

    14231
  • AI
    AI
    +关注

    关注

    89

    文章

    38090

    浏览量

    296494

原文标题:对话搜狗陈伟:AI合成主播下一步将如何进化?

文章出处:【微信号:robotn,微信公众号:产业大视野】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    进迭客 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是AI时代的“终极答案”

    进迭客「RISC-V圆桌白话录」「RISC-V圆桌白话录」第三期客上线!本期客我们邀请到对话进迭时空联合创始人、总裁孙彦邦,一起深入探讨RISC-V如何成为AI时代的"终极答案
    的头像 发表于 11-07 20:26 408次阅读
    进迭<b class='flag-5'>播</b>客 | Vol.3对话孙彦邦:用胡子赌一个未来,RISC-V是<b class='flag-5'>AI</b>时代的“终极答案”

    进迭客 | Vol.2 对话志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭客「RISC-V圆桌白话录」「RISC-V圆桌白话录」第二期客来啦!本期节目延续上期RISC-V芯片的行业趋势——我们与进迭时空创始人、CEO志坚一起,聊聊他4年的RISC-V芯片创业故事
    的头像 发表于 10-27 18:34 405次阅读
    进迭<b class='flag-5'>播</b>客 | Vol.2 对话<b class='flag-5'>陈</b>志坚:离开大厂RISC-V芯片创业4年,见500投资人,被拒 90%,我为何从没想过放弃?

    进迭客 |「RISC-V 圆桌白话录」首期正式上线!

    ”解读技术原理,分享真实创业故事,提供前沿行业视角,在AI驱动科技变革的时代,持续追踪开源芯片领域的核心动态与未来趋势。首期亮点特邀进迭时空创始人兼CEO志坚,进
    的头像 发表于 10-16 17:42 1088次阅读
    进迭<b class='flag-5'>播</b>客 |「RISC-V 圆桌白话录」首期正式上线!

    CW32L011电机开发板测评

    都有问题,这里把初始放在这里(因为懒惰,以前比较喜欢cubemax,面对这一堆配置,
    发表于 08-20 19:49

    探索工业自动核心:ZMC 系列 EtherCAT 站控制器

    ZLG致远电子的ZMC系列EtherCAT站控制器,凭借多元内核、丰富接口、卓越通信能力及开放开发环境,为工业自动提供全方位解决方案,助力企业智能升级。前言在工业自动
    的头像 发表于 08-18 11:35 736次阅读
    探索工业自动<b class='flag-5'>化</b>核心:ZMC 系列 EtherCAT <b class='flag-5'>主</b>站控制器

    索尼中标浙江广播电视集团10个制项目

    近日,索尼(中国)有限公司宣布成功核心产品中标浙江广播电视集团10个制相关项目,涵盖了从4K超高清摄像机、转播车视频系统、小型演播室系统到后期制作系统和播出设备等,进一步巩固了其在4K超高清制领域的重要地位。此次中标不仅展示了索尼产品在技术上的优异表现,也体现了索尼产
    的头像 发表于 07-10 17:57 713次阅读

    重新理解传音:市场扩容,多元化AI突围

    的成长性和业务的多元化能力。另一方面,AI等技术对硬件同样带来冲击,需要手机厂商作出回应。AI被视为重构智能手机形态的一个新的抓手,而如何迅猛发展的
    的头像 发表于 05-21 14:17 681次阅读
    重新理解传音:市场扩容,<b class='flag-5'>多元化</b>和<b class='flag-5'>AI</b>突围

    AR互动与传统的交互方式相比更加丰富多元

    AR 互动的另一个显著特点,是其丰富多元的互动方式。与传统的交互方式相比,AR 互动不再局限于鼠标、键盘、触摸屏等有限的输入方式,而是通过多种先进的技术手段,实现了
    的头像 发表于 03-10 17:48 844次阅读
    AR互动与传统的交互<b class='flag-5'>方式</b>相比<b class='flag-5'>更加</b>丰富<b class='flag-5'>多元</b>

    AI研究所丨Lex Fridman五小时聊DeepSeek:一文看懂DeepSeek的创新与2025AI趋势

    DeepSeek火了之后,知名科技LexFridman,找了两位嘉宾,从DeepSeek及其开源模型V3和R1谈到了AI发展的地缘政治竞争,特别是中美在AI芯⽚与技术出⼝管制上的博
    的头像 发表于 02-20 15:30 2288次阅读
    <b class='flag-5'>AI</b>研究所丨Lex Fridman五小时聊DeepSeek:一文看懂DeepSeek的创新与2025<b class='flag-5'>AI</b>趋势

    技术洞见丨视耀S1直播机的顶尖性能与多元化功能

    :9/9:16)直播,适应多样的直播需求。更值得一提的是,视耀S1直播机内置了先进的抠像功能,能够实时去除背景,实现绿幕抠像或色键抠像,与虚拟背景或任意场景无缝融合,极大地提升
    发表于 02-07 13:43

    美企纷纷调整多元化项目,顺应政策转向

    随着美国新总统就职日的临近,多家大企业开始调整政策,以顺应新的政治环境。其中,多元化计划与气候变化相关举措成为调整的重点。 1月10日,Meta发布内部备忘录,宣布终止多元化、公平与包容(DEI
    的头像 发表于 01-13 10:32 637次阅读

    OLT下挂IPTV部分用户组切换成单播如何解决

    某地新开通的OLT(ZXA10 C600)上线割接后,下挂IPTV用户业务正常,但部分用户由原来的组切换成单播。 ZXA10 C600 组网图如下: 从以下几个方面对组业务的故障原因进行排查
    的头像 发表于 01-09 09:32 1758次阅读
    OLT下挂IPTV部分用户组<b class='flag-5'>播</b>切换成单播如何解决

    微软寻求365 Copilot多元化AI模型

    此举旨在应对企业用户对于成本和速度的担忧。目前,Microsoft 365 Copilot主要依赖于OpenAI的技术,但微软正寻求通过引入更多元化AI模型来降低这种单一依赖的风险。 微软发言人表示,尽管正在探索新的合作伙伴和技术,但OpenAI仍将继续作为微软在前沿模
    的头像 发表于 12-26 10:25 706次阅读

    中国的环境更加多元,连接器如何帮助工程机械应对严苛挑战?

    电子发烧友网报道(文/吴子鹏)“相较于全球其他国家和地区,中国拥有更加复杂多变的环境,包括高原、沙漠、极冷、极热、潮湿多雨等,要求工程机械装备需要能够适应更加复杂多变的环境,挑战无疑更大
    的头像 发表于 12-16 17:18 1575次阅读
    中国的环境<b class='flag-5'>更加多元</b>,连接器如何帮助工程机械应对严苛挑战?

    SAE 2024汽车动力总成多元化技术论坛成功举行

    近日,SAE 2024汽车动力总成多元化技术论坛在西安西咸国际会议中心成功举行,来自汽车产业、行业组织、学术界及科研机构的专家学者齐聚一堂,深入探讨汽车动力总成技术的最新进展与多元化发展趋势。
    的头像 发表于 12-10 16:53 1392次阅读