0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型加持后,数字人“更像人”了吗?

科技云报到 来源:jf_60444065 作者:jf_60444065 2024-04-12 14:43 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科技云报道原创。

北京冬奥运AI 虚拟人手语主播、杭州亚运会数字人点火、新华社数字记者、数字航天员小诤......当随着越来越多数字人出现在人们生活中,整个数字人行业也朝着多元化且广泛的应用方向发展,快速拓展到不同行业、不同场景。

面向C端,数字人帮助用户生产内容和辅助工作,如:数字人练口语、和数字人玩游戏等;面向B端,数字人是企业的“工具人”,应用于金融、影视、电商、直播等行业,提高行业生产和运营效率。

毫无疑问,数字人是一门好生意,但其规模化落地依然面临着人才、成本、场景、技术等层层困难。其中,最关键的是技术瓶颈,如何让数字人摆脱“空有一副好皮囊”的市场评价是一大难题。

然而,随着大模型的出现,数字人的发展似乎正在迎来新的机遇。

大模型赋能数字人

对于产业界而言,数字人本身并不新鲜。在过去很长一段时间内,为了又力求数字人视觉外形上的高保真呈现,生产成本不亚于制作一部专业级电影。

瑞银发布的数字人研究报告指出,高级虚拟人物的先期投入成本平均为3000万元,后期又需要真人团队完成拍摄、配音、剪辑。以乐华娱乐的虚拟女团A-SOUL为例,其一支单曲制作成本约200万元,一场线下演唱会成本约2000万元。

但即便是如此高昂的成本,也解决不了数字人的互动效果问题。由于智能水平不足,与其说它是数字人,更像是一个没有灵魂的数字皮套。

高成本,再加上互动效果不佳,使得数字人的使用被限制在厂商内部或大企业客户的试验项目。

因此,当具有学习能力的生成式大模型颠覆了内容制作范式后,面向更广范围的中小型企业用户、优先规模化落地使用的廉价数字人成为了可行方案。

据一名人工智能研究人员介绍,大模型对数字人的重塑与赋能主要体现为降本增效。

从技术角度来说,搭建一个数字人主要分为建模、驱动、渲染几个环节。传统的数字人主要依托计算机图形学技术+真人动作捕捉,需要采集大量的真人数据,深度建模,耗时长,效率低,成本高。

如今在大模型的加持下,通过AI算法,基于深度学习模型、动作模拟、情感模拟等技术,只需要几分钟的真人视频,用大模型训练若干个小时,就可以生成逼真的数字人,制作成本大大降低。

不仅如此,数字人在成本降低的同时,效能也大大提升。

在大模型出现以前,数字人在外形上差异度较小,而且只能根据输入的统一脚本,“照本宣科”地回答问题。

在大模型的赋能下,数字人拥有了“灵魂”,不仅外貌特征可以自定义设计,智能化、交互性也有了很大提升。比如在一些直播带货场景中,数字人已经可以与受众进行基础互动。

比如,百度智能云发布的曦灵数字人,大模型的加持下,可以15分钟快速完成直播间搭建,自动生成匹配产品特色的讲品话术,开启智能互动问答

在某餐饮品牌的直播间,曦灵数字人主播自动生成直播话术,包含开场破冰、福利放送、暖场话术、催单话术等。在这场真人与曦灵数字人的接力直播中,用户竟然没有丝毫察觉。

更令人惊讶的事,在真实6小时的直播比对中,数字人主播仅需真人主播15%的成本,就可获得真人主播85%GMV。

除了直播带货,百度智能云曦灵作为国内首个大模型全面重构的数字人平台,还可为企业提供2D真人、3D写实、3D超写实的人像,实现视频制作、数字员工、数字人代言人等多种应用。

比如,在曦灵平台,只需5分钟的真人视频,半小时即可训练人像,录制100句话语,24小时生成专属音色库,相比真人授课成本只需过去的30%,录制效率提升20倍。

不难发现,经过大模型重塑与赋能的数字人,一定程度上摆脱了价格昂贵、互动性差等问题,越来越广泛地出现在短视频、直播间中。

同时,数字人开始朝着更多“身份”进军——银行理财师、律师、老师、已逝的名人……数字人正在成为任何想成为的人,也为这条日渐拥挤的赛道带来了新的机遇。

让数字人更像“人”

大模型的出现让数字人“脱胎换骨”,成为如今最火的创业赛道之一。

目前市场上主要的数字人厂商主要有两类:一类是以百度、腾讯、华为等为代表的科技巨头,基于自身大模型方面的优势研发推出数字人产品;另一类是以硅基智能、出门问问、相芯科技等为代表的中小厂商。

多名人工智能领域投资人表示,目前AIGC(生成式人工智能)还处于早期阶段,能落地产生利润的不多,数字人是其中比较少有的商业化路径,且已经能够盈利的项目。

但随着大量的创业者涌入,行业竞争趋于激烈和同质化,赛道逐渐变得拥挤和内卷。

内卷的一个表现是价格越降越低。目前2D数字人的价格大多数已经降到千元级别,有的甚至只需要几百元。

360集团的数字人营销服务也显示,通过智能营销云平台的配套SaaS服务推广给客户,按照会员用户每月付费的标准估算,一款数字人的价格最低几十元,最高在一、二百元上下。

随着大量低成本的数字人涌入市场,百元级别的数字分身迅速被炒成一本万利的“财富经”。

每到深夜,打开主流平台,大量的数字人坚守在直播间。随之而来的是关于数字人的质疑声渐起,诸如效果太假、市场混乱等,导致用户体验不佳。

有业内人士认为,随着越来越多的玩家涌入,一些创业者技术能力有限,生产的数字人产品质量良莠不齐,容易导致劣币驱逐良币。

一方面,数字人多用于较为简单的环境、解决较为基础的问题,在场景切换或面对多轮对话时,可能出现答非所问或陷入死循环的情况,制约用户体验。

另一方面,大模型下的数字人交互体验始终与真人存在明显差异,比如,在Sora生成内容中,无视物理学原理、人的手指时多时少等问题被广为诟病,可能进一步引发心理方面的“恐怖谷效应”。

对此,也有专家认为,需要进一步提升技术创新能力和用户体验感,在保证数字人外在拟人效果的同时,优化用户交互体验,注重实时渲染、光学捕捉、三维重建、智能人机交互等新兴技术与自然语言处理、语音识别计算机视觉、生成式AI等技术的研究和应用。

“当前行业正在共同突破的技术目标是‘如何让数字人变得更像一个人’,像人一样去思考”,一位业内人士表示,加快企业间的技术协同,解决交互型数字人在情绪感知、语义理解等方面的技术难题是接下来的重点。

这一系列的挑战都指向技术侧。

2024年度《中国虚拟数字人影响力指数报告》指出,截至2024年2月底,国家知识产权局“专利检索”数据显示,2023年全年数字人领域专利申请数高达544个,反映出业界在核心技术研发上的强劲势头和深度创新。

从2023年数字人相关专利申请机构来看,以百度、腾讯为代表的老牌互联网巨头,以中国移动、工商银行为代表的头部通信、金融机构,以小冰公司、世优科技、黑镜科技为代表的头部数字人公司形成了技术端的多强格局。

尽管行业头部大厂在AI技术上拥有了先发优势,但在产业高速发展的过程中,每个公司在技术本身都没有绝对的壁垒,本质上技术背后是人。对于所有数字人厂商来说,AIGC带来机会的同时,也成为直面挑战的起点。

结语

数字人正处于风口,吸引了大量想分一杯羹的创业者涌入。但不可否认的是,作为一项年轻的技术,数字人还处于早期阶段,市场尚在培育之中。

对于同处一片红海中的数字人公司来说,要思考的或许不是如何“卷低价”,而是通过技术的不断进步,让数字人“更像人”,提高行业的整体水位,让数字人“活下去”,创造更多的价值。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38189

    浏览量

    297007
  • 数字人
    +关注

    关注

    0

    文章

    158

    浏览量

    2542
  • 大模型
    +关注

    关注

    2

    文章

    3455

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    罗永浩数字刷屏背后,文心大模型成为直播行业的“剧本总导演”

    从真人顶流到AI新星,罗永浩数字凭什么“技惊四座”?
    的头像 发表于 06-19 09:42 2331次阅读
    罗永浩<b class='flag-5'>数字</b><b class='flag-5'>人</b>刷屏背后,文心大<b class='flag-5'>模型</b>成为直播行业的“剧本总导演”

    【「# ROS 2智能机器开发实践」阅读体验】机器入门的引路书

    ROS的全称:Robot Operating System 机器操作系统 ROS的 目的 :ROS支持通用库,是通信总线,协调多个传感器 为了解决机器里各厂商模块不通用的问题,让机器快速开发
    发表于 04-30 01:05

    大象机器携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    大象机器成立于2016年,专注协作机器研发与应用,产品线涵盖轻量级协作机器、人形机器、仿生机器等多种形态。拳头产品myCobot系
    发表于 04-25 17:59

    商汤科技助力如影数字超级直播间全新升级

    作为数字全行业首创,如影数字超级直播间可实现多模态智能运营,依托“商汤日日新SenseNova”多模态大模型,直播间具备智能选品、直播间
    的头像 发表于 04-23 16:31 842次阅读

    首个搭载商汤科技日日新融合大模型的具身智能机器来了

    注入“灵魂”型机器怎样才算融入人类的日常生活?
    的头像 发表于 03-26 14:22 1097次阅读

    NVIDIA Isaac GR00T N1开源人形机器基础模型+开源物理引擎Newton加速机器开发

    NVIDIA Isaac GR00T N1开源人形机器基础模型+开源物理引擎Newton加速机器开发
    的头像 发表于 03-20 16:56 1291次阅读

    2 分钟生成数字视频!华为云 Flexus 数字助力中小企业高效创作

    在科技日新月异的今天,数字作为一种新兴的技术形态,正逐步走进我们的生活,并在多个领域展现出其独特的应用价值和广阔的发展前景。尤其是伴随着 AI 技术不断发展,传统数字耗时长、效率低
    的头像 发表于 03-10 11:10 2918次阅读
    2 分钟生成<b class='flag-5'>数字</b><b class='flag-5'>人</b>视频!华为云 Flexus <b class='flag-5'>数字</b><b class='flag-5'>人</b>助力中小企业高效创作

    不到千元即可拥有专属数字!华为云 Flexus 数字应用范围有多广?

    随着技术的进步,用户对数字的互动性和个性化需求也在增加,倒逼行业不断优化技术创新与产品研发。但数字的制作涉及多个环节,从基础的建模到动画制作,再到最终的渲染,这一过程中
    的头像 发表于 03-10 11:04 732次阅读
    不到千元即可拥有专属<b class='flag-5'>数字</b><b class='flag-5'>人</b>!华为云 Flexus <b class='flag-5'>数字</b><b class='flag-5'>人</b>应用范围有多广?

    不到千元体验最新数字技术!华为云 Flexus 数字效果领先更超值

    当下,数字的应用已经非常广泛,彻底走进了我们的日常生活。在教育领域,可以看到数字被用于制作教学视频,通过模拟真实的教师讲解,为学生提供生动、直观的学习材料;在政府服务大厅,有
    的头像 发表于 03-10 11:04 733次阅读
    不到千元体验最新<b class='flag-5'>数字</b><b class='flag-5'>人</b>技术!华为云 Flexus <b class='flag-5'>数字</b><b class='flag-5'>人</b>效果领先更超值

    数字加速奔向大众生活!华为云 Flexus 数字完美契合中小企业需求

    近年来,由于人工智能、虚拟现实等技术的发展,以虚拟主播、虚拟偶像、虚拟员工为代表的数字频繁“现身”金融、文娱、互联网等各个行业,进一步释放商业价值。 数字⼈的概念已经愈发普及,但在具体应⽤层⾯,仍
    的头像 发表于 03-10 10:35 2785次阅读
    <b class='flag-5'>数字</b><b class='flag-5'>人</b>加速奔向大众生活!华为云 Flexus <b class='flag-5'>数字</b><b class='flag-5'>人</b>完美契合中小企业需求

    超低门槛体验华为云 Flexus 数字,让数字技术不再“高高在上

    2024 年 11 月底,《数字虚拟人技术要求》正式出台,详细规定了广播电视和网络视听行业数字的技术要求,成为我国电视和网络视听推荐性行业标准。该标准的出台,一方面将有效规范快速发展的数字
    的头像 发表于 03-10 10:33 2808次阅读
    超低门槛体验华为云 Flexus <b class='flag-5'>数字</b><b class='flag-5'>人</b>,让<b class='flag-5'>数字</b><b class='flag-5'>人</b>技术不再“高高在上

    普渡机器接入DeepSeek满血版模型

    自2月20日起,普渡机器正式接入DeepSeek满血版模型,机器智能语音交互能力迎来智能化升级里程碑!此次升级中,首批搭载该模型的贝拉Pro机器
    的头像 发表于 02-20 16:50 1343次阅读

    VirtualLab Fusion应用:具有二维出瞳扩展和模型复杂光波导系统

    评估。 任务描述 光导元件 出瞳扩展器(EPE)区 耦出区域 模型 摘要-组件 系统中不同位置/平面上的场 MTF和PSF–计算 光导的横向均匀性评估 VirtualLab Fusion 技术
    发表于 02-08 09:00

    【「具身智能机器系统」阅读体验】2.具身智能机器人大模型

    的局限性以及衡量大模型的关键指标。阅读了该部分,我感受到了一种前所未有的震撼,这种震撼不仅来源于技术本身的先进性,更来源于它对传统机器控制方式的颠覆。 传统机器的局限性与大
    发表于 12-29 23:04

    《具身智能机器系统》第7-9章阅读心得之具身智能机器与大模型

    研读《具身智能机器系统》第7-9章,我被书中对大模型与机器技术融合的深入分析所吸引。第7章详细阐述了ChatGPT for Robotics的核心技术创新:它摒弃了传统的分层控制架构,创造性地
    发表于 12-24 15:03