0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

字节跳动发布OmniHuman 多模态框架

麦辣鸡腿堡 来源:网络整理 2025-02-07 17:50 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

2 月 6 日消息,字节跳动近日发布了一项重大成果 ——OmniHuman 多模态框架,其优势在于其强大的视频生成能力。用户只需提供一张任意尺寸和人物占比的单张图片,再结合一段输入音频,就能生成栩栩如生的人物视频。

与传统 AI 模型不同,OmniHuman-1 能够生成逼真的全身动画,并且可以精准地将手势和面部表情与语音或音乐同步,打破了以往只能生成面部或上半身动画的局限。

基于约 19000 小时的人类运动数据训练,OmniHuman-1 模型支持不同的体型和画面比例,能在内存限制内生成任意长度的视频,并适应不同输入信号,在真实性和准确性方面超越其他同类动画工具。值得一提的是,它还支持卡通角色、人工物体、动物以及复杂姿势的输入,确保生成的动作特征与每种风格的独特特点相匹配。

在实际应用场景中,OmniHuman 潜力巨大。在影视制作领域,创作者能轻松为虚拟角色打造全身动作戏份;虚拟直播里,主播动作更加自然,可增强直播的趣味性与吸引力;游戏世界中,数字人 NPC 的动作和表情更丰富,能提升玩家的沉浸感。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302534
  • 人工智能
    +关注

    关注

    1819

    文章

    50298

    浏览量

    266844
  • 字节跳动
    +关注

    关注

    0

    文章

    352

    浏览量

    10124
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    ADPD4000/ADPD4001:模态传感器前端的卓越之选

    ADPD4000/ADPD4001:模态传感器前端的卓越之选 在当今电子设备日益智能化、多功能化的时代,模态传感器前端的需求愈发迫切。ADPD4000/ADPD4001作为一款性能
    的头像 发表于 03-27 14:45 164次阅读

    海光DCU完成Qwen3.5模态MoE模型全量适配

    近日,海光DCU完成Qwen3.5-397B MoE旗舰模态模型、Qwen3.5-35B-A3B MoE模态模型全量适配、精度对齐与推理部署验证。本次适配依托FlagOS专属vLL
    的头像 发表于 03-26 09:35 646次阅读

    全球首个最大规模跨本体视触觉模态数据集白虎-VTouch发布

    全球首个最大规模跨本体视触觉模态数据集——白虎-VTouch(Vision-Based Tactile Sensor),总规模超过60,000分钟。
    的头像 发表于 01-29 14:41 724次阅读

    惠伦晶体助力字节豆包AI眼镜新体验

    近日,行业备受瞩目的“豆包”AI眼镜发布新动态,这款由字节跳动与龙旗科技联合研发的眼镜,搭载自研空间算法芯片,整体重量不足50克,展示了AI眼镜发展的新方向。
    的头像 发表于 01-09 11:23 787次阅读
    惠伦晶体助力<b class='flag-5'>字节</b>豆包AI眼镜新体验

    格灵深瞳模态大模型荣登InfoQ 2025中国技术力量年度榜单

    灵感实验室联合LLaVA社区发布模态大模型LLaVA-OneVision-1.5,实现了训练数据、代码和模型权重的全链路开源,在多项公开模态
    的头像 发表于 01-05 10:05 649次阅读

    模态感知大模型驱动的密闭空间自主勘探系统的应用与未来发展

        模态感知大模型驱动的密闭空间自主勘探系统    北京华盛恒辉模态感知大模型驱动的密闭空间自主勘探系统,是融合
    的头像 发表于 12-29 11:27 432次阅读

    涂鸦Omni AI Foundation V2.6发布:低代码+模态,重塑AI硬件创新体验

    硬件产品的落地。今天,我们非常高兴地宣布:面向模态AI硬件的基座平台OmniAIFoundation正式发布V2.6版本。本次升级不仅显著提升了端到端
    的头像 发表于 12-24 18:58 650次阅读
    涂鸦Omni AI Foundation V2.6<b class='flag-5'>发布</b>:低代码+<b class='flag-5'>多</b><b class='flag-5'>模态</b>,重塑AI硬件创新体验

    模态大模型驱动的复杂环境精准导航避障系统平台的应用

    模态大模型驱动的复杂环境精准导航避障系统平台的应用
    的头像 发表于 12-22 13:15 390次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>大模型驱动的复杂环境精准导航避障系统平台的应用

    商汤科技正式发布并开源全新模态模型架构NEO

    商汤科技正式发布并开源了与南洋理工大学S-Lab合作研发的全新模态模型架构 —— NEO,为日日新SenseNova 模态模型奠定了新一
    的头像 发表于 12-08 11:19 1150次阅读
    商汤科技正式<b class='flag-5'>发布</b>并开源全新<b class='flag-5'>多</b><b class='flag-5'>模态</b>模型架构NEO

    亚马逊云科技上线Amazon Nova模态嵌入模型

    Embeddings模态嵌入模型现已在Amazon Bedrock上线,这是一款专为Agentic RAG与语义搜索应用打造的顶尖模态嵌入模型。该模型是首个通过单一模型支持文本、
    的头像 发表于 10-29 17:15 359次阅读
    亚马逊云科技上线Amazon Nova<b class='flag-5'>多</b><b class='flag-5'>模态</b>嵌入模型

    浅析模态标注对大模型应用落地的重要性与标注实例

    ​在人工智能迈向AGI通用智能的关键道路上,大模型正从单一的文本理解者,演进为能同时看、听、读、想的“多面手”。驱动这一进化的核心燃料,正是高质量的模态数据,而将原始数据转化为“机器可读教材
    的头像 发表于 09-05 13:49 2727次阅读

    商汤科技模态通用智能战略思考

    时间是最好的试金石,AI领域尤其如此。当行业热议大模型走向时,商汤早已锚定“模态通用智能”——这是我们以深厚研究积累和实践反复验证的可行路径。
    的头像 发表于 08-14 09:33 1295次阅读

    “端云+模态”新范式:《移远通信AI大模型技术方案白皮书》正式发布

    7月28日,移远通信联合智次方研究院正式发布《AI大模型技术方案白皮书》(以下简称“白皮书”)。这份白皮书系统梳理了AI大模型的技术特点、产业发展态势与多元应用场景,以及移远通信“端云+模态”AI
    的头像 发表于 07-28 13:08 1389次阅读
    “端云+<b class='flag-5'>多</b><b class='flag-5'>模态</b>”新范式:《移远通信AI大模型技术方案白皮书》正式<b class='flag-5'>发布</b>

    润和软件发布StackRUNS异构分布式推理框架

    当下,AI模型规模持续膨胀、模态应用场景日益复杂,企业正面临异构算力资源碎片化带来的严峻挑战。为应对行业痛点,江苏润和软件股份有限公司(以下简称“润和软件”)正式发布自主研发的StackRUNS异构分布式推理
    的头像 发表于 06-13 09:10 1595次阅读
    润和软件<b class='flag-5'>发布</b>StackRUNS异构分布式推理<b class='flag-5'>框架</b>

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式

    模态+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式
    的头像 发表于 06-12 10:17 772次阅读
    <b class='flag-5'>多</b><b class='flag-5'>模态</b>+空间智能:盾华以AI+智慧路灯杆,点亮城市治理新方式