0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

字节跳动推出创新视频模型Boximator,实现精确操控人物或物体动作

微云疏影 来源:综合整理 作者:综合整理 2024-02-20 13:49 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

据悉,Sora 点燃了文生视频赛道,而在这之前,国内的字节跳动也已研发出一种创新性的视频模型 Boximator。区别于 Gen-2、Pink1.0 等模型,Boximator 能精确操控视频中的人物或物体动作。

针对 Boximator 的相关问题,字节跳动方回应指出,这只是视频生成对象移动技术方法的研究项目,暂不可能成为完整可用的产品。相比国外优秀的视频生成模型,其在图像质素、真实度以及视频长度等方面仍存在明显短板。

早前,据 IT 之家报道,OpenAI 新推出的文生视频大模型 Sora,通过快速文本提示即可创作出逼真的、富于想象力的 60 秒视频,并支持在单视频中实现多场景切换,有效保留角色和视觉风格。OpenAI 承诺将向视觉艺术家、设计师及电影制作者开放 Sora 访问权限。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3814

    浏览量

    52261
  • 字节跳动
    +关注

    关注

    0

    文章

    352

    浏览量

    10125
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10271
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    这类开发板通常基于全志 H3 瑞芯微 RK 系列芯片能做什么

    YOLO Tiny),实现边缘视觉检测,例如在小型监控场景中识别人员物体。 3. 教学与创客项目 用于嵌入式系统、Linux编程的教学实验,兼容树莓派引脚定义,可直接复用树莓派的教学资源。 制作便携
    发表于 02-01 12:41

    AutoDrill 推出创新型在线产品配置器,提升客户体验

    工业制造商为工程师增加了数字工具,用于配置和下载 AutoDrill 2000 系列的 3D CAD 模型。 AutoDrill 是钻孔、攻丝和其他金属加工设备的领先供应商,它自豪地宣布推出
    发表于 01-26 14:08

    惠伦晶体助力字节豆包AI眼镜新体验

    近日,行业备受瞩目的“豆包”AI眼镜发布新动态,这款由字节跳动与龙旗科技联合研发的眼镜,搭载自研空间算法芯片,整体重量不足50克,展示了AI眼镜发展的新方向。
    的头像 发表于 01-09 11:23 799次阅读
    惠伦晶体助力<b class='flag-5'>字节</b>豆包AI眼镜新体验

    京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体

    随着京东 11.11 大促的火热进行,京东直播再度升级技术布局,以 “立影 3D 技术”“JoyAI大模型”等创新技术,打破传统直播边界,为用户带来更具沉浸感、趣味性的购物体验,引领直播电商技术
    的头像 发表于 10-27 14:58 720次阅读

    商汤如影图片数字人技术闪耀央视舞台

    依托商汤日日新大模型的多模态能力,只需上传一张人物照片,输入文字脚本音频文件,AI 就能自动生成人物动态视频,并支持多种语言,
    的头像 发表于 09-22 16:18 1133次阅读

    佑驾创新发布无人物流品牌“小竹无人车”

    9月15日,佑驾创新(2431.HK)于深圳正式发布旗下无人物流品牌“小竹无人车”,实现从L1到L4的又一次极致进化,为行业带来了全新的车规级无人物流产品选择。
    的头像 发表于 09-16 10:27 868次阅读

    单板挑战4路YOLOv8!米尔瑞芯微RK3576开发板性能实测

    4.YOLOv8s-obb.float 旋转目标检测模型 上面已经看到了单独解析视频时,每一种模型效果,接下来演示MYD-LR3576通过4路摄像头同时推导效果。 实现方式如下:MY
    发表于 09-12 17:52

    DITEK 浪涌保护器推出在线 CAD 配置器

    拥有 30 多年浪涌保护解决方案经验的领先企业DITEK Surge Protection 推出了由 CADENAS 开发的在线 CAD 配置器。这一创新工具为 DITEK 的全系列浪涌保护装置
    发表于 07-21 16:58

    研华科技携手创新奇智推出多模态大模型AI一体机

    这是一款基于研华高性能边缘计算平台MIC-733,深度集成创新奇智视觉小模型与多模态大模型的边缘智能终端,通过创新的“视觉识别 + 深度语义理解”融合分析路径,具备强大的本地
    的头像 发表于 07-17 17:14 1072次阅读
    研华科技携手<b class='flag-5'>创新</b>奇智<b class='flag-5'>推出</b>多模态大<b class='flag-5'>模型</b>AI一体机

    UWB雷达如何精确感测

    超宽带(UWB)技术被广泛认为是实现位置、距离和方向精确、安全、实时测量的最佳测距技术。除此之外,UWB还能作为雷达技术实现环境感知。与测距功能相似,UWB雷达利用 UWB极宽的500MHz带宽和极短的2纳秒脉冲,对
    的头像 发表于 07-07 11:24 1358次阅读
    UWB雷达如何<b class='flag-5'>精确</b>感测

    NVIDIA助力图灵新讯美推出企业级多模态视觉大模型融合解决方案

    中国推出企业级多模态视觉大模型融合解决方案,推动先进 AI 模型在交通治理、工业质检、金融风控等领域实现高效识别、精准预警和稳定交付。
    的头像 发表于 06-26 09:17 1504次阅读

    【正点原子STM32MP257开发板试用】基于 YOLO 模型物体识别

    【正点原子STM32MP257开发板试用】基于 YOLO 模型物体识别 本文介绍了正点原子 STM32MP257 开发板基于 YOLO-v5 模型实现
    发表于 06-21 16:32

    4K、多模态、长视频:AI视频生成的下一个战场,谁在领跑?

    电子发烧友网报道(文/李弯弯) 6月11日,豆包App上线视频生成模型豆包Seedance 1.0 pro。这是字节跳动最新视频
    的头像 发表于 06-16 00:13 7543次阅读

    大象机器人携手进迭时空推出 RISC-V 全栈开源六轴机械臂产品

    全球80多个国家和地区。 近日,大象机器人联合进迭时空推出全球首款RISC-V全栈开源六轴机器臂“myCobot 280 RISC-V”,为开发者打造全新的机器人开源创新平台。 “myCobot 280
    发表于 04-25 17:59

    火山引擎2025“大模型+智能硬件”机智云特邀研讨会圆满收官 共绘万物智能产业蓝图

    4月19日下午,由机智云与字节跳动旗下火山引擎联合主办的「擎启大模型:从万物互联到万物智能——2025大模型+智能硬件特邀研讨会」,在深圳湾字节
    的头像 发表于 04-24 11:10 1535次阅读
    火山引擎2025“大<b class='flag-5'>模型</b>+智能硬件”机智云特邀研讨会圆满收官 共绘万物智能产业蓝图