0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

腾讯携手清华港科大推出图生视频模型:Follow-Your-Click,实现在线物体追踪

微云疏影 来源:综合整理 作者:综合整理 2024-03-15 16:24 次阅读

3 月 15 日消息,腾讯与清华大学及香港科技大学联合发布新型图生视频模型 “Follow-Your-Click”,已上线 GitHub(代码于四月份公开)并发布相关研究论文(查阅地址:DOI:2403.08268)。

该模型以局部动态生成及多物体动画为主打性能,支持多样化动作,如头部运动、翅膀震动等。

据了解,在这款名为 “Follow-Your-Click” 的视频模型中,用户仅需利用点击与明确指令便可实现图案的局部动画效果。用户只需轻点所需位置,再输入微量提示词汇,原先静态的图像便能立即呈现出动态效果,无需繁琐程序,轻松实现物体自动微笑、舞蹈乃至飞翔等视觉效果。

此外,该系统还能协同处理多个对象的动画效果,提升动画的复杂度及多样性。用户可通过简单的点击和短语提醒轻松选定需要动画转变的区域以及动作类型,无需冗长描述或额外操理解释。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 图像
    +关注

    关注

    2

    文章

    1064

    浏览量

    40042
  • 腾讯
    +关注

    关注

    7

    文章

    1620

    浏览量

    49159
  • 模型
    +关注

    关注

    1

    文章

    2707

    浏览量

    47707
收藏 人收藏

    评论

    相关推荐

    科大讯飞创新推出长文本、长图文、长语音大模型,解决落地难题

    近期,科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型,该系统融合了多元化数据源,包括海量文字、图片以及会议音频等,能为各行业场景提供专业化、精准化的答案。
    的头像 发表于 04-28 09:32 75次阅读

    是德科技如何赋能医疗AI大模型应用呢?

    自从ChatGPT爆火以来,各种AI大模型纷纷亮相,如百度科技的文心一言,科大讯飞的讯飞星火,华为的盘古AI大模型腾讯的混元AI大模型、阿
    的头像 发表于 02-28 09:35 1973次阅读

    字节跳动推出创新视频模型Boximator,实现精确操控人物或物体动作

    针对 Boximator 的相关问题,字节跳动方回应指出,这只是视频生成对象移动技术方法的研究项目,暂不可能成为完整可用的产品。相比国外优秀的视频生成模型,其在图像质素、真实度以及视频
    的头像 发表于 02-20 13:49 195次阅读

    字节跳动推出一款颠覆性视频模型—Boximator

    在 Sora 引爆文生视频赛道之前,国内的字节跳动也推出了一款颠覆性视频模型——Boximator。
    的头像 发表于 02-20 13:44 468次阅读
    字节跳动<b class='flag-5'>推出</b>一款颠覆性<b class='flag-5'>视频</b><b class='flag-5'>模型</b>—Boximator

    科大讯飞星火认知大模型V3.5发布

    近日,科大讯飞举办了星火认知大模型V3.5升级发布会。在发布会上,科大讯飞董事长刘庆峰和研究院院长刘聪共同宣布了基于首个全国产算力训练的讯飞星火V3.5的全新升级。
    的头像 发表于 01-31 17:28 936次阅读

    Click:超好用的命令行界面实现工具

    Click 是一个简洁好用的Python模块,它能用尽量少的代码实现漂亮的命令行界面。它不仅开箱即用、还能支持高度自定义的配置。 一个简单的示例如下: import click
    的头像 发表于 10-30 10:37 262次阅读
    <b class='flag-5'>Click</b>:超好用的命令行界面<b class='flag-5'>实现</b>工具

    长城汽车携手科大讯飞搭建首个汽车产业知识大模型

    10月24日,正值2023科大讯飞全球1024开发者大会和2023科大讯飞智能汽车新品发布之际,长城汽车股份有限公司与科大讯飞股份有限公司签署了关于产业大模型及知识大脑战略合作协议。
    的头像 发表于 10-25 09:39 817次阅读

    移远通信携手MikroElektronika推出搭载LC29H定位模组的Click boards开发板,为物联网应用带来高精定位服务

    近日,移远通信与MikroElektronika(以下简称“MIKROE”)展开合作,基于移远LC29H系列模组推出了多款支持实时动态定位(RTK)和惯性导航(DR)技术的Click Boards™ 开发板,为物联网设备带来使用简单、性价比高的厘米级高精定位服务。
    的头像 发表于 10-19 11:21 476次阅读

    移远通信携手MIKROE推出搭载LC29H系列模组的Click boards开发板,为物联网应用带来高精定位服务

    近日,移远通信与MikroElektronika(以下简称“MIKROE”)展开合作,基于移远LC29H系列模组推出了多款支持实时动态载波相位差分技术(RTK)和惯性导航(DR)技术的Click
    发表于 10-18 11:20 667次阅读
    移远通信<b class='flag-5'>携手</b>MIKROE<b class='flag-5'>推出</b>搭载LC29H系列模组的<b class='flag-5'>Click</b> boards开发板,为物联网应用带来高精定位服务

    腾讯混元大模型将面向公众开放

    腾讯混元大模型是由腾讯自主研发的实用级大模型,参数规模超过千亿,预训练语料达到了2万亿tokens,具备出色的中文创作能力、复杂语境下的逻辑推理能力以及可靠的执行任务能力。
    的头像 发表于 09-18 16:31 831次阅读

    腾讯对外开放混元大模型

    混元大模型腾讯全链路自研的通用大语言模型,具备强大的中文创作能力、复杂语境下的逻辑推理能力以及可靠的任务执行能力。
    的头像 发表于 09-18 15:12 793次阅读
    <b class='flag-5'>腾讯</b>对外开放混元大<b class='flag-5'>模型</b>

    后发而先至的腾讯混元大模型,到底有哪些技术亮点?

    腾讯集团副总裁蒋杰在采访中介绍:“在腾讯内部,混元已经内测很久了,不是现在第一天才有。”腾讯是国内最早研究大模型的企业之一。2021年,
    的头像 发表于 09-12 17:25 982次阅读
    后发而先至的<b class='flag-5'>腾讯</b>混元大<b class='flag-5'>模型</b>,到底有哪些技术亮点?

    腾讯发布混元大语言模型

    腾讯发布混元大语言模型 腾讯全球数字生态大会上腾讯正式发布了混元大语言模型,参数规模超千亿,预训练语料超2万亿tokens。 作为
    的头像 发表于 09-07 10:23 854次阅读

    基于未知物体进行6D追踪和3D重建的方法

    如今,计算机视觉社区已经广泛展开了对物体姿态的 6D 追踪和 3D 重建。本文中英伟达提出了同时对未知物体进行 6D 追踪和 3D 重建的方法。该方法假设
    的头像 发表于 07-03 11:24 339次阅读
    基于未知<b class='flag-5'>物体</b>进行6D<b class='flag-5'>追踪</b>和3D重建的方法

    随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了

    ,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。 现在,一项称为「追踪一切」的新研究为动态视频
    的头像 发表于 06-11 21:40 317次阅读
    随时随地,<b class='flag-5'>追踪</b>每个像素,连遮挡都不怕的「<b class='flag-5'>追踪</b>一切」<b class='flag-5'>视频</b>算法来了