3 月 15 日消息,腾讯与清华大学及香港科技大学联合发布新型图生视频模型 “Follow-Your-Click”,已上线 GitHub(代码于四月份公开)并发布相关研究论文(查阅地址:DOI:2403.08268)。
该模型以局部动态生成及多物体动画为主打性能,支持多样化动作,如头部运动、翅膀震动等。
据了解,在这款名为 “Follow-Your-Click” 的视频模型中,用户仅需利用点击与明确指令便可实现图案的局部动画效果。用户只需轻点所需位置,再输入微量提示词汇,原先静态的图像便能立即呈现出动态效果,无需繁琐程序,轻松实现物体自动微笑、舞蹈乃至飞翔等视觉效果。
此外,该系统还能协同处理多个对象的动画效果,提升动画的复杂度及多样性。用户可通过简单的点击和短语提醒轻松选定需要动画转变的区域以及动作类型,无需冗长描述或额外操理解释。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
图像
+关注
关注
2文章
1064浏览量
40042 -
腾讯
+关注
关注
7文章
1620浏览量
49159 -
模型
+关注
关注
1文章
2707浏览量
47707
发布评论请先 登录
相关推荐
科大讯飞创新推出长文本、长图文、长语音大模型,解决落地难题
近期,科大讯飞推出了首个支持长文本、长图及语音大数据处理的大模型,该系统融合了多元化数据源,包括海量文字、图片以及会议音频等,能为各行业场景提供专业化、精准化的答案。
是德科技如何赋能医疗AI大模型应用呢?
自从ChatGPT爆火以来,各种AI大模型纷纷亮相,如百度科技的文心一言,科大讯飞的讯飞星火,华为的盘古AI大模型,腾讯的混元AI大模型、阿
字节跳动推出创新视频模型Boximator,实现精确操控人物或物体动作
针对 Boximator 的相关问题,字节跳动方回应指出,这只是视频生成对象移动技术方法的研究项目,暂不可能成为完整可用的产品。相比国外优秀的视频生成模型,其在图像质素、真实度以及视频
科大讯飞星火认知大模型V3.5发布
近日,科大讯飞举办了星火认知大模型V3.5升级发布会。在发布会上,科大讯飞董事长刘庆峰和研究院院长刘聪共同宣布了基于首个全国产算力训练的讯飞星火V3.5的全新升级。
Click:超好用的命令行界面实现工具
Click 是一个简洁好用的Python模块,它能用尽量少的代码实现漂亮的命令行界面。它不仅开箱即用、还能支持高度自定义的配置。 一个简单的示例如下: import click
长城汽车携手科大讯飞搭建首个汽车产业知识大模型
10月24日,正值2023科大讯飞全球1024开发者大会和2023科大讯飞智能汽车新品发布之际,长城汽车股份有限公司与科大讯飞股份有限公司签署了关于产业大模型及知识大脑战略合作协议。
移远通信携手MikroElektronika推出搭载LC29H定位模组的Click boards开发板,为物联网应用带来高精定位服务
近日,移远通信与MikroElektronika(以下简称“MIKROE”)展开合作,基于移远LC29H系列模组推出了多款支持实时动态定位(RTK)和惯性导航(DR)技术的Click Boards™ 开发板,为物联网设备带来使用简单、性价比高的厘米级高精定位服务。
移远通信携手MIKROE推出搭载LC29H系列模组的Click boards开发板,为物联网应用带来高精定位服务
近日,移远通信与MikroElektronika(以下简称“MIKROE”)展开合作,基于移远LC29H系列模组推出了多款支持实时动态载波相位差分技术(RTK)和惯性导航(DR)技术的Click
发表于 10-18 11:20
•667次阅读
腾讯混元大模型将面向公众开放
腾讯混元大模型是由腾讯自主研发的实用级大模型,参数规模超过千亿,预训练语料达到了2万亿tokens,具备出色的中文创作能力、复杂语境下的逻辑推理能力以及可靠的执行任务能力。
腾讯发布混元大语言模型
腾讯发布混元大语言模型 腾讯全球数字生态大会上腾讯正式发布了混元大语言模型,参数规模超千亿,预训练语料超2万亿tokens。 作为
随时随地,追踪每个像素,连遮挡都不怕的「追踪一切」视频算法来了
,让计算机视觉(CV)领域研究者惊呼:「CV 不存在了」。之后,CV 领域掀起了一阵「二创」狂潮,一些工作陆续在分割的基础上结合目标检测、图像生成等功能,但大部分研究是基于静态图像的。 现在,一项称为「追踪一切」的新研究为动态视频
评论