4 月 19 日报道,近期微软亚洲研究院推出了名为 VASA-1 的创新模型,针对静态肖像照片和录音音频片段,其能实现图片中角色的自动化配音。
该模型,尤其擅长展现逼真的面部表情及各类情绪,且嘴唇动作高度拟真。然而,尽管研究员坦承目前仍有不足之处,如无法精准处理头发等纤维质元素,但相较于其他类似模型,VASA-1 的表现已属优异。
此外,研究员还透露,VASA-1 在离线批量处理模式下,可生成分辨率高达 512*512 的动态短片,帧速率为 45fps;在线直播模式下,帧速率也可达到 40fps,延迟时间仅为 170ms。而完成这一切,只需一台搭载 NVIDIA RTX 4090 显卡的计算机即可。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6760浏览量
108159 -
模型
+关注
关注
1文章
3873浏览量
52341 -
Vasa
+关注
关注
0文章
2浏览量
6682
发布评论请先 登录
相关推荐
热点推荐
合肥综合性国家科学中心人工智能研究院与大华股份达成战略合作
近日,合肥综合性国家科学中心人工智能研究院(以下简称“人工智能研究院”)与大华股份“IAI-Dahua视频物联智能体联合实验室”签约及揭牌仪隆重举行。中国科学技术大学党委常委、副校长、中国工程院院士
摩尔线程携手智源人工智能研究院Day-0适配DeepSeek-V4 Pro和Flash双模型
4月24日,摩尔线程联合北京智源人工智能研究院,基于旗舰级AI训推一体智算卡MTT S5000与FlagOS全栈软件体系,完成DeepSeek-V4系列两款模型推理“Day-0”适配,并在魔塔社区正式发布Pro和Flash两个版
中国移动研究院联合发布实时通信智能体CallingClaw
近日,中国移动研究院携手中国移动江苏公司及华为,正式发布基于OpenClaw的实时通信智能体CallingClaw,依托中国移动安全、可信的网络底座,将通话能力与OpenClaw深度结合,打造出一款“能办事、会成长、不设限”的个人通用助理。
MediaTek携手微软研究院联合开发有源光缆技术
MediaTek、微软研究院以及其他供应商所组成的研发团队,成功设计出新一代由微型化 MicroLED 光源驱动的有源光缆(AOC)。这一革命性的有源 MicroLED 光缆设计,相较于现有技术能够
施耐德电气中国研究院首届研发大会成功举办
日前,施耐德电气中国研究院首届研发大会(1st China Future Ready R&D Days)在位于上海张江科学城的中国研发中心成功举办。
诚迈科技携手应急管理大学、中铁十九局共建智慧应急科技创新研究院
1月25日,由诚迈科技、应急管理大学、中铁十九局共同组建的智慧应急科技创新研究院(以下简称“研究院”)在应急管理大学南校区正式启动。应急管理大学党委书记赵峰华,中铁十九局党委常委、副总经理赵琦,诚迈
纤纳光电获得2025年度浙江省企业研究院认定
近日,浙江省经济和信息化厅发布2025年度拟认定省企业研究院名单。经企业申报、县级审查、市级推荐、专家评审等程序,纤纳光电建设的“浙江省纤纳新能源钙钛矿技术企业研究院”成功入选。
广电计量与长沙三大研究院达成战略合作
11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
广电计量携手南山研究院打造大健康产业新生态
10月19日, “南山研究院南海四周年系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单位联合共建的华南医学健康功效循证评价中心正式
今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门
1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海AI研究院(也是AWS最后一
发表于 07-24 09:42
•1484次阅读
勇艺达人工智能研究院迎大咖加盟
近日,深圳勇艺达总部隆重举行 “数智融合 聚贤赋能 —— 勇艺达人工智能研究院高端人才聘任仪式”,正式聘请黄道权先生与吴天准先生加盟,为研究院注入顶尖智慧力量,此举标志着勇艺达在人工智能领域的战略布局迈出关键一步,也是践行 “人机智慧融合领航者” 使命的重要举措。
商汤大装置万象大模型开发平台获得中国信通院最高评级
近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI《大模型推理平台通用能力成熟度》首轮评估。
导远科技与清华大学无锡应用技术研究院达成合作
近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
微软亚洲研究院发布VASA-1模型,实现图片人物自动言语表达
评论