4 月 19 日报道,近期微软亚洲研究院推出了名为 VASA-1 的创新模型,针对静态肖像照片和录音音频片段,其能实现图片中角色的自动化配音。
该模型,尤其擅长展现逼真的面部表情及各类情绪,且嘴唇动作高度拟真。然而,尽管研究员坦承目前仍有不足之处,如无法精准处理头发等纤维质元素,但相较于其他类似模型,VASA-1 的表现已属优异。
此外,研究员还透露,VASA-1 在离线批量处理模式下,可生成分辨率高达 512*512 的动态短片,帧速率为 45fps;在线直播模式下,帧速率也可达到 40fps,延迟时间仅为 170ms。而完成这一切,只需一台搭载 NVIDIA RTX 4090 显卡的计算机即可。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
微软
+关注
关注
4文章
6723浏览量
107409 -
模型
+关注
关注
1文章
3656浏览量
51790 -
Vasa
+关注
关注
0文章
2浏览量
6667
发布评论请先 登录
相关推荐
热点推荐
纤纳光电获得2025年度浙江省企业研究院认定
近日,浙江省经济和信息化厅发布2025年度拟认定省企业研究院名单。经企业申报、县级审查、市级推荐、专家评审等程序,纤纳光电建设的“浙江省纤纳新能源钙钛矿技术企业研究院”成功入选。
广电计量与长沙三大研究院达成战略合作
11月26-27日,广电计量与长沙北斗产业安全技术研究院集团股份有限公司(简称“长沙北斗研究院”)、长沙量子测量产业技术研究院有限公司(简称“长沙量子研究院”)、湖南大学长沙半导体技术
广电计量携手南山研究院打造大健康产业新生态
10月19日, “南山研究院南海四周年系列活动”在广东省南山医药创新研究院(简称“南山研究院”)成功举办。期间,南山研究院与广电计量等多家单位联合共建的华南医学健康功效循证评价中心正式
今日看点丨亚马逊上海AI研究院解散;索尼拟出售以色列芯片部门
1、 亚马逊上海AI研究院解散! 据报道,AWS亚马逊云科技上海AI研究院的首席应用科学家王敏捷发朋友圈称,他们收到通知,AWS亚马逊云科技上海AI研究院(也是AWS最后一
发表于 07-24 09:42
•1361次阅读
商汤大装置万象大模型开发平台获得中国信通院最高评级
近日,中国信息通信研究院(以下简称“中国信通院”)完成可信AI《大模型推理平台通用能力成熟度》首轮评估。
导远科技与清华大学无锡应用技术研究院达成合作
近日,导远科技与清华大学无锡应用技术研究院(以下简称:研究院)达成合作。导远科技将提供高精度定位产品及解决方案,以支持研究院在L4级自动驾驶和人形机器人领域的技术研发及转化落地。
安徽省水利科学研究院携手中科曙光完成DeepSeek大模型部署
近日,安徽省(水利部淮河水利委员会)水利科学研究院携手中科曙光,成功完成国产大模型DeepSeek、BGE-M3嵌入模型及重排模型的本地化部署与测试,并顺利接入梅山水库运行管理矩阵平台
鲲云科技与中国工业互联网研究院成立AI+安全生产联合实验室
在 2025 年 1 月 14 日举行的智算创新研究院开业盛典上,鲲云科技与中国工业互联网研究院(以下简称“工联院”)正式宣布联合成立“AI+安全生产联合实验室”,工联
荣誉+1!利尔达物联网技术有限公司获“浙江省企业研究院”认定
研究院”。浙江省企业研究院是浙江省为全面深入实施创新驱动发展战略,构建和完善浙江省技术创新中心体系的重要组成部分。它是设在企业内部相对独立的具有较高层次和水平的省级
浪潮信息与智源研究院携手共建大模型多元算力生态
近日,浪潮信息与北京智源人工智能研究院正式签署战略合作协议,双方将紧密合作,共同构建大模型多元算力开源创新生态。 此次合作旨在提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛
安谋科技与智源研究院达成战略合作,共建开源AI“芯”生态
12月25日,安谋科技(中国)有限公司(以下简称“安谋科技”)与北京智源人工智能研究院(以下简称“智源研究院”)正式签署战略合作协议,双方将面向多元AI芯片领域开展算子库优化与适配、编译器与工具链
发表于 12-26 17:06
•639次阅读
浪潮信息与智源研究院达成战略合作协议
近日,浪潮信息与智源研究院达成战略合作协议,双方将紧密协作共建大模型多元算力开源创新生态,提升大模型创新研发的算力效率,降低大模型应用开发的算力门槛。目前,智源Triton算子库Fla
清新电源研究院荣获深圳市5A级社会组织
12月18日,2024年度市级社会组织等级评估授牌仪式在深圳市福田区深科技城顺利举行。深圳市清新电源研究院作为2024年度深圳市5A级社会组织接受授牌。深圳市清新电源研究院党支部书记、副院长杨洪青

微软亚洲研究院发布VASA-1模型,实现图片人物自动言语表达
评论