最近来自马克斯・普朗克计算机科学研究所、MIT CSAIL和谷歌的研究者们研究了一种控制GAN的新方法DragGAN,这项技术的特点是,用户只要点击拖拽,就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。
其中演示的案例包括增加山峰的高度、改变模特的姿势和衣服的长度以及形状、张开或闭合狮子的嘴巴、将一个人的表情从平淡变成微笑等。
DragGAN是一个直观的图像编辑工具PM系统,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。
而根据他们的说法,他们的方法是基于GAN的操作中优于SOTA,并为图像编辑开辟了新方向。
这种工具的潜力主要表现在,从文本生成图像的人工智能并不总是能输出你想要的结果,同时用户还可以在生成图像之后再进行重新编辑,而且不用重新生成新的图像。
以上源自互联网,版权归原作所有
审核编辑黄宇
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
AI
+关注
关注
89文章
38087浏览量
296408
发布评论请先 登录
相关推荐
热点推荐
使用Firebase AI Logic生成图像模型的两种新功能
为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文将探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑功
华为发布并开源创新AI容器技术Flex:ai
11月21日,2025AI容器应用落地与发展论坛在上海举行。华为公司副总裁、数据存储产品线总裁周跃峰博士在论坛上正式发布AI容器技术——Flex:ai,同时,华为联合上海交通大学、西安
NVIDIA推出面向语言、机器人和生物学的全新开源AI技术
NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展
【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统
技术落地到了一个小小的边缘设备MaixCAM-Pro上。它不仅展示了深度学习在图像取证领域的强大能力,更体现了边缘AI在现实世界中的应用价值——无需依赖云端,即可在本地快速、安全、低成
发表于 08-21 13:59
任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?
实践。
为开源项目贡献代码或者文档。比如,帮助完善一个机器学习数据集的加载模块的代码,或者撰写某个AI算法的使用说明文档。这不仅可以提升自己的技术能力,还能在AI社区中建立自己的声誉。
发表于 07-08 17:44
迅为RK3568开发板Dev-Eco studio 的界面布局-导航栏-代码编辑区
前显示行号 +- 按钮可以按照模块折叠代码。
ctrl+鼠标滚轮放大或者缩小代码字体。
按住鼠标左键,拖动文件,可以分屏展示。
发表于 06-20 11:12
首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手
模型库的限制,联发科还首发了开源弹性架构。区别于过往的开放接口,只能部署特定架构模型,开放弹性架构允许开发者直接调整平台源代码,无需等待芯片厂商的支持,即可完成目标或其他自研大模型轻松部署。让AI
发表于 04-13 19:52
开源的AI MPU
1. 基于RISC-V的开源AI MPU/加速器 **(1) SiFive Intelligence系列** 特点 :SiFive提供开源的RISC-V IP核,支持AI
声云AI语音鼠标开启智能办公新时代
在数字化飞速发展的当下,人们对输入设备的效率和便捷性有了更高的追求。传统鼠标只能实现基本的指针控制,在文字输入场景下,键盘输入速度受限且在特殊环境中使用不便。而声云 AI 语音鼠标方案的问世,正是为了满足用户对高效、便捷输入的迫
Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N
对技术创新的共同追求,也为开源硬件行业的发展带来了更多可能性。BPI-AI2N & BPI-AI2N Carrier 将在 2025年3月11日-13日德国纽伦堡嵌入式世界展会
发表于 03-12 09:43

AI图像编辑技术DragGAN开源,拖动鼠标即可改变人物笑容
评论