0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI图像编辑技术DragGAN开源,拖动鼠标即可改变人物笑容

jf_35673951 来源:jf_35673951 作者:jf_35673951 2023-06-29 10:34 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近来自马克斯・普朗克计算机科学研究所、MIT CSAIL和谷歌的研究者们研究了一种控制GAN的新方法DragGAN,这项技术的特点是,用户只要点击拖拽,就可以“改变汽车的尺寸或者将人物的笑容变成皱眉”。

其中演示的案例包括增加山峰的高度、改变模特的姿势和衣服的长度以及形状、张开或闭合狮子的嘴巴、将一个人的表情从平淡变成微笑等。

DragGAN是一个直观的图像编辑工具PM系统,用户只需要控制图像中的像素点和方向,就可以快速调整照片主体的位置、姿态、表情、大小和角度等。

而根据他们的说法,他们的方法是基于GAN的操作中优于SOTA,并为图像编辑开辟了新方向。

这种工具的潜力主要表现在,从文本生成图像的人工智能并不总是能输出你想要的结果,同时用户还可以在生成图像之后再进行重新编辑,而且不用重新生成新的图像。

以上源自互联网,版权归原作所有

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38087

    浏览量

    296408
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    使用Firebase AI Logic生成图像模型的两种新功能

    为您的应用添加自定义图像,能够显著改善和个性化用户体验,有效提高用户参与度。本文将探讨使用 Firebase AI Logic 生成图像的两种新功能: 其一是 Imagen 专属编辑
    的头像 发表于 11-30 09:28 203次阅读

    华为发布并开源创新AI容器技术Flex:ai

    11月21日,2025AI容器应用落地与发展论坛在上海举行。华为公司副总裁、数据存储产品线总裁周跃峰博士在论坛上正式发布AI容器技术——Flex:ai,同时,华为联合上海交通大学、西安
    的头像 发表于 11-25 15:34 335次阅读

    NVIDIA推出面向语言、机器人和生物学的全新开源AI技术

    NVIDIA 秉持对开源的长期承诺,推出了面向语言、机器人和生物学的全新开源 AI 技术,为构建开源生态系统做出贡献,扩展
    的头像 发表于 11-06 11:49 682次阅读

    基于开源鸿蒙的图片编辑开发样例(2)

    本期内容介绍基于开源鸿蒙在RK3568上开发图片编辑样例的全流程,分为上篇和下篇,本篇为下篇,主要介绍标记、保存图片功能。
    的头像 发表于 10-31 09:19 2775次阅读
    基于<b class='flag-5'>开源</b>鸿蒙的图片<b class='flag-5'>编辑</b>开发样例(2)

    基于开源鸿蒙的图片编辑开发样例(1)

    本期内容介绍基于开源鸿蒙在RK3568上开发图片编辑样例的全流程,分为上篇和下篇,本篇为上篇,主要介绍添加相册图片、编译图片功能。
    的头像 发表于 10-31 09:16 2758次阅读
    基于<b class='flag-5'>开源</b>鸿蒙的图片<b class='flag-5'>编辑</b>开发样例(1)

    【Sipeed MaixCAM Pro开发板试用体验】基于MaixCAM-Pro的AI生成图像鉴别系统

    技术落地到了一个小小的边缘设备MaixCAM-Pro上。它不仅展示了深度学习在图像取证领域的强大能力,更体现了边缘AI在现实世界中的应用价值——无需依赖云端,即可在本地快速、安全、低成
    发表于 08-21 13:59

    任正非说 AI已经确定是第四次工业革命 那么如何从容地加入进来呢?

    实践。 为开源项目贡献代码或者文档。比如,帮助完善一个机器学习数据集的加载模块的代码,或者撰写某个AI算法的使用说明文档。这不仅可以提升自己的技术能力,还能在AI社区中建立自己的声誉。
    发表于 07-08 17:44

    迅为RK3568开发板Dev-Eco studio 的界面布局-导航栏-代码编辑

    前显示行号 +- 按钮可以按照模块折叠代码。 ctrl+鼠标滚轮放大或者缩小代码字体。 按住鼠标左键,拖动文件,可以分屏展示。
    发表于 06-20 11:12

    首创开源架构,天玑AI开发套件让端侧AI模型接入得心应手

    模型库的限制,联发科还首发了开源弹性架构。区别于过往的开放接口,只能部署特定架构模型,开放弹性架构允许开发者直接调整平台源代码,无需等待芯片厂商的支持,即可完成目标或其他自研大模型轻松部署。让AI
    发表于 04-13 19:52

    开源AI MPU

    1. 基于RISC-V的开源AI MPU/加速器 ‌ ‌**(1) SiFive Intelligence系列**‌ ‌ 特点 ‌:SiFive提供开源的RISC-V IP核,支持AI
    的头像 发表于 04-02 17:44 2139次阅读

    声云AI语音鼠标开启智能办公新时代

    在数字化飞速发展的当下,人们对输入设备的效率和便捷性有了更高的追求。传统鼠标只能实现基本的指针控制,在文字输入场景下,键盘输入速度受限且在特殊环境中使用不便。而声云 AI 语音鼠标方案的问世,正是为了满足用户对高效、便捷输入的迫
    的头像 发表于 03-19 09:43 1076次阅读

    Banana Pi 与瑞萨电子携手共同推动开源创新:BPI-AI2N

    技术创新的共同追求,也为开源硬件行业的发展带来了更多可能性。BPI-AI2N & BPI-AI2N Carrier 将在 2025年3月11日-13日德国纽伦堡嵌入式世界展会
    发表于 03-12 09:43

    AI开源模型库有什么用

    AI开源模型库作为推动AI技术发展的重要力量,正深刻改变着我们的生产生活方式。接下来,AI部落小
    的头像 发表于 02-24 11:50 883次阅读

    AI技术与PLC编程融合

    如何将AI技术融入PLC编程软件
    发表于 02-14 15:55

    开源AI模型库是干嘛的

    开源AI模型库是指那些公开源代码、允许自由访问和使用的AI模型集合。这些模型通常经过训练,能够执行特定的任务。以下,是对开源
    的头像 发表于 12-14 10:33 1287次阅读