0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

隐藏在Microsoft Designer背后的新科技,让人人都是设计师

微软科技 来源:未知 2023-06-25 00:15 次阅读

在视觉图像设计中,用户的需求与最终的设计成品往往是“想象很美好,现实很骨感”。这通常是因为用户在与设计师沟通时,双方理解不一致,导致最终设计结果不尽如人意。但是,如果能够“自给自足”,借助人工智能技术为每个人赋予设计能力,是否会更容易让自己脑海中的画面变为现实?智能化设计工具 Microsoft Designer 就是一个能辅助用户成为设计师的好帮手。

2022年10月,微软在 Ignite 大会上发布了 Microsoft Designer 内测版,为 Microsoft 365 家族再添一个视觉生产力工具。2023年4月27日,经过半年的迭代和改进,微软宣布推出 Microsoft Designer 公开预览版。利用人工智能技术“猜想”用户的想法,智能辅助生成文字提示和视觉图像,Microsoft Designer 大大降低了设计难度,让人人都能成为视觉设计师。

如今,市场上充斥着各种各样视觉的设计工具,然而这些专业软件有很高的技术门槛且操作复杂,非专业人员难以熟练使用。也有一些工具提供了海量的模板库,用户可以基于模板进行修改,虽然这简化了部分操作,但其呈现效果与用户的设想仍有不小的差距。Microsoft Designer 则能够智能理解用户的需求,自动生成文字表述,实现从文字到视觉图像的自动化创造,并将这些素材用于设计项目。

作为智能化的设计工具,Microsoft Designer 将先进的科研成果快速吸纳并转化为生产力,其中包括来自微软亚洲研究院视觉计算组的 Provence、Swin Transformer 模型,自然语言计算组与微软图灵团队合作的图灵通用语言表示模型,系统研究组的SPANN(存储器-磁盘混合索引和搜索系统)算法等众多前沿技术。

6d050b5e-12a9-11ee-962d-dac502259ad0.png

厚积薄发:Provence多模态内容推荐模型助力实现“一键式”设计配图

微软亚洲研究院很早就开始研究通过自然语言生成图像或视频的技术。2018年,正值短视频发展的上升时期,研究员们意识到视频化的传播形态将成为未来互联网主要的沟通交流方式。然而视频内容的制作流程繁杂,高质量视频的拍摄更需要专业人员的参与,那么是否可以通过技术创新创造出一个简化视频制作和生成的工具?在这一目标的驱动下,视觉计算组开始了文字到图像和视觉的生成技术的研究。

经过一年多的潜心钻研,2020年视觉计算组推出了第一代基于检索的文字到视频的生成模型 Provence(Retrieval-based text-to-video generation)。Provence 模型能够根据文本描述搜索相匹配的视频或图像,同时确保跨模态对应具有较高的准确率,达到了“一键式(即检索到的第一个图像推荐就是用户所需)”的水平。

Provence 模型的潜力很快就被微软 Microsoft 365 产品部门发现,并将其引入到了 PowerPoint Design Ideas(PowerPoint 设计器)功能中。为了更好地满足产品端的工程化需求,微软多个研究组的研究员们将 Provence 与 Swin Transformer、图灵通用语言表示模型和 SPANN 算法结合,在 Design Ideas 功能的底层构建了零样本多模态的内容检索引擎,让用户在几秒钟内就能通过文字自动检索出最适合于当前幻灯片的配图,并给出布局设计建议,良好的使用体验让 Design Ideas 功能的用户使用率提升了20%以上。

图1:Provence 模型分别应用于 PowerPoint Design Ideas,Microsoft Designer 及其生态系统中

2021年3月,在微软内部的骇客松(Hackathon)活动期间,Microsoft 365 产品团队通过与研究员们的思想碰撞,更加深入地了解了机器学习领域的前沿技术趋势,不仅看到了走向成熟的 Provence 检索技术,也看到了更多创新的机器学习算法的应用潜力。由此,双方共同发起了 Designer in Edge 的 Hackathon 项目,此后这一项目进入产品化迭代过程,也形成了如今的 Microsoft Designer 和 Designer Platform 这两款由人工智能驱动的产品。

微软 Microsoft 365 产品部副总裁张大川表示,“在与微软亚洲研究院多个研究组的交流中,我们看到了 Provence、Swin Transformer、图灵通用语言表示模型等诸多超前的 AI 技术理念,这些前沿技术完全满足 Microsoft Designer 及其生态系统的需求。双方的紧密合作,不仅大大加速了产品的创新周期,而且还革新了传统设计的流程。下一步,我们将共同致力于创新技术的落地应用,为全球用户提供更加便捷易用的视觉设计工具,更好地激发人们的创造力和创新力。”

“很高兴看到微软亚洲研究院越来越多的创新研究成果走向了实际应用,成为支持产品开发的核心技术。以 Microsoft Designer 为例,它的关键技术始于研究院五年前的创新突破,正是因为微软亚洲研究院持续致力于探索计算机领域前瞻性的基础研究,才使得这种拿来即用的技术转化成为可能。未来,微软亚洲研究院将一如既往地着眼于下一代革命性技术的研究,并将科研成果快速转化到微软的产品中,赋能更多用户。”微软亚洲研究院常务副院长郭百宁表示。

6d050b5e-12a9-11ee-962d-dac502259ad0.png

Microsoft Designer:

从多模态推荐走向具有“创作”能力的AI

生成式视觉设计的一个关键环节是用语言或者文字将用户脑海中想象的画面清晰地表达出来。因此,微软亚洲研究院视觉计算组的研究员们进一步对 Provence 模型进行了升级,让 Microsoft Designer 在从文字描述中精准检索出用户所需图像的基础上,又实现了根据用户意图智能输出文字提示的功能。

其核心思想是基于学习到的自动模板为不同的输入文本创建不同的提示,具体包括三个步骤:

  • 首先,将用户原始输入的文本与一组字符(token)结合,这些字符是对用户所需要的设计图像的视角、样式、氛围、用途等的描述。

  • 然后,根据美术设计的评分,使用学习到的自动模板找到与不同字符匹配的最佳组合。

  • 最后,将输入文本和自动模板提示的组合返回给用户,并使用评分指标对结果进行排序,再从中检索出最佳的图像。

智能输出提示文字,为用户原始的输入文本添加了更多的描述和细节,从而激励视觉模型“创作”出更符合用户需求的结果。如图2所示:用户输入“a cat hacker wearing a VR headset”后,Microsoft Designer 自动输出了相关的提示与图像。

图2:智能输出提示文字的流程

另外,研究员们还提出了一种检索增强提示的推荐方法,通过使用提示数据库来增强自动提示的结果。随着用户对 Microsoft Designer 的频繁使用,模型会学习到更多的提示,而这些数据将能进一步提高提示质量。如图3所示,对于用户输入,Microsoft Designer 会先使用语言模型从提示数据库中检索最相似的提示文本,然后通过评估分数对检索结果排序,再将自动提示与排序检索提示结合,以获得更好的结果。由于模型具有持续学习的特性,最终将有越来越多的用户数据纳入到提示数据库中来增强提示。

图3:检索增强提示

借助智能输出文字提示和智能图像生成的双重加持,用户可以更好地用文字描述出脑海中的画面,让 Microsoft Designer “创作”更符合需求的视觉图像,并从推荐的图像中选择出最匹配需求的用于后续的定制化设计。

由人工智能技术驱动的 Microsoft Designer 极大地降低了设计工作的专业门槛,让设计更加大众化,人人都能成为设计师。未来,Microsoft Designer 还将引入更多的人工智能算法,比如个性化的智能修图、借助大模型实现平面布局等等,以此丰富 Microsoft Designer 的功能,为更多用户带来更高水平的创意和创造力生产工具。

点击“阅读原文”即可试用 Microsoft Designer,开启属于你的 AI 设计之旅吧!

随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个需要攻坚的问题。微软主动采取了一系列措施来预判和降低人工智能技术所带来的风险。微软致力于依照以人为本的伦理原则推进人工智能的发展,早在2018年就发布了“公平、包容、可靠与安全、透明、隐私与保障、负责”六个负责任的人工智能原则(Responsible AI Principles),随后又发布了负责任的人工智能标准(Responsible AI Standards)将各项原则实施落地,并设置了治理架构确保各团队把各项原则和标准落实到日常工作中。微软也持续与全球的研究人员和学术机构合作,不断推进负责任的人工智能的实践和技术。

相关论文链接:

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

https://arxiv.org/abs/2103.14030

SPANN: Highly-efficient Billion-scale Approximate Nearest Neighbor Search

https://arxiv.org/abs/2111.08566

BEiT: BERT Pre-Training of Image Transformers

https://openreview.net/forum?id=p-BhZSz59o4

关注微软科技视频号

了解更多科技前沿资讯


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6253

    浏览量

    103085

原文标题:隐藏在Microsoft Designer背后的新科技,让人人都是设计师

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    学起来!做PCB设计师中最靓的崽

    咱就是说,作为一名合格的PCB设计师,怎么可能只是简单地画画电路板就行?那不得同时具备 超凡耐心和坚韧毅力 ,不然如何在反复迭代与精细调整中确保设计的准确无误;而且还得拥有 广博的知识储备 ,不然
    发表于 04-10 17:36

    关于32/64位Altium Designer与Access数据库兼容的问题

    Database Libraries(Dblib)是一个功能强大的元器件管理方案,但对于32位和64位版本的Altium Designer在使用Microsoft Access作为后端数据库时是有区别的。
    的头像 发表于 01-24 14:40 528次阅读

    那些隐藏在电阻器上的神秘数字

    电阻器,这个看似普通的电子元件,其实身上藏着一个巨大的秘密。那些看似随意的数字,其实都是电阻值的小提示。
    的头像 发表于 01-23 09:25 196次阅读

    开关背后隐藏着的学问

    在日常生活中,我们常常会忽略那些看似平凡的物品,比如一个开关。然而,当我们深入了解其背后的技术和原理时,我们会发现每一个细节都充满了挑战和深度。
    的头像 发表于 01-19 09:52 174次阅读
    开关<b class='flag-5'>背后</b><b class='flag-5'>隐藏</b>着的学问

    苹果iPhone17Pro或实现全屏无边框,采用LG Innotek的隐藏镜头技术

    韩国手机镜头模块大厂LG Innotek因应重要客户苹果需求,正着手开发荧幕下镜头,顾名思义是将镜头零组件完全隐藏在荧幕下,荧幕不需钻出镜头孔,主打无挖孔全荧幕体验。
    发表于 01-05 14:01 210次阅读

    立景创新科技联合华为打造高品质制造园区,柔性生产、高效运营

    路。”      ——立景创新科技有限公司 首席信息官 向令 立景创新成立于2018年,是立讯精密的重要策略联盟伙伴,也是国内领先的电子影像产品制造商,产品涉及汽车应用、手机终端应用、游戏设备应用及运动相机应用四大领域。立景创新作为业界领先的电子制造
    的头像 发表于 10-29 16:05 481次阅读
    立景创<b class='flag-5'>新科技</b>联合华为打造高品质制造园区,柔性生产、高效运营

    Testin云测成功入围2023中国新科技100强榜单

    9月26日,行业权威媒体Internet Deep(互联网周刊)重磅发布了【2023中国新科技100强】榜单,Testin云测凭借自身实力成功入围,同期入榜的还有联通数科、火山引擎、零数
    的头像 发表于 09-27 09:08 658次阅读

    如何控制PCB上飞线的显示或隐藏

    在使用Altium Designer的过程中 我们收到许多用户的提问 QA系列将针对用户关注度较高的问题 请Altium技术专家为大家答疑解惑 如何控制PCB上飞线的显示,我想显示或隐藏它们 连接线
    的头像 发表于 09-13 07:40 5956次阅读
    如何控制PCB上飞线的显示或<b class='flag-5'>隐藏</b>

    新科技与xMEMS宣布合作,携手打造高保真出色音质的TWS耳机

    来源:xMEMS 新加坡创新科技(Creative Technology)近日宣布与xMEMS Labs达成战略合作伙伴关系。xMEMS是固态保真的先驱者,通过将xMEMS的尖端MEMS固态扬声器
    的头像 发表于 08-21 14:16 524次阅读

    新科技与xMEMS宣布合作,携手打造高保真出色音质的TWS耳机

    中国,北京 -202 3 年 8 月 17 日 -新加坡创新科技(Creative Technology)近日宣布与xMEMS Labs达成战略合作伙伴关系。xMEMS是固态保真的先驱者,通过
    发表于 08-18 14:17 499次阅读
    创<b class='flag-5'>新科技</b>与xMEMS宣布合作,携手打造高保真出色音质的TWS耳机

    Creative创新科技ZEN AIR真无线耳机开箱

    新科技ZEN AIR真无线耳机包装盒延续了家族式的设计,天地盖结构,正面展示有产品外观设计,产品名称和品牌LOGO,以及SXFI READY、ANC主动降噪、环境模式、6小时单次和18小时综合续航的产品功能特点。包装盒内部物品有TWS耳机、耳塞、充电线和产品说明书。
    的头像 发表于 06-12 15:21 783次阅读
    Creative创<b class='flag-5'>新科技</b>ZEN AIR真无线耳机开箱

    生态伙伴 | 中电创新科技集聚示范区携手华秋硬创,加速智能硬件孵化

    亿,获2轮及以上融资的企业占比达54%。02生态伙伴介绍:中电创新科技集聚示范区中电创新科技集聚示范区是央企中国电子信息产业集团(CEC)在深圳华强北打造的科技创新综
    的头像 发表于 06-09 16:56 280次阅读
    生态伙伴 | 中电创<b class='flag-5'>新科技</b>集聚示范区携手华秋硬创,加速智能硬件孵化

    生态伙伴 | 中电创新科技集聚示范区携手华秋硬创,加速智能硬件孵化

    亿,获2轮及以上融资的企业占比达54%。 02 生态伙伴介绍:中电创新科技集聚示范区 中电创新科技集聚示范区是央企中国电子信息产业集团(CEC)在深圳华强北打造的 科技创新综合体,由中电智方舟、中电
    发表于 06-09 16:21

    生态伙伴 | 中电创新科技集聚示范区携手华秋硬创,加速智能硬件孵化

    亿,获2轮及以上融资的企业占比达54%。 02 生态伙伴介绍:中电创新科技集聚示范区 中电创新科技集聚示范区是央企中国电子信息产业集团(CEC)在深圳华强北打造的 科技创新综合体,由中电智方舟、中电智谷、中电产城三大创新载体组成,产业空间总面积约7万㎡
    的头像 发表于 06-09 16:18 671次阅读

    密集剧透丨Microsoft Build 的 200+课程怎么选?

    Build 可谓是惊喜连连看,十分令人期待。 在上一篇文章《 来 Microsoft Build,探秘 AI 颠覆创新背后的技术! 》中 ,我们剧透了5大主题演讲的内容和嘉宾,是不 是感觉还不太过瘾?经过
    的头像 发表于 05-16 07:35 345次阅读
    密集剧透丨<b class='flag-5'>Microsoft</b> Build 的 200+课程怎么选?