0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

隐藏在Microsoft Designer背后的新科技,让人人都是设计师

微软科技 来源:未知 2023-06-25 00:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在视觉图像设计中,用户的需求与最终的设计成品往往是“想象很美好,现实很骨感”。这通常是因为用户在与设计师沟通时,双方理解不一致,导致最终设计结果不尽如人意。但是,如果能够“自给自足”,借助人工智能技术为每个人赋予设计能力,是否会更容易让自己脑海中的画面变为现实?智能化设计工具 Microsoft Designer 就是一个能辅助用户成为设计师的好帮手。

2022年10月,微软在 Ignite 大会上发布了 Microsoft Designer 内测版,为 Microsoft 365 家族再添一个视觉生产力工具。2023年4月27日,经过半年的迭代和改进,微软宣布推出 Microsoft Designer 公开预览版。利用人工智能技术“猜想”用户的想法,智能辅助生成文字提示和视觉图像,Microsoft Designer 大大降低了设计难度,让人人都能成为视觉设计师。

如今,市场上充斥着各种各样视觉的设计工具,然而这些专业软件有很高的技术门槛且操作复杂,非专业人员难以熟练使用。也有一些工具提供了海量的模板库,用户可以基于模板进行修改,虽然这简化了部分操作,但其呈现效果与用户的设想仍有不小的差距。Microsoft Designer 则能够智能理解用户的需求,自动生成文字表述,实现从文字到视觉图像的自动化创造,并将这些素材用于设计项目。

作为智能化的设计工具,Microsoft Designer 将先进的科研成果快速吸纳并转化为生产力,其中包括来自微软亚洲研究院视觉计算组的 Provence、Swin Transformer 模型,自然语言计算组与微软图灵团队合作的图灵通用语言表示模型,系统研究组的SPANN(存储器-磁盘混合索引和搜索系统)算法等众多前沿技术。

6d050b5e-12a9-11ee-962d-dac502259ad0.png

厚积薄发:Provence多模态内容推荐模型助力实现“一键式”设计配图

微软亚洲研究院很早就开始研究通过自然语言生成图像或视频的技术。2018年,正值短视频发展的上升时期,研究员们意识到视频化的传播形态将成为未来互联网主要的沟通交流方式。然而视频内容的制作流程繁杂,高质量视频的拍摄更需要专业人员的参与,那么是否可以通过技术创新创造出一个简化视频制作和生成的工具?在这一目标的驱动下,视觉计算组开始了文字到图像和视觉的生成技术的研究。

经过一年多的潜心钻研,2020年视觉计算组推出了第一代基于检索的文字到视频的生成模型 Provence(Retrieval-based text-to-video generation)。Provence 模型能够根据文本描述搜索相匹配的视频或图像,同时确保跨模态对应具有较高的准确率,达到了“一键式(即检索到的第一个图像推荐就是用户所需)”的水平。

Provence 模型的潜力很快就被微软 Microsoft 365 产品部门发现,并将其引入到了 PowerPoint Design Ideas(PowerPoint 设计器)功能中。为了更好地满足产品端的工程化需求,微软多个研究组的研究员们将 Provence 与 Swin Transformer、图灵通用语言表示模型和 SPANN 算法结合,在 Design Ideas 功能的底层构建了零样本多模态的内容检索引擎,让用户在几秒钟内就能通过文字自动检索出最适合于当前幻灯片的配图,并给出布局设计建议,良好的使用体验让 Design Ideas 功能的用户使用率提升了20%以上。

图1:Provence 模型分别应用于 PowerPoint Design Ideas,Microsoft Designer 及其生态系统中

2021年3月,在微软内部的骇客松(Hackathon)活动期间,Microsoft 365 产品团队通过与研究员们的思想碰撞,更加深入地了解了机器学习领域的前沿技术趋势,不仅看到了走向成熟的 Provence 检索技术,也看到了更多创新的机器学习算法的应用潜力。由此,双方共同发起了 Designer in Edge 的 Hackathon 项目,此后这一项目进入产品化迭代过程,也形成了如今的 Microsoft Designer 和 Designer Platform 这两款由人工智能驱动的产品。

微软 Microsoft 365 产品部副总裁张大川表示,“在与微软亚洲研究院多个研究组的交流中,我们看到了 Provence、Swin Transformer、图灵通用语言表示模型等诸多超前的 AI 技术理念,这些前沿技术完全满足 Microsoft Designer 及其生态系统的需求。双方的紧密合作,不仅大大加速了产品的创新周期,而且还革新了传统设计的流程。下一步,我们将共同致力于创新技术的落地应用,为全球用户提供更加便捷易用的视觉设计工具,更好地激发人们的创造力和创新力。”

“很高兴看到微软亚洲研究院越来越多的创新研究成果走向了实际应用,成为支持产品开发的核心技术。以 Microsoft Designer 为例,它的关键技术始于研究院五年前的创新突破,正是因为微软亚洲研究院持续致力于探索计算机领域前瞻性的基础研究,才使得这种拿来即用的技术转化成为可能。未来,微软亚洲研究院将一如既往地着眼于下一代革命性技术的研究,并将科研成果快速转化到微软的产品中,赋能更多用户。”微软亚洲研究院常务副院长郭百宁表示。

6d050b5e-12a9-11ee-962d-dac502259ad0.png

Microsoft Designer:

从多模态推荐走向具有“创作”能力的AI

生成式视觉设计的一个关键环节是用语言或者文字将用户脑海中想象的画面清晰地表达出来。因此,微软亚洲研究院视觉计算组的研究员们进一步对 Provence 模型进行了升级,让 Microsoft Designer 在从文字描述中精准检索出用户所需图像的基础上,又实现了根据用户意图智能输出文字提示的功能。

其核心思想是基于学习到的自动模板为不同的输入文本创建不同的提示,具体包括三个步骤:

  • 首先,将用户原始输入的文本与一组字符(token)结合,这些字符是对用户所需要的设计图像的视角、样式、氛围、用途等的描述。

  • 然后,根据美术设计的评分,使用学习到的自动模板找到与不同字符匹配的最佳组合。

  • 最后,将输入文本和自动模板提示的组合返回给用户,并使用评分指标对结果进行排序,再从中检索出最佳的图像。

智能输出提示文字,为用户原始的输入文本添加了更多的描述和细节,从而激励视觉模型“创作”出更符合用户需求的结果。如图2所示:用户输入“a cat hacker wearing a VR headset”后,Microsoft Designer 自动输出了相关的提示与图像。

图2:智能输出提示文字的流程

另外,研究员们还提出了一种检索增强提示的推荐方法,通过使用提示数据库来增强自动提示的结果。随着用户对 Microsoft Designer 的频繁使用,模型会学习到更多的提示,而这些数据将能进一步提高提示质量。如图3所示,对于用户输入,Microsoft Designer 会先使用语言模型从提示数据库中检索最相似的提示文本,然后通过评估分数对检索结果排序,再将自动提示与排序检索提示结合,以获得更好的结果。由于模型具有持续学习的特性,最终将有越来越多的用户数据纳入到提示数据库中来增强提示。

图3:检索增强提示

借助智能输出文字提示和智能图像生成的双重加持,用户可以更好地用文字描述出脑海中的画面,让 Microsoft Designer “创作”更符合需求的视觉图像,并从推荐的图像中选择出最匹配需求的用于后续的定制化设计。

由人工智能技术驱动的 Microsoft Designer 极大地降低了设计工作的专业门槛,让设计更加大众化,人人都能成为设计师。未来,Microsoft Designer 还将引入更多的人工智能算法,比如个性化的智能修图、借助大模型实现平面布局等等,以此丰富 Microsoft Designer 的功能,为更多用户带来更高水平的创意和创造力生产工具。

点击“阅读原文”即可试用 Microsoft Designer,开启属于你的 AI 设计之旅吧!

随着人工智能技术的快速发展,确保相关技术能被人们信赖是一个需要攻坚的问题。微软主动采取了一系列措施来预判和降低人工智能技术所带来的风险。微软致力于依照以人为本的伦理原则推进人工智能的发展,早在2018年就发布了“公平、包容、可靠与安全、透明、隐私与保障、负责”六个负责任的人工智能原则(Responsible AI Principles),随后又发布了负责任的人工智能标准(Responsible AI Standards)将各项原则实施落地,并设置了治理架构确保各团队把各项原则和标准落实到日常工作中。微软也持续与全球的研究人员和学术机构合作,不断推进负责任的人工智能的实践和技术。

相关论文链接:

Swin Transformer: Hierarchical Vision Transformer using Shifted Windows

https://arxiv.org/abs/2103.14030

SPANN: Highly-efficient Billion-scale Approximate Nearest Neighbor Search

https://arxiv.org/abs/2111.08566

BEiT: BERT Pre-Training of Image Transformers

https://openreview.net/forum?id=p-BhZSz59o4

关注微软科技视频号

了解更多科技前沿资讯


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 微软
    +关注

    关注

    4

    文章

    6719

    浏览量

    107354

原文标题:隐藏在Microsoft Designer背后的新科技,让人人都是设计师

文章出处:【微信号:mstech2014,微信公众号:微软科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产TDDI芯片:藏在屏幕背后的"隐形冠军",谁能笑到最后?:藏在屏幕背后的"隐形冠军",谁能

    你知道吗?每次滑动手机屏幕时,都有一个 "隐形指挥官" 在默默工作。它既不是处理器,也不是内存,而是藏在显示屏背后的 TDDI芯片 。这块比指甲盖还小的芯片,正在掀起一场国产替代的暗战。 被忽视
    的头像 发表于 11-24 15:05 176次阅读

    2026联想创新科技大会即将启幕

    联想创新科技大会(Lenovo Tech World @ CES)官网于近日正式上线(点击“阅读原文”),这场史上最大规模的全球科技盛宴将于1月6日登陆拉斯维加斯地标场馆Sphere,重磅亮相
    的头像 发表于 11-14 15:15 455次阅读

    广汽集团创新科技成果点亮十五运会开幕式

    ”智慧移动生态的硬核实力,不仅为开幕式提供了全方位的出行保障,更以创新科技与人文关怀,为赛事注入了全新活力。
    的头像 发表于 11-11 15:28 431次阅读

    软通动力入选2025中国新科技100强榜单

    近日,DBC德本咨询发布"2025中国新科技100强",软通动力凭借在信创与硬科技领域的深厚积累和创新成果,成功入选榜单并位列 "信创与硬科技" 赛道前五
    的头像 发表于 09-25 17:53 1023次阅读

    燧弘华创亮相2025联想创新科技大会

    近日,联想Tech World 2025创新科技大会在上海世博中心隆重举行。本届大会以“AI成为创新生产力”为主题,聚焦混合式人工智能,从个人到企业,全方位展示联想在AI领域的前沿成果。作为联想
    的头像 发表于 05-10 14:16 1237次阅读

    长安汽车荣获最佳创新科技展台奖

    。展会期间,长安汽车展台人流如织,凭借全球顶尖的硬核新科技、全球领先的数智新汽车,以及创新前沿的未来出行场景规划,在全球品牌中脱颖而出,成为展馆内当之无愧的“人气王”,成功圈粉无数,并一举斩获上海车展组委会颁发的“最佳创新科技展台奖”,用实力为中国智造赢得喝彩。
    的头像 发表于 05-08 15:06 788次阅读

    格陆博科技荣登盖世汽车新科技创新榜单

    控底盘多域融合解决方案”,斩获盖世汽车新科技创新榜单殊荣,为行业高质量发展注入强劲动能,彰显智能底盘技术领航者的实力与担当。
    的头像 发表于 05-06 14:52 681次阅读

    2025年联想创新科技大会即将开幕

    正式定档!2025年联想创新科技大会(Tech World),将于5月7日在上海世博中心精彩开幕。大会以“Smarter AI for all AI成为创新生产力”为主题,将聚焦混合式AI,从终端到云端、从个人到企业,展示一系列创新技术和全新成果。
    的头像 发表于 04-15 15:58 722次阅读

    创维集团举办2025年全品类客户大会暨创新科技

    近日,创维集团在南京溧水隆重举办了2025年全品类客户大会暨创新科技展。这场盛会汇聚了各界领导、嘉宾和来自全球的2000多位合作伙伴,共同见证创维在智能科技领域的创新成果,探讨行业发展趋势。
    的头像 发表于 04-10 15:42 1145次阅读

    奥迪威获颁“创新科技行业标杆”称号,以创新驱动区域高质量发展

    奥迪威获颁“创新科技行业标杆”称号,以创新驱动区域高质量发展2025-03-2909:30·奥迪威传感科技3月7日,广州市番禺区创新科技企业协会(以下简称“区创科协”)成功举办“创科实干显担当,聚力
    的头像 发表于 03-29 09:52 719次阅读
    奥迪威获颁“创<b class='flag-5'>新科技</b>行业标杆”称号,以创新驱动区域高质量发展

    新科技!通过EtherCAT与Profinet网关实现温湿度监控,医药设备领域的智能革命来临!

    "革新科技!通过EtherCAT与Profinet网关实现温湿度监控,医药设备领域的智能革命来临!"
    的头像 发表于 03-19 16:34 532次阅读
    革<b class='flag-5'>新科技</b>!通过EtherCAT与Profinet网关实现温湿度监控,医药设备领域的智能革命来临!

    行芯科技出席杭州民营创新科技企业代表早餐会

    近日,杭州市委副书记、市长姚高员邀请杭州市科技企业代表共进早餐,围绕“与城市共同成长,打造更高水平创新活力之城”的主题展开深度交流。行芯科技董事长贺青博士荣幸地作为杭州民营创新科技企业代表,受邀参加了本次早餐会。
    的头像 发表于 03-18 17:32 798次阅读

    比亚迪亮相《中国创新科技盛典》

    近日,比亚迪亮相中央广播电视总台首届《中国创新科技盛典》(以下简称 央视“科晚”),向全球展现中国汽车科技的磅礴力量。
    的头像 发表于 12-30 13:58 814次阅读

    新科技投资1亿元建设高端精密减速电机项目

    近日,德新科技发布公告称,其控股子公司安徽汉普斯计划在南谯经开区管委会投资1亿元,用于建设高端精密减速电机及驱动器研发生产项目。 根据公告,安徽汉普斯与南谯经开区管委会将签订《投资协议》,规划用地约
    的头像 发表于 12-24 09:54 1004次阅读

    MathWorks携手IBMD与远诺,助力高新科技初创企业发展

    全球领先的数学计算软件开发商MathWorks近日宣布,与新型生物材料与高端医疗器械广东研究院(IBMD)及远诺技术转移中心达成合作。此次合作旨在为两个高新科技孵化园内的符合条件的初创企业提供全面
    的头像 发表于 12-19 11:33 1865次阅读