电子发烧友网 > 人工智能 > 正文

AI单凭文字就可作画谁最先受到冲击

2019年07月18日 16:36 次阅读

当Google的AI正在涂鸦时,微软的绘画AI 已经学会如何画鸟了。近日,微软对外宣称正计划推出一项新的人工智能技术——绘图机器人(drawing bot)。使用者仅需说出想要绘制物体的名称,机器人便可以进行相关素材的匹配,也就是说,未来可以通过口述的方式进行绘画,说啥画啥。

AI单凭文字就可作画谁最先受到冲击

人工智能系统单纯透过文字描述就能够创作图像,该技术在文字描述中寻找关键字词,然后再用来创作高画质的图像,据悉这个关注重点的技巧让图像的画质较之前提升3倍。

随着人工智能时代的到来,艺术与科技的碰撞,越来越频繁地现身热门话题榜。AI“看文作画”的技术展现了具有艺术表现力的潜能,对艺术创作的影响已经可以预见。但微软的绘画AI,在撬动智能体想象力方面,意义绝对不只是“艺术助手”所能概括的。

所以,AI口述绘画这件事,不可小瞧!

1.什么是AI口述绘画

AI口述绘画,看起来好像是机器接受人类指令给出图画,但远远不止这么简单。智能相对论(微信id:aixdlun)了解到,正如负责研发的Microsoft深度学习技术首席研究员何晓东说的,图像是人工智能由零开始,逐像素逐像素创作。他以一幅人工智能创作的黄色雀鸟图像做解说,表示人工智能分析文字后,再透过一项名为生成对抗性网络(GAN,Generative Adversarial Network)的技术将文字转化成图像,人工智能创作的黄色雀鸟并不一定在现实世界存在,只是电脑的一种想像。

AI单凭文字就可作画谁最先受到冲击

GAN通过从高维的分布中采样,生成模型输出与训练样本类似的新样本。这就意味着,若生成模型的训练数据是鸟的图像集,那么训练后得到的模型也能输出类似于鸟的合成图片。

研究员称人工智能系统能够创作出任何类型的形象,例如飘浮的双层巴士、放牧中的牲畜等,而且在文字中欠缺的一些细节,系统会在影像中自行补完。

GAN结构用到了两个神经网络:一个是生成器,它试图基于输入的数据生成更像真实数据的结果;另一个是判别器,它的目的在于正确分辨哪些是真实的数据。简单地来理解就是,生成器总是在试图“骗过”判别器。

生成器必须反复用随机输入的噪音数据合成有意义的内容,直到判别器无法区分合成内容的真伪。这套框架正在被扩展应用到许多数据模式和任务中。如仿真时间序列的特征;超分辨率图像;从二维图像复原三维结构;小规模标注数据集的泛化;预测视频的下一帧;生成自然语言的对话内容;艺术风格迁移;语音和音乐的合成。

值得一提的是,微软研究人员在此基础上创建了他们称之为注意力生成式对抗网络或AttnGAN的技术,这个AttnGAN生成的图像的质量比之前最好的GAN生成的图像质量提高了近三倍。而这种仿人类注意力的生成式对抗网络对AI界的影响十分重大,这标志着在类人类智能的发展实现了质的突破。

2.AI据文绘画,或许漫画领域最受冲击

“看文作画”的AI在现实生活中又会发挥什么样的用处呢?

让我们来想象一下,未来,可能会发生这样的对话——

“Drawing bot,请你为我画一个花园。”

接着,一座美丽的花园跃然于纸上,花园中有各色的花朵,飞舞的蝴蝶,甚至有两个小孩在其中嬉戏。

从文本到图像的生成技术可以找到很多实际应用,它既可以作为漫画家和室内设计师的素描助理,或者作为语音美化照片的工具。如果有更多的计算能力,这项技术能够根据电影剧本生成动画电影,进行一些重复且繁琐的手工绘画,比如动画背景中的一棵树、一颗草,进而改善动画电影制片人的工作。

人工智能可以模仿披头士写歌,当然也可以模仿各种名家作画。试想一下,一个没有任何绘画基础的编剧,却能在网上发布自己漫画剧作,其作品还颇有当代某著名漫画家的画风。在动漫方面,如果微软的这款绘图智能大力发展,完全可以大大降低创作门槛。当然,这种另类的“漫画创作”也可能面临素材版权的问题。

目前来说,微软这个绘图AI还是有比较大的提升空间,而在不断改进后,在将来,它可能会对漫画领域产生极大的冲击,甚至于对室内空间设计行业也会产生影响。当然,其主要作用还是节省画家和设计家的人力和时间,而令人期待的是,未来的电视上极有可能会出现由AI自导自演的动画片。

3.想象力——让AI区别于死物

除了知道绘画AI可以充当更好的人类帮手之外,我们为什么要关注AI绘画这件事?其中关键,或许是我们应该知道“想象力”在AI世界中的重要程度和期待指数。

想象力是人在已有形象的基础上,在头脑中创造出新形象的能力。比如当我说起牛奶,你想到的图景可能是杯子中盛着白色的牛奶,这个想象是基于你生活中的经验所得到的,也就是说,想象一般是在掌握一定的知识面的基础上完成的。

绘画机器人能够想象出标题中没有包含的细节,这是因为,它有一点自己的常识和想象力,当然,这要依赖于它大量的训练数据。

在鸟的例子中,机器人画的鸟通常是站在枝头上的,然而文本内容中其实并没有提到这一细节。这是因为数据库中提供给它的图像经常出现类似的内容。这意味着,AI在掌握了一定的知识面后也能将其利用起来形成自己的想象。

目前,AI只是在小的细节中进行补充,而下一步,应该是试图在更自主地描绘图像上完成突破。如果这个突破到来,意味着AI模型在“想象力”这一特质上得到了进一步升级。这个能让AI区别于死物的能力,终于拉开了表演的大幕。

AI先天具备的是运算能力,从而进行仿人类智慧的智能模拟,第二步就是模仿人类的感知,比如机器识别、语音识别、语义分析等等,都是在做这件事。而第三步,就是让AI 有自己的“想象”和“思考”。

假如单纯的感知却无法自主输出,那么AI无非是更灵活的传感器而已。

从这个逻辑上来看,微软AI“看文作画”绝不仅仅是一个商业应用的技术加持,也不仅仅是艺术与科技的碰撞,更重要的应该是开启了AI世界里使AI具有想象力的新纪元。

下载发烧友APP

打造属于您的人脉电子圈

关注电子发烧友微信

有趣有料的资讯及技术干货

关注发烧友课堂

锁定最新课程活动及技术直播

电子发烧友观察

一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

【5月12】不懂编程没关系,邀请您来学AI

不懂编程没关系,邀请您来学AI活动概述:本活动是现场讲座,由台湾知名AI教育专家、金门创新学院院长、台湾Android技

发烧友学院 发表于 2019-05-24 00:00 0次阅读
【5月12】不懂编程没关系,邀请您来学AI

AI将电影制作变成娱乐游戏

Queisser 说道:“你可以在软件中创建两个不同的场景,分别在每个场景中比较 Emma Wats...

发表于 2019-07-18 15:49 27次阅读
AI将电影制作变成娱乐游戏

更像人类的学习,英特尔AI芯片系统模拟人脑!

800万神经元,比CPU快1000倍!

发表于 2019-07-18 15:33 24次阅读
更像人类的学习,英特尔AI芯片系统模拟人脑!

不亦乐乎:一边造假,一边打假的AI!

后来Facebook创始人马克.扎克伯格的一段视频也开始疯传,在其中小扎说“让我们快速地想象一下,一...

发表于 2019-07-18 15:10 41次阅读
不亦乐乎:一边造假,一边打假的AI!

阿里最新研究:AI进化到助理法官水平 可一秒“判...

如果说“一个人的法庭”还属于审判流程的数字化、在线化的1.0阶段。那么,阿里的最新研究成果标志着智能...

发表于 2019-07-18 15:07 31次阅读
阿里最新研究:AI进化到助理法官水平 可一秒“判...

灵云AI能力:快速接入,轻松调用

灵云SDK,将为每一个软件、每一款硬件,提供AI能力,打造万物智能新世界。

发表于 2019-07-18 14:47 41次阅读
灵云AI能力:快速接入,轻松调用

科技巨头正逼迫制药商仓促入局

人工智能研究人员推出了一种神经网络算法,可以根据序列预测蛋白质的功能。

发表于 2019-07-18 14:16 15次阅读
科技巨头正逼迫制药商仓促入局

AI的出现,其实不是为了终结人类的工作

AI多火?之前,财经网一则题为《AI 人才抢夺生猛:应届博士年薪涨到 80 万,一年涨了 60%》的...

发表于 2019-07-18 14:16 32次阅读
AI的出现,其实不是为了终结人类的工作

AI和数据为未来智慧城市赋能的5大途径

智慧城市通过从各种传感器收集信息以更加有效地管理城市资产和资源,从而将自己定位为解决城市困境的手段。

发表于 2019-07-18 11:21 116次阅读
AI和数据为未来智慧城市赋能的5大途径

不用写一行就带就可以参加 Kaggle,这个真香...

随着 AI 技术的不断发展与落地,有越来越多的平台和工具可供大家使用,这些平台针对不同领域、不同层次...

发表于 2019-07-18 10:59 86次阅读
不用写一行就带就可以参加 Kaggle,这个真香...

“只讲技术,拒绝空谈”的AI开发者大会再次来临!

微信小程序自2017年上线以来,如今已经成为互联网最火热的项目风口,阿里、百度等也纷纷看中小程序的发...

发表于 2019-07-18 10:54 109次阅读
“只讲技术,拒绝空谈”的AI开发者大会再次来临!

AI智能体使用日常语言生成解释其行为的原理

由于人工智能遍及我们生活的方方面面,因此非常需要以人为本的人工智能设计,使日常用户可以解释如同黑盒子...

发表于 2019-07-18 10:44 16次阅读
AI智能体使用日常语言生成解释其行为的原理

2019年人工智能五大趋势

当机器学习模型应用于这些数据集时,IT运行即可从被动响应转变为主动预测。

发表于 2019-07-18 10:20 25次阅读
2019年人工智能五大趋势

技术的温度:用AI保护野生动物

他们使用的 SPOT 系统,由南加州大学社会人工智能中心的研究人员建造,先通过人工标记,以及无人机自...

发表于 2019-07-18 10:15 83次阅读
技术的温度:用AI保护野生动物

“没人比我更懂AI了”介绍45篇让你跟上AI时代...

Targeted Dropout不再像原有的Dropout那样按照设定的比例随机丢弃部分节点,而是对...

发表于 2019-07-18 10:12 85次阅读
“没人比我更懂AI了”介绍45篇让你跟上AI时代...

视觉AI市场引爆前夕,虹软+AI创享会招募深圳同...

从人工智能技术应用曲线来看,人脸识别技术正处于爆发阶段,应用价值逐步呈现。人脸识别在LFW、Mega...

发表于 2019-07-18 09:28 11次阅读
视觉AI市场引爆前夕,虹软+AI创享会招募深圳同...

通用人工智能仍是白日梦

尽管深度学习为广泛的计算机感知领域注入了新鲜血液,但它甚至没有触及人工智能的基本问题。

发表于 2019-07-18 09:22 20次阅读
通用人工智能仍是白日梦

大国竞争格局将变成AI人工智能的竞争

本轮科技和产业革命,从一开始大家聚焦的新能源和新通讯,慢慢地聚焦到以人工智能、大数据以及物联网为核心...

发表于 2019-07-18 08:45 17次阅读
大国竞争格局将变成AI人工智能的竞争

未来可以让AI来创造AI吗

任何机器学习模型都是基于历史数据开发出来的,而历史数据反映的是过去的商业状况,所以模型其实是有保质期...

发表于 2019-07-18 08:33 20次阅读
未来可以让AI来创造AI吗

8小时卖出20万台AI音箱,喜马拉雅是如何做到的...

去年年底,喜马拉雅AI音箱小雅Nano宣布全球发售时,1万台现货开售1分钟即被抢购一空,首批10万台...

发表于 2019-07-17 17:09 327次阅读
8小时卖出20万台AI音箱,喜马拉雅是如何做到的...

vivo Y7s正式开启预约搭载联发科P65处理...

联发科P65处理器基于12nm工艺,八核心设计,由两颗2.0GHz的A75核心与六颗1.7GHz的A...

发表于 2019-07-17 16:49 236次阅读
vivo Y7s正式开启预约搭载联发科P65处理...

大众与福特共推自动驾驶出租车服务

Argo AI作为一家自动驾驶汽车开发商,目前正负责部署福特的自动驾驶出租车服务。

发表于 2019-07-17 16:07 205次阅读
大众与福特共推自动驾驶出租车服务

AI在实际应用中最大的问题与困扰是什么?

本次邀请该研究中心的薛向阳教授,为我们共同探讨产研合作中存在的问题。

发表于 2019-07-17 15:51 173次阅读
AI在实际应用中最大的问题与困扰是什么?

AI也需要做梦吗

处于“清醒”或在线状态的人工智能神经网络总是在学习新的信息模式。

发表于 2019-07-17 15:22 30次阅读
AI也需要做梦吗

下次如何加薪将由AI和算法说了算

用过去的方法来评估员工的绩效,意味着要从几套不同的人力资源部门记录中挖掘出每份直接报告中蕴含的信息。

发表于 2019-07-17 14:20 36次阅读
下次如何加薪将由AI和算法说了算

MIT和谷歌开发失传语言的机器翻译系统

注释数据库和让机器从中学习的技术让语言学习发生了革命性变化,这使得机器翻译变得越来越普遍。

发表于 2019-07-17 10:56 41次阅读
MIT和谷歌开发失传语言的机器翻译系统

医疗和技术的加速融合,带动产业进入“AI+医疗”...

人工智能等前沿技术正在快速迭代,医疗领域的智能升级是大势所趋。

发表于 2019-07-17 10:51 177次阅读
医疗和技术的加速融合,带动产业进入“AI+医疗”...

法律会是AI将革新的又一产业吗

我们这个软件驱动的世界,正在给法律行业带来革命性的变化,并产生了所谓的“法律工程师”。

发表于 2019-07-17 10:39 149次阅读
法律会是AI将革新的又一产业吗

科创板报道:倒计时!首批25家公司如何前瞻和选择

7月22日(下周一),科创板首批25家公司将在上交所鸣锣上市,成为中国资本市场的新生力量。 从201...

发表于 2019-07-17 10:34 477次阅读
科创板报道:倒计时!首批25家公司如何前瞻和选择

边缘计算时代的到来会给AI带来哪些影响

随着5G、人工智能和物联网时代的到来,传统的云计算技术已经无法满足人工智能终端“大连接、低时延、大带...

发表于 2019-07-17 10:33 48次阅读
边缘计算时代的到来会给AI带来哪些影响

5G与AI的碰撞会发生什么化学反应

5G尚处于商用初期,AI也处于发展初级阶段。

发表于 2019-07-17 10:00 38次阅读
5G与AI的碰撞会发生什么化学反应

利用语音直接画出人脸,AI再添新能力

听声辨人,利用声纹进行解锁,这种技术已广泛应用,人类的声音含有该个体的一定特征,从而可以进行区分。

发表于 2019-07-17 09:54 180次阅读
利用语音直接画出人脸,AI再添新能力

中国车联网规模突破2000亿,5G和AI融合推动...

7月9-10日,由国泰君安证券与中移(上海)产业研究院、浦发硅谷银行共同主办的国泰君安2019年信息...

发表于 2019-07-17 09:32 1094次阅读
中国车联网规模突破2000亿,5G和AI融合推动...

人工智能能实现无人物流体系吗

无人科技背后的大数据、AI算法等科技成果还促进建立了以消费者个性化需求为核心的C2M反向定制、物流价...

发表于 2019-07-16 17:27 94次阅读
人工智能能实现无人物流体系吗

产业互联网时代到来科技是最大筹码

当产业互联网的风口到来,这些企业未来的发展路径又是怎样的?

发表于 2019-07-16 17:06 166次阅读
产业互联网时代到来科技是最大筹码

物业公司如何面对社区物联化大势所趋

随着人工智能、大数据、物联网等科技发展,传统行业也开始借助这些技术进行转型升级。

发表于 2019-07-16 15:24 72次阅读
物业公司如何面对社区物联化大势所趋

“G往开来,为AI出行”——长城汽车告别传统功能...

7月15日,“G往开来,为AI出行”——长城汽车GTO全域智慧生态战略在保定哈弗技术中心正式发布。

发表于 2019-07-16 15:12 194次阅读
“G往开来,为AI出行”——长城汽车告别传统功能...

AI音乐家将在这四个方面掀起革新浪潮

就像在其他行业一样,在音乐领域,AI也在帮助服务自动化,在庞大的数据集中发现模式和洞见,并帮助提高创...

发表于 2019-07-16 14:12 33次阅读
AI音乐家将在这四个方面掀起革新浪潮

Facebook AI又出新作:性能翻倍,计算成...

Facebook AI又出新作,在神经网络中加入一个结构化存储器层,极大扩充了网络容量和参数数量,性...

发表于 2019-07-16 10:56 212次阅读
Facebook AI又出新作:性能翻倍,计算成...

用AI对抗AI——基于视频人脸篡改的检测

Deepfake有救了!

发表于 2019-07-16 10:10 183次阅读
用AI对抗AI——基于视频人脸篡改的检测

如果你将踏上机器学习工程师就可能遇到 Danie...

如果未来的你将踏上机器学习工程师这条道路,那你很大可能将遇到和机器学习工程师 Daniel Bour...

发表于 2019-07-16 09:57 230次阅读
如果你将踏上机器学习工程师就可能遇到 Danie...

人民日报社与中国联通在建设5G新媒体平台方面正式...

根据战略合作协议,双方将以建设5G新媒体平台为目标,充分运用5G、4K超高清视频,虚拟现实(VR),...

发表于 2019-07-16 09:46 178次阅读
人民日报社与中国联通在建设5G新媒体平台方面正式...

热点 | 工信部:加快5G、AI等新型基础设施建...

7月9日第18届中国互联网大会召开,工业和信息化部副部长陈肇雄出席大会并致辞。

发表于 2019-07-16 08:52 158次阅读
热点 | 工信部:加快5G、AI等新型基础设施建...

从场景出发的计算架构才能真正满足AI大规模应用需...

来自学术界、工业界、投资界的重磅嘉宾齐聚CCF-GAIR 2019 AI芯片专场共同探讨芯片的前沿技...

发表于 2019-07-16 08:35 188次阅读
从场景出发的计算架构才能真正满足AI大规模应用需...

人工智能如何分辨谣言

即以AI技术打假为主、以人工审核为辅,AI还不能替代专家。

发表于 2019-07-15 16:30 41次阅读
人工智能如何分辨谣言

如何解锁AI医疗落地之难

在众多落地场景中,目前AI医学影像是最为成熟的一个。

发表于 2019-07-15 16:26 37次阅读
如何解锁AI医疗落地之难

如何用AI打造线上社群的西部世界

构建在区块链之上的“AI机器人管家”Jarvis+,在满足社群运营的基础之上,将用户和平台进行链接,...

发表于 2019-07-15 15:49 35次阅读
如何用AI打造线上社群的西部世界

是什么让Facebook AI副总裁夜不能寐?

Facebook 人工智能副总裁Jérôme Pesenti,首次在公开演讲中亮相,表达了对日益增长...

发表于 2019-07-15 15:05 111次阅读
是什么让Facebook AI副总裁夜不能寐?

AI护士小姐姐可以帮护士多少忙

机器人队友在这方面真的会是一个有趣而巨大的进步。

发表于 2019-07-15 11:32 64次阅读
AI护士小姐姐可以帮护士多少忙

从头开始构建最先进的深度学习模型

Deep Learning from the Foundations

发表于 2019-07-15 10:02 207次阅读
从头开始构建最先进的深度学习模型

Al人工智能比特币矿机兴起原因是什么

一方面AI需要大量的算力,另一方面挖矿正在造成大量算力的浪费。

发表于 2019-07-15 09:47 62次阅读
Al人工智能比特币矿机兴起原因是什么

AI创造性的工作都已经不在话下了吗

未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完...

发表于 2019-07-14 11:04 69次阅读
AI创造性的工作都已经不在话下了吗

AI是每个企业的机会吗

只有把握人工智能机遇,企业才能掌握高质量发展的“利器”。

发表于 2019-07-14 10:44 66次阅读
AI是每个企业的机会吗

现在看病还需要像以前那样排队吗

开发出了全球领先的下一代微特征识别FVR技术,把浩瀚的手掌脉络“微特征”编码为高密度、高容量的超级“...

发表于 2019-07-14 10:38 50次阅读
现在看病还需要像以前那样排队吗

AI是怎样从你的声音听出你的长相的

随着人工智能技术的不断发展,AI似乎变得越来越“无所不能”

发表于 2019-07-14 10:30 50次阅读
AI是怎样从你的声音听出你的长相的

如何让AI技术尽快应用于实际

自然语言处理(NLP)和自然语言理解,特别是语音转文字技术将成为2019年企业AI中最主要的产品呈现...

发表于 2019-07-14 09:54 51次阅读
如何让AI技术尽快应用于实际

带你详细了解科沃斯机器人DEEBOT T5

目前,扫地机器人已经成为很多一二线城市家中必备的产品,而平时工作、生活比较忙碌的人群成为扫地机器人的...

发表于 2019-07-14 09:26 68次阅读
带你详细了解科沃斯机器人DEEBOT T5

未来的人工智能研究会在非洲吗

尽管存在极大困难,非洲的机器学习依然在过去几年里迅速发展。

发表于 2019-07-14 09:18 35次阅读
未来的人工智能研究会在非洲吗

阿里达摩院刷新纪录,开放域问答成绩比肩人类水平

这是继 2018 年《Multi-granularity hierarchical attentio...

发表于 2019-07-13 08:26 204次阅读
阿里达摩院刷新纪录,开放域问答成绩比肩人类水平

AI虽然不能产生万物,但是正在“唤醒万物”

现场的演示视频显示,搭载百度自主泊车功能的汽车可以在人类司机驾驶的车流里,自动排队开往地下停车场;车...

发表于 2019-07-13 08:12 892次阅读
AI虽然不能产生万物,但是正在“唤醒万物”

CCF-GAIR全球人工智能与机器人峰会今日开幕...

7月12日-14日,2019年全球人工智能与机器人峰会(CCF-GAIR)正式开幕,该如何锚定人工智...

发表于 2019-07-12 20:38 153次阅读
CCF-GAIR全球人工智能与机器人峰会今日开幕...