张飞软硬开源基于STM32 BLDC直流无刷电机驱动器开发视频套件,👉戳此立抢👈

IBM发布最新AI模型,帮视障者“看”到更多

人工智能观察 2019-06-25 08:47 次阅读

在IBM最新的论文中,研究人员提出了一种能自主制作多样化、创造性和符合人类语境的图片文字说明的模型。实验证明,图片的文字说明取得了“良好”的性能,未来可以为强大的新计算机视觉系统奠定了基础。

无论是报社、杂志社还是新媒体,编辑们最不愿意干得事情就是为图片搭配文字说明。事实上这项工作必要且重要但实际操作上又非常枯燥。

不过,一个振奋人心的消息是,AI可能很快就能处理大部分工作。6月18日在加州长滩举行的2019年计算机视觉和模式识别会议(CVPR)上,Pierre L. Dognin, Igor Melnyk, Youssef Mroueh, Jarret Ross, Tom Sercu发表了一篇论文《改进图像说明的对抗性语义对齐》,提出了一种能够自主制作多样化、创造性和符合人类语境的图片文字说明的模型。

在论文中,他们将图像说明作为一种有条件的GAN(生成式对抗网络)训练进行研究,提出了一种上下文感知的LSTM字幕器和共同注意鉴别器,它们加强了图像和字幕之间的语义对齐。

研究人员根据经验着重研究了SCST和ST两种训练方法的可行性。他们发现即使没有直接访问鉴别器梯度,SCST也比ST显示出更稳定的梯度行为和更好的结果。进而还解决了对这些模型进行自动评估的开放性问题,引入了一个新的语义评分,并证明了它与人类判断的强相关性。

作为评估范例,一个重要的标准是生成器能够概括出平常不会一起出现的对象之间的组合关系。为此研究人员引入了一个小标题能脱离上下文(OOC)测试集。OOC与常规语义评分相结合,为图片搭配说明文字得体系提出了新基准。当面向OOC和MS-COCO进行测试时,可以发现基于SCST的训练在语义评分和人类评估方面都有很强的表现,有望成为高效离散GAN训练的一种有价值的新方法。

目前,构建系统需要解决自动说明文字系统的一个主要缺点:顺序语言生成导致语法正确—但同质、非自然和语义不相关的结构。

研究者的方法是通过一个注意力文字说明模型来解决这个问题,模型使用它正在观察的照片中的场景片段来造句。在每一个生成步骤中,团队的AI都可以选择关注最后一步的视觉或文本提示。

为了确保生成的文字说明听起来不太机械化,研究团队在训练时使用了生成对抗网络(GANs)——由生成样本的生成器和试图区分生成样本和现实世界样本的鉴别器组成的两部分神经网络。共同注意鉴别器通过一个在像素级匹配场景和生成单词的模型对新句子的“自然度”进行评分,使文字说明者能够通过图像和句子成对来进行合成

文字说明系统中的另一个常见问题是,如何避免训练数据集的偏差,即经常遭受过度拟合(特定数据集过于接近的分析)就需要构建诊断工具,否则并不适合推广到学习对象(“床和卧室”)出现在看不见的环境(“床和森林”)中的场景。为此,研究人员提出了一种标题图像的测试语料库,其设计方式使得不良模型性能表明过度拟合。

在实验中,Amazon's Mechanical Turk评估人员负责识别AI模型生成的文字说明,并判断每句话对相应图像的描述程度,给出几个真实的和合成的样本,研究人员表示,他们的文字说明总体上取得了“良好”的性能。他们相信他们的工作为强大的新计算机视觉系统奠定了基础,并打算在未来的工作中继续探索这些系统。另外,衔接语言和视觉语义的鸿沟表明需要将常识和推理融入场景理解中。

未来,图像文字说明的自动生成和场景理解的进步,使AI系统可以作为视觉障碍者的助理改善他们的日常生活。

原文标题:IBM发布最新AI模型,帮视障者“看”到更多

文章出处:【微信号:Aiobservation,微信公众号:人工智能观察】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

【5月12】不懂编程没关系,邀请您来学AI

不懂编程没关系,邀请您来学AI活动概述:本活动是现场讲座,由台湾知名AI教育专家、金门创新学院院长、台湾Android技
发表于 05-24 00:00 0次 阅读
【5月12】不懂编程没关系,邀请您来学AI

未来机器人能否会取代人工配送

从2017年开始,九号机器人和美团联合发布了配送机器人S1,尝试在真实的场景里面做最后一公里配送。
发表于 08-19 09:22 8次 阅读
未来机器人能否会取代人工配送

因为机器人而引发的宗教冲突

基于佛教怜悯众生的信仰,机器人Mindar在京都的高台寺传讲布道,其他僧人表示并不排斥机器人法师,并....
发表于 08-19 09:17 12次 阅读
因为机器人而引发的宗教冲突

AI医疗心血管的攻克将使医疗手段提速百倍

马云亲自推进的人工智能项目有了重大突破。据介绍,该项目用于攻克心血管,比之传统医疗手段能提速百倍。
发表于 08-19 09:11 45次 阅读
AI医疗心血管的攻克将使医疗手段提速百倍

医疗行业将利用AI技术优化医院护理流程

CHI Franciscan宣布与GE医疗集团合作,成立一个任务控制中心,利用AI和高级分析技术,提....
发表于 08-19 09:03 10次 阅读
医疗行业将利用AI技术优化医院护理流程

走进B馆,一探家庭服务机器人

此类机器人是为人类服务的特种机器人,能够代替人们完成家庭服务工作,为人们“排忧解难”。家庭服务机器人....
的头像 倩倩 发表于 08-18 10:33 186次 阅读
走进B馆,一探家庭服务机器人

九号机器人在北京正式召开新品发布会,带来了旗下3款全新的AI产品

而在国内,九号机器人的平衡车等产品,也被用户所广泛熟知。本次发布会上,全新发布的智能共享滑板车T60....
的头像 倩倩 发表于 08-18 10:25 297次 阅读
九号机器人在北京正式召开新品发布会,带来了旗下3款全新的AI产品

Arm布局物联网市场推动AI市场的发展

“我们AI的策略是以计算平台为核心,首先在终端侧优势领域落地,逐步切入云端、边缘侧,核心还是通过提供....
发表于 08-17 10:02 93次 阅读
Arm布局物联网市场推动AI市场的发展

机器人的发展将在未来渗透我们的各行各业

技术的快速发展让机器人渗透进各行各业,也越来越接近消费终端。在人工智能的助推下,服务型机器人正快速崛....
发表于 08-17 09:45 37次 阅读
机器人的发展将在未来渗透我们的各行各业

安防运维领域发展迅猛,企业该如何把握机遇

在安防边界日益扩大的今天,以AI视频监控为代表的安防产品已经带有跨地域、跨行业、跨应用、数量巨大的特....
发表于 08-17 08:13 36次 阅读
安防运维领域发展迅猛,企业该如何把握机遇

Microchip推可显著降低功耗的模拟存储器技术——SuperFlash memBrain

随着人工智能(AI)处理从云端转移至网络边缘,电池供电的深度嵌入式设备在执行AI任务(如计算机视觉和....
发表于 08-16 17:31 65次 阅读
Microchip推可显著降低功耗的模拟存储器技术——SuperFlash memBrain

鲁勇:三大核心引擎驱动产品智能升级和企业数字化转型

昨日在广州举行的华为云城市峰会2019上,华为公司高级副总裁、中国区总裁鲁勇演讲时表示,“当前,5G....
的头像 牵手一起梦 发表于 08-16 17:31 410次 阅读
鲁勇:三大核心引擎驱动产品智能升级和企业数字化转型

AI技术能否改善医疗行业资源不均的问题

轰轰烈烈的开始,悄无声息的消失。这是创业的常态,也是不少医学影像AI公司的真实写照。
发表于 08-16 15:03 91次 阅读
AI技术能否改善医疗行业资源不均的问题

紫光虎贲T710芯片领先骁龙855 Plus,暂居世界第一

苏黎世联邦理工学院主导的AI Benchmark最新榜单显示,紫光展锐的虎贲T710芯片综合获评28....
的头像 电子发烧友网工程师 发表于 08-16 12:04 193次 阅读
紫光虎贲T710芯片领先骁龙855 Plus,暂居世界第一

决策智能化是人工智能时代的重要理论

决策智能化是一种新学术理论,它涉及到选择的方方面面。决策智能科学将数据科学、社会科学、管理科学融为一....
发表于 08-16 10:11 22次 阅读
决策智能化是人工智能时代的重要理论

目前救援机器人的应用困境是什么

NCCR(瑞士国家机器人能力研究中心)的研究人员回顾了救援机器人技术进展,并对其未来发展进行了评估。
发表于 08-16 09:25 26次 阅读
目前救援机器人的应用困境是什么

三大驱动因素推动发展,全球AI市场规模持续增长

目前全球人工智能市场仍呈现加速增长态势,主力厂商着重抢先布局人工智能产业生态链。
的头像 机器人大讲堂 发表于 08-15 16:58 118次 阅读
三大驱动因素推动发展,全球AI市场规模持续增长

人工智能+教育将实现AI未来教育

未来五年,主导技术革新的应该来自AI。从提升效率到承担实际任务,AI任重道远但目标可期。
发表于 08-15 16:18 50次 阅读
人工智能+教育将实现AI未来教育

人工智能其实带来的不是失业而是就业

未来几年,由人工智能引发的失业潮将会令人恐慌。但正如每一次工业革命一样,技术的变革将会替换到一些行业....
发表于 08-15 16:12 44次 阅读
人工智能其实带来的不是失业而是就业

物联网的发展潜力巨大2022年全球物联网支出将突破1万亿美元大关

2000 年PC互联网时代为人类消除时间的阻碍,拉近与世界的距离; 2010 年移动互联网时代进一步....
发表于 08-15 15:59 172次 阅读
物联网的发展潜力巨大2022年全球物联网支出将突破1万亿美元大关

科学家开发出了一种多功能的新型机器人

机器人擅长做的一件事就是一遍又一遍地重复,而面对不同形状和大小的物体并采取不同的行动,这显然属于更高....
发表于 08-15 15:29 30次 阅读
科学家开发出了一种多功能的新型机器人

AI技术将为医疗行业打开更大的空间

近年来,人工智能、大数据、5G等技术与医疗行业深度融合,为健康事业插上了智能翅膀。
发表于 08-15 15:14 127次 阅读
AI技术将为医疗行业打开更大的空间

英特尔新出AI工具包将全面提升FPGA能力

在终端侧部署人工智能,还有着数据处理的实时性更高、低延时,更低的带宽需求的优势。比如在自动驾驶领域,....
发表于 08-15 14:57 22次 阅读
英特尔新出AI工具包将全面提升FPGA能力

Nvidia打破实时对话AI的训练和推理用时记录

Nvidia用于开发和运行可理解和响应请求的对话式AI的GPU强化平台,已经达成了一些重要的里程碑,....
的头像 FPGA开发圈 发表于 08-15 14:26 70次 阅读
Nvidia打破实时对话AI的训练和推理用时记录

普惠AI的路上,有哪些难题困扰着业界?

普惠AI意味着为万物赋能,从云端到边缘的大势所趋也是AiRiA研究院作为AI芯片的后来入局者直接选择....
的头像 人工智能学家 发表于 08-15 11:29 148次 阅读
普惠AI的路上,有哪些难题困扰着业界?

对于2019年的AI玩家们来讲,有哪些不可错过的演进趋势?

AI算力和智力从云端下沉到边缘,为物联网提供火眼金睛和灵敏大脑,成为AI和IoT一拍即合的“共识”。
的头像 人工智能学家 发表于 08-15 11:24 211次 阅读
对于2019年的AI玩家们来讲,有哪些不可错过的演进趋势?

带你了解一些比较前端的新潮机器人

UR人机协作机器人具有出色灵活的6轴关节,其操作简便,易于安装,结合灵巧手的24个自由度,能做出与人....
发表于 08-15 09:17 29次 阅读
带你了解一些比较前端的新潮机器人

未来的医疗健康领域会有什么样的变化

目前医疗健康行业正逐步发现这些机遇,为重塑健康而制定战略并做出判断的需求(无论是作为医疗机构、医生或....
发表于 08-15 09:13 119次 阅读
未来的医疗健康领域会有什么样的变化

AI赌神赢的背后,只是8天的训练

Facebook与CMU学Noam Brown、Tuomas Sandholm的最新研究成果——Pl....
的头像 人工智能学家 发表于 08-15 09:06 117次 阅读
AI赌神赢的背后,只是8天的训练

数据、AI和社会:潮流在转变

这是数据领域又一个激烈动荡的年头,令人兴奋,但又错综复杂。
的头像 人工智能学家 发表于 08-15 08:46 113次 阅读
数据、AI和社会:潮流在转变

AI重塑网络安全未来图景

人工智能(Artificial Intelligence)是研究、开发用于模拟、延伸和扩展人的智能的....
的头像 人工智能学家 发表于 08-15 08:43 102次 阅读
AI重塑网络安全未来图景

AI技术在工业自动化控制中的落地应用

人工智能在风口上已经飞了很长一段时间了,一直以来,不乏有市场人士指出其概念炒作,但在另一面,依托于人....
发表于 08-14 11:46 59次 阅读
AI技术在工业自动化控制中的落地应用

从荣耀智慧屏,看AI如何赋能家庭大屏生态?

屏幕作为人机交互的重要载体,AI赋予了它超越自身的更大的想象空间。智慧屏展示了中国的科技巨头对家庭生....
的头像 墨记 发表于 08-14 10:44 1976次 阅读
从荣耀智慧屏,看AI如何赋能家庭大屏生态?

华为京东方进入前20排名 2018年全球专利300强出炉

据外媒报道,美国知识产权所有者协会(IPO)公布了第36份年度美国实用新型专利授予机构前300强名单....
的头像 章鹰 发表于 08-14 10:21 3699次 阅读
华为京东方进入前20排名 2018年全球专利300强出炉

关于AI技术在视频会议系统中的应用

云视频会议可以实现人脸识别!通过AI技术集成或硬件集成都可以在会议中实现人脸识别。
发表于 08-14 10:19 29次 阅读
关于AI技术在视频会议系统中的应用

该如何搭建人工智能数据平台

在以往,企业数据管理都以传统的IT架构为基础。当技术部门为业务部门解决问题时,需要从业务需求的探查、....
发表于 08-14 09:52 45次 阅读
该如何搭建人工智能数据平台

赛灵思囊括AIIA AI端侧芯片测评板卡类6项性能冠军

Xilinx公司人工智能平台首获第三方行业组织性能专业认证,是本轮参测硬件中可支持模型最多的加速平台
的头像 算法工匠 发表于 08-13 18:52 143次 阅读
赛灵思囊括AIIA AI端侧芯片测评板卡类6项性能冠军

Xnor最新推出嵌入式AI平台AI2Go

Xnor推出了AI2Go平台,该平台可让开发人员和制造商制作针对设备内人工智能优化的预建AI模型。
发表于 08-13 17:02 46次 阅读
Xnor最新推出嵌入式AI平台AI2Go

AI高位视频技术将是未来停车的大势所趋

从进站人脸识别、站内机器人导航,到交通电子警察、卡口规范社会秩序,再到停车诱导、共享车位资源,这几年....
发表于 08-13 15:55 46次 阅读
AI高位视频技术将是未来停车的大势所趋

人工智能技术制高点怎样抢占

人工智能是原创性大工程,必须从基础做起,从原创起步。
发表于 08-13 15:34 40次 阅读
人工智能技术制高点怎样抢占

人工智能机器人的时代已经到来

据外媒报道,亚马逊公司正式宣布将在加州欧文地区及更大范围内对无人送货机器人Scout进行测试,此前的....
发表于 08-13 15:24 72次 阅读
人工智能机器人的时代已经到来

互联网医疗的作用之医疗流程的再造

从医学的角度,互联网医疗和实体医疗一样,仍然是依据诊疗常规对患者做诊断,出治疗方案,并将线下的资源组....
发表于 08-13 15:13 169次 阅读
互联网医疗的作用之医疗流程的再造

晶泰与辉瑞以AI模拟技术驱动新药的研发

以算法驱动创新的AI医药研发公司晶泰科技宣布和辉瑞制药签订战略研发合作,将融合量子物理与人工智能,建....
发表于 08-13 14:34 39次 阅读
晶泰与辉瑞以AI模拟技术驱动新药的研发

智能时代推动半导体创新的复兴之路

在物联网、大数据和人工智能 (AI) 的推动下,从交通运输、医疗保健到零售和娱乐等众多行业将走上转型....
的头像 哎咆科技 发表于 08-13 11:41 194次 阅读
智能时代推动半导体创新的复兴之路

医疗保健系统怎样利用人工智能重塑

AI辅助技术在美国也适用,能够为数百万人提供更多医疗服务。
发表于 08-13 11:20 42次 阅读
医疗保健系统怎样利用人工智能重塑

AI技术将驱动视频领域的智能进化

在新一代信息技术的驱动下,互联网正全面视频化,以视频作为主要信息传递介质和功能载体的互联网形态——视....
发表于 08-13 10:18 111次 阅读
AI技术将驱动视频领域的智能进化

如何通过AI换脸视频技术而带来利润

说起AI,想必大家都有所耳闻,听得最多的无非是,三星、小米、华为等智能手机厂商通过AI技术,让每个人....
发表于 08-13 10:14 138次 阅读
如何通过AI换脸视频技术而带来利润

在医疗领域人工智能可以做些什么

自改革开放以来,我国医学领域发展迅速,信息化程度也在逐渐提高。但是随着医疗设备更新迭代,数据的格式和....
发表于 08-13 09:13 197次 阅读
在医疗领域人工智能可以做些什么

新型模拟技术可以合成各种各样的声音

据国外媒体报道,一家名为“华丽琴鸟”(Lyrebird)的加拿大初创公司发明了一套人工智能系统,用户....
发表于 08-12 17:38 50次 阅读
新型模拟技术可以合成各种各样的声音

英伟达嵌入式电脑可为机器人设计引入AI算力

英伟达在硅谷召开了GTC 2019主题演讲,英伟达 CEO黄仁勋发表演讲,正式发布了机器人开发者工具....
发表于 08-12 17:09 49次 阅读
英伟达嵌入式电脑可为机器人设计引入AI算力

人工智能开发药物是什么

开发了一种计算机程序,可以生成数万亿种化合物,让SAM决定哪些化合物可能成为新药的候选者。
发表于 08-12 16:16 44次 阅读
人工智能开发药物是什么

关于石墨烯的全面介绍

碳原子呈六角形网状键合的材料“石墨烯”具有很多出色的电特性、热特性以及机械特性。具体来说,具有在室温下也高达20万cm2/Vs以...
发表于 07-29 06:27 131次 阅读
关于石墨烯的全面介绍

IBM WebSphere MQ for Linux安装步骤

第二步 配置 1、 vi /var/mqm/.bash_profile  #编辑bash_profile文件 PATH=$PATH:/opt/mqm/samp/bin:/opt/...
发表于 07-26 06:42 52次 阅读
IBM WebSphere MQ for Linux安装步骤

泰克30+GHz高性能示波器的关键技术

泰克公司最近宣布首款经验证采用 IBM 8HP 硅锗 (SiGe) BiCMOS 特殊工艺技术设计的新型示波器平台ASIC各项技术指...
发表于 07-24 07:47 126次 阅读
泰克30+GHz高性能示波器的关键技术

公共UDDI的挑战

据国外媒体报道,由微软与IBM等大公司力推的网络服务目录UDDI计划迟迟不见起色,厂商不仅要克服技术障碍,还得面对市场转...
发表于 07-19 08:22 79次 阅读
公共UDDI的挑战

十大芯片突破成果

      IBM具有开创性的工作开始于1997年在整个行业中采用铜线取代铝线进行布线,这一创新使电流阻抗立即...
发表于 05-24 07:10 129次 阅读
十大芯片突破成果

Motorola/IBM PowerPC 6XX微处理器的仿真和分析解决方案

The attached pdf is a Product Overview of the emulation and analysis solutions available for the Motorola/IBM Po...
发表于 04-01 12:17 187次 阅读
Motorola/IBM PowerPC 6XX微处理器的仿真和分析解决方案

Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案

Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案...
发表于 03-29 09:41 225次 阅读
Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案

Motorola/IBM PowerPC 603微处理器的仿真和分析解决方案

Motorola/IBM PowerPC 603微处理器的仿真和分析解决方案...
发表于 03-29 09:38 224次 阅读
Motorola/IBM PowerPC 603微处理器的仿真和分析解决方案

Motorola/IBM powerPC 740/750微处理器的仿真解决方案

Motorola/IBM powerPC 740/750微处理器的仿真解决方案...
发表于 03-28 11:01 142次 阅读
Motorola/IBM powerPC 740/750微处理器的仿真解决方案

Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案

The attached pdf file is a Product Overview of the emulation and analysis solutions available for the Motorola/IBM...
发表于 03-28 09:46 143次 阅读
Motorola/IBM PowerPC 740/750微处理器的仿真和分析解决方案