0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里AI打破视觉对话识别纪录,AI的认知能力迈上新台阶!

PCB行业工程师技术交流 来源:YXQ 2019-07-02 16:01 次阅读

近日, 在第二届视觉对话竞赛Visual Dialogue Challenge中,阿里AI击败了微软、首尔大学等十支参赛队伍,获得冠军。

(阿里AI在视觉对话竞赛中得冠)

据了解,视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室(FAIR)等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前视觉对话领域最权威的竞赛之一。

该竞赛要求参赛的AI在看完近万张图片后,回答出人类对于任一图片任一内容的提问。竞赛结果显示,阿里AI以74.57%的准确率获得冠军,将上一届比赛的纪录提高了16.82%。在相同的数据集中,人类的准确率仅为64.27%。

传统的视觉AI主要针对目标的检测和识别,例如识别出图片是否是一只猫,但对复杂场景中目标之间的逻辑关系理解、推理能力较弱,无法回答“这只猫旁边的男生穿了什么颜色的衣服”等复杂问题,也难以将图片信息转化为人类理解的语言输出。

阿里AI的突破在于提出了“递归探索对话模型”,综合集成了图像识别、关系推理与自然语言理解三大能力,它通过高效利用标注信息学习出模仿人类认知复杂场景的思维方式,能够有效识别图片里的实体以及它们之间的关系,推理出图片所描述的事件内容,并通过对上下文进行有效建模,理解人类提出的问题及真实意图,给出自然准确的回复。

视觉对话是近年来快速崛起的AI研究方向,目的在于教会机器用自然语言与人类讨论视觉内容。如果说视觉识别技术,让机器具备了视觉能力;那么视觉对话技术,则使得机器拥有了对真实视觉世界的理解与推断能力,意味着AI的认知能力将迈上新的台阶。

据了解,这项技术未来将被应用在人机交互诸多场景:地震后在废墟中寻找幸存者的救援机器人,能够更加及时、高效地综合指挥指令和场景信息作出行动;视障人士可以通过提问阿里AI,理解网络照片中的内容,了解自身所处的周围环境;无人驾驶车辆对影响因子的意图理解会更为准确,乘客的乘坐体验更好。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26129

    浏览量

    263712
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1570

    浏览量

    46387

原文标题:不忘初心 奋勇当先——光华科技连续9年成为中国电子电路专用化学品民族企业No.1

文章出处:【微信号:ruziniubbs,微信公众号:PCB行业工程师技术交流】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    计算机视觉AI如何识别与理解图像

    计算机视觉是人工智能领域的一个重要分支,它致力于让机器能够像人类一样理解和解释图像。随着深度学习和神经网络的发展,人们对于如何让AI识别和理解图像产生了浓厚的兴趣。本文将探讨计算机视觉
    的头像 发表于 01-12 08:27 543次阅读
    计算机<b class='flag-5'>视觉</b>:<b class='flag-5'>AI</b>如何<b class='flag-5'>识别</b>与理解图像

    AI视觉识别有哪些工业应用

    AI视觉识别涵盖多种应用,如人脸识别、目标检测和识别、图像分割、行为识别、视频分析等。本篇就简单
    的头像 发表于 11-27 18:05 403次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b>有哪些工业应用

    【KV260视觉入门套件试用体验】Vitis AI Library体验之OCR识别

    Vitis AI Runtime,Vitis AI Library 有很多已经封装好的神经网络接口,直接拿来用即可。 OCR识别基于Vitis AI Library 的ocr_pt模型
    发表于 10-16 23:25

    【KV260视觉入门套件试用体验】Vitis AI 构建开发环境,并使用inspector检查模型

    推断开发平台,它可以帮助开发者在赛灵思的 FPGA 和自适应 SoC 实现高效的 AI 应用部署。它是一个强大而灵活的 AI 开发平台,它可以让您充分利用赛灵思硬件平台的优势,实现高性能、低功耗
    发表于 10-14 15:34

    【KV260视觉入门套件试用体验】基于Vitis AI的ADAS目标识别

    /vitis_ai_library/models -r 四、ADAS目标识别体验 (一)目标识别 接上HDMI显示器、键盘&鼠标,在KV260执行(如果在SSH或串口上执行
    发表于 09-27 23:21

    【KV260视觉入门套件试用体验】七、VITis AI字符和文本检测(OCR&amp;Textmountain)

    视觉领域的重要问题,主要是识别和理解图像或视频中的文字信息。字符检测和识别(OCR)技术最早在1929年由德国科学家Tausheck提出,定义为将印刷体的字符从纸质文档中识别出来。随着
    发表于 09-26 16:31

    【KV260视觉入门套件试用体验】六、VITis AI车牌检测&amp;车牌识别

    视觉技术实现的自动识别车辆牌照号码的过程。该技术通过图像采集、车牌检测、字符分割和字符识别等步骤,实现对车牌号码的自动获取与识别。车牌识别
    发表于 09-26 16:28

    AI智能呼叫中心

    可以自动识别和响应来电,通过分析用户的语音、文字和情绪等信息,并给出针对性的应答,与传统的人工处理相比,AI智能呼叫中心能够实现24/7不间断的服务,大幅提高了处理效率和用户满意度。二、个性化服务AI
    发表于 09-20 17:53

    OpenHarmony AI框架开发指导

    (IPlugin),并实现AI能力的调用。如下代码片段即实现唤醒词识别的算法插件的接口定义。更多插件开发的相关代码参考路径如下://foundation/ai/engine/servi
    发表于 09-19 18:54

    【KV260视觉入门套件试用体验】3.PL端视频采集与AI识别测试测试

    【KV260视觉入门套件试用体验】3.PL端视频采集与AI识别测试测试大信 ALSET (QQ:8125036) 感谢安富利科技和烧友烧网给予的XilinxKria KV260视觉
    发表于 09-18 01:51

    STM32F7691开发套件能用openMV实现视觉识别吗?

    请问选择了AI方向,选用的是STM32F7691开发套件,能用openMV实现视觉识别吗,还是必须在板子用F769NI芯片实现视觉
    发表于 08-07 06:26

    利用进化的传感器和AI,扩大感知能力

    对于所有生物来说,对于外界情况的感知能力都是其赖以生存不可缺少的能力。人类通过视觉、听觉、味觉、嗅觉和触觉的五感来收集信息,并发挥高度的智慧来认知和理解周边状况,进行高度的行动和判断。
    的头像 发表于 06-28 17:06 461次阅读
    利用进化的传感器和<b class='flag-5'>AI</b>,扩大感<b class='flag-5'>知能力</b>

    图灵慧眼AI视觉检测 酸奶盒子黑点检测# 视觉检测# #AI

    AI
    jf_06850557
    发布于 :2023年06月15日 16:40:17

    AI视觉检测在工业领域的应用

    随着制造业的智能化、自动化程度越来越高,AI视觉检测系统已经成为一种重要的智能制造设备,它能够大幅提高生产线上的检测能力和效率。 一、AI视觉
    发表于 06-15 16:21

    ai视觉分析技术在明厨亮灶中的应用

    1.ai视觉分析在明厨亮灶中的应用,校园食堂明厨亮灶AI视频分析识别技术,基于深度学习边缘视觉分析技术,明厨亮灶
    的头像 发表于 05-08 14:27 314次阅读