0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

阿里AI打破视觉对话识别纪录,AI的认知能力迈上新台阶!

PCB行业工程师技术交流 来源:YXQ 2019-07-02 16:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日, 在第二届视觉对话竞赛Visual Dialogue Challenge中,阿里AI击败了微软、首尔大学等十支参赛队伍,获得冠军。

(阿里AI在视觉对话竞赛中得冠)

据了解,视觉对话竞赛由美国佐治亚理工大学、Facebook人工智能实验室(FAIR)等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前视觉对话领域最权威的竞赛之一。

该竞赛要求参赛的AI在看完近万张图片后,回答出人类对于任一图片任一内容的提问。竞赛结果显示,阿里AI以74.57%的准确率获得冠军,将上一届比赛的纪录提高了16.82%。在相同的数据集中,人类的准确率仅为64.27%。

传统的视觉AI主要针对目标的检测和识别,例如识别出图片是否是一只猫,但对复杂场景中目标之间的逻辑关系理解、推理能力较弱,无法回答“这只猫旁边的男生穿了什么颜色的衣服”等复杂问题,也难以将图片信息转化为人类理解的语言输出。

阿里AI的突破在于提出了“递归探索对话模型”,综合集成了图像识别、关系推理与自然语言理解三大能力,它通过高效利用标注信息学习出模仿人类认知复杂场景的思维方式,能够有效识别图片里的实体以及它们之间的关系,推理出图片所描述的事件内容,并通过对上下文进行有效建模,理解人类提出的问题及真实意图,给出自然准确的回复。

视觉对话是近年来快速崛起的AI研究方向,目的在于教会机器用自然语言与人类讨论视觉内容。如果说视觉识别技术,让机器具备了视觉能力;那么视觉对话技术,则使得机器拥有了对真实视觉世界的理解与推断能力,意味着AI的认知能力将迈上新的台阶。

据了解,这项技术未来将被应用在人机交互诸多场景:地震后在废墟中寻找幸存者的救援机器人,能够更加及时、高效地综合指挥指令和场景信息作出行动;视障人士可以通过提问阿里AI,理解网络照片中的内容,了解自身所处的周围环境;无人驾驶车辆对影响因子的意图理解会更为准确,乘客的乘坐体验更好。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41115

    浏览量

    302603
  • 阿里巴巴
    +关注

    关注

    7

    文章

    1649

    浏览量

    49329

原文标题:不忘初心 奋勇当先——光华科技连续9年成为中国电子电路专用化学品民族企业No.1

文章出处:【微信号:ruziniubbs,微信公众号:PCB行业工程师技术交流】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【瑞萨AI挑战赛】家庭AI相框

    、语义识别视觉化反馈和交互控制,形成一个具备完整应用闭环的家庭 AI 终端。 1. 项目定位与设计目标 家庭相框类产品的核心价值,不在于“能把图片显示出来”,而在于它是否能理解当前展示内容、降低用户
    发表于 03-13 21:44

    使用NORDIC AI的好处

    原始传感器数据,可显著降低功耗、延长电池寿命。[Edge AI 概述; Nordic Edge AI 技术页] 降低云依赖与时延 直接在设备做推理,很多决策可以“本地实时”完成,不必等云端响应
    发表于 01-31 23:16

    喜报|我司斩获EcoVadis银牌认证(TOP 15%),可持续发展新台阶

    斩获EcoVadis银牌可持续发展新台阶捷捷微电斩获EcoVadis银牌近日,全球权威企业可持续发展评估平台EcoVadis公布最新评审结果,我司凭借在环境、劳工与人权、商业道德及可持续采购四大
    的头像 发表于 12-30 16:31 958次阅读
    喜报|我司斩获EcoVadis银牌认证(TOP 15%),可持续发展<b class='flag-5'>迈</b><b class='flag-5'>上</b><b class='flag-5'>新台阶</b>

    瑞芯微SOC智能视觉AI处理器

    RK1126B的基础,增加了H.264/H.265视频编码能力的“全能型”视觉AI处理器,实现编解码+AI分析一体化基础: 完全继承了RK
    发表于 12-19 13:44

    瑞声科技为豆包AI手机提供核心感知能力支撑

    12月1日,字节跳动旗下AI助手豆包与中兴通讯宣布:搭载豆包手机助手技术预览版的工程样机nubia(努比亚)M153发售。作为这款创新AI手机的重要参与者,AAC以自研的高性能X轴线性马达及双扬声器系统,为其提供核心感知能力支撑
    的头像 发表于 12-09 10:18 997次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+具身智能芯片

    控制器等。 具身智能常见的感知模块往往被称为智能传感器,就是在原有的传感器加入一定的AI功能,从而可以模拟人类的5种基本感觉:视觉、听觉、触觉、嗅觉和味觉。 1、输入端的数据压缩 输入端常用的数据压缩
    发表于 09-18 11:45

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    和灵感与诺贝尔奖和重大科学发现 科学发现中,直觉是重要的起点。是基于经验情感及知识的模式识别和类比能力,而不是基于逻辑和推理。 灵感通常是新的、有创意的想法或者突破性的思维,是突然来的、意外的提示。 直觉
    发表于 09-17 11:45

    RK3576助力智慧安防:8路高清采集与AI识别

    在智慧城市和数字化园区的建设过程中,安防监控系统正从“被动记录”走向“主动识别与分析”。随着AI算法的成熟和高清视频处理能力的提升,市场对多路视频采集、实时拼接、智能识别的需求日益增强
    发表于 08-22 17:41

    AI 芯片浪潮下,职场晋升新契机?

    对复杂场景中目标检测与识别的速度和精度。在此过程中,对算法的理解深度、芯片架构与算法的协同能力,都会成为职称评审中的加分项。 除技术能力外,创新能力同样不可或缺。
    发表于 08-19 08:58

    软通动力助力软件智能化领域标准化建设新台阶

    近日,由人工智能关键技术和应用评测重点实验室牵头编写的《软件智能化成熟度模型 通用能力要求》(AIIA/T 0223-2025 )正式发布。作为核心参编单位,软通动力深度参与标准制定,助力软件智能化领域标准化建设
    的头像 发表于 07-21 11:49 1184次阅读

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    无人机AI视觉行为识别系统

    的需求。同时,人工监控存在效率低下、易疲劳、反应滞后等问题,无法应对日益复杂的安全管理挑战。 在这一背景下,陕西广合通结合无人机机动性与人工智能分析能力视觉行为识别系统为基础研发了无人机AI
    的头像 发表于 07-04 16:53 1207次阅读

    最新人工智能硬件培训AI基础入门学习课程参考2025版(离线AI语音视觉识别篇)

    端侧离线 AI 智能硬件作为 AI 技术的重要载体之一,凭借其无需依赖网络即可实现智能功能的特性,在一些网络条件受限或对数据隐私有较高要求的场景中,发挥着不可或缺的作用。本章基于CSK6大模型语音视觉
    发表于 07-04 11:14

    AI视觉识别收银称:水果生鲜店的“智能店员”

    在水果生鲜店中,采用AI视觉识别收银称不仅提升了顾客的购物体验,也为商家带来了诸多便利和效益。本文将详细介绍这一技术的好处。一、提升收银效率传统的收银方式需要人工逐一识别商品并进行称重
    的头像 发表于 06-07 10:19 936次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>视觉</b><b class='flag-5'>识别</b>收银称:水果生鲜店的“智能店员”

    小智AI移植到ESP32P4-Fucntion-EV-Board实机演示

    最近参加论坛的五一活动,获得一套小智AI的套件。当时正好在尝试移植小智AI到ESP32P4-Fucntion-EV-Board。最近完成了大部分功能的移植,以及可以对话了,话说屏幕大
    发表于 05-10 12:40