0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

通用人工智能的多模态通用技术

姚小熊27 来源:人工智能实验室 作者:人工智能实验室 2021-02-04 10:44 次阅读

现有的大多数人工智能模型和方法仍属于窄人工智能,也被称为弱人工智能(weak artificial intelligence)。相对而言,强人工智能(strong artificial intelligence)期望机器能像人一样思考、推理,能处理各种任务,比肩人类的智能水平(human-like or human-level intelligence)。与强人工智能相比,现有通用人工智能更加强调机器的“泛 化”能力,包括场景泛化(即模型从单一场景泛化 至多个场景)、模态泛化(即一个模型适用于多种 模态的任务)、任务泛化(即一个模型可以处理多种类型的任务)等。

通用人工智能目前仍然处于发展初期,是对现有窄/弱人工智能的反思、补充和改进,也是通往强人工智能道路上的重要路线。通用人工智能所研究的是一个智能系统应该具备哪些能力,并且运用这些能力解决各式各样的复杂问题。

通用人工智能的多模态通用技术

现实生活中,人类接收的信息模态多种多样,如视觉、声音、文字、嗅觉、触觉等。人类可以综合运用多种模态的信息对事物进行理解和推理。多模态学习是通用智能需要解决的关键问题之一,其任务可以归结为两个基本类:多模态表征学习和模态转换。需要指出的是,这两个问题并非不相关,比如表征可以用来做模态转换。下面介绍几种典型的多模态学习任务。

多模态表征学习和融合

多模态表征学习指的是学习包含多个模态的样本表征,比如视频里可能包含的视觉信息、声音信息等,使得表征能够反映所包含的多个模态信息,以帮助理解识别等任务。最直接的方法是分别处理各个模态,得到每个模态的表征,再将其直接拼接起来作为最后的表征;也可以最终只产生一个表征,把不同模态的表征融合成一个表征;也可以继续把融合的表征做进一步处理,以生成更强的表征;还可以在产生表征的过程中,不停地进行模态之间的信息交互或者融合,以增强每个模态的表征。

多模态协同学习

多模态协同学习指的是利用模态之间的关联,借助其他一个或者多个模态,来帮助某一模态或者多个模态建模和学习。模态之间的关联信息非常常见,比如人在说话的时候,既有声音模态,也有视觉(唇语)模态,如人脸表情或者行为动作;比如互联网上的图片,通常有文件名等;比如在视频中,视频帧可能有相应的声音(语音或者音乐),也可能有文字脚本。人类对单一模态的理解,也是通过联合其他模态信息进行分析的。多模态协同学习的要领在于把关联转换成合适的约束,以及从各个模态获取合适的信息形成约束。例如图像和文本(比如图像及其文件名)有一一对应关系。

借助于物体的属性描述来帮助图像识别建模,在某种意义上也是多模态协同学习。例如,对狗的识别,我们都清楚地了解狗是由哪些部分组成的,具有怎样的属性特征,比如它有4条腿、尾巴、毛发等。但是在目前主流的物体识别中,这种信息没有被加进去,“狗”只是作为一个标签。而人类从图像里识别狗的时候,头脑中有很多狗的图像认知信息,同时也从别的渠道获得狗的其他知识,如组成方式等。所以,建模时需要把关于狗的额外知识信息加进去,来提升建模识别性能,也会提升模型的鲁棒性。

多模态统一表征学习

多模态统一表征学习指的是把不同模态映射到 同一个特征空间,使得不同模态在这个特征空间里可以直接比较(比如欧氏距离),比较的时候不用 区分特征来自什么模态。多模态任务可以是把一幅图片转变成一段文字或者一首诗,或者将文字转化成一幅图像;以及在文字、图片或者视频搜索中,如果图像和文本的特征都转换到同一个空间中,那我们就可以进行统一的搜索,而不再区分不同的模态。

人类具有在不同模态之间快速映射的能力,比如看到一个场景,我们的头脑会快速“搜索”到应景的一首歌、一段文字或者一首诗。多模态统一表示是模拟人类这个能力的一种实现方法。多模态统一表征问题的主要研究点在于如何定义关系保持和寻找合适的映射,以及对大规模数据和实际问题的探索。目前已经有了实际系统的探索,如“小冰写诗”。


责任编辑:YYX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1776

    文章

    43824

    浏览量

    230580
  • 通用技术
    +关注

    关注

    0

    文章

    7

    浏览量

    7212
收藏 人收藏

    评论

    相关推荐

    5G智能物联网课程之Aidlux下人工智能开发

    ://t.elecfans.com/v/25653.html 人工智能 5G AIoT技术实践入门与探索(1) 15分34秒 https://t.elecfans.com/v/27207.html
    发表于 04-01 10:40

    百川智能与北京大学将共建通用人工智能联合实验室

    近日,百川智能与北京大学携手合作,共同签署了“北大——百川通用人工智能联合实验室”的共建协议,标志着双方在人工智能领域迈出了坚实的合作步伐。
    的头像 发表于 03-21 11:45 384次阅读

    嵌入式人工智能的就业方向有哪些?

    嵌入式人工智能的就业方向有哪些? 在新一轮科技革命与产业变革的时代背景下,嵌入式人工智能成为国家新型基础建设与传统产业升级的核心驱动力。同时在此背景驱动下,众多名企也纷纷在嵌入式人工智能领域布局
    发表于 02-26 10:17

    燧原科技发布“燎原”生态合作计划,共建通用人工智能产业化联盟

    。 以AIGC生成式内容为代表的通用人工智能正在重塑商业模式,技术创新催生了大量的新产业、新范式,也蕴含着极具潜力的商业机遇。通用人工智能应用的落地,需要将算力、智算中心、算法模型、垂直解决方案与应用场景全链路打通,进行有机结合
    的头像 发表于 12-21 19:55 856次阅读
    燧原科技发布“燎原”生态合作计划,共建<b class='flag-5'>通用人工智能</b>产业化联盟

    人工智能领域多模态的概念和应用场景

    随着人工智能技术的不断发展,多模态成为了一个备受关注的研究方向。多模态技术旨在将不同类型的数据和信息进行融合,以实现更加准确、高效的人工智能
    的头像 发表于 12-15 14:28 3047次阅读

    北京石景山区通用人工智能大模型产业集聚区揭牌

    根据集中区域规划,到2025年,1聚集区建筑面积5000平方米开始见效。调集3 - 5个重点企业落地行业领先的通用人工智能大模式引进10个以上产业服务平台,形成10个以上的行业标准的解决方案20个以上重点应用场景建设示范工程、人工智能产业收入突破1000亿元。
    的头像 发表于 11-09 11:24 257次阅读

    通用人工智能:初心与未来》-试读报告

    作者给出的结论。整体读下来,可以给我们关于通用人工智能全面的了解。作者也反复强调了通用人工智能与专用智能的区别。尤其是人们错误的认为一堆专用智能堆砌起来就是
    发表于 09-18 10:02

    如何将人工智能应用到效能评估系统软件中去解决

    ,我们可以将其应用到效能评估系统中,进一步提高效能评估的准确性和实用性。   华盛恒辉可以利用人工智能技术,通过对大量数据的分析,来识别和评估各个业务环节的表现,从而对效能进行评估和监测。此外,我们还可
    发表于 08-30 12:58

    2023通用人工智能算力论坛在京举办

    石景山智能算力中心启动建设 8月28日, 2023中国国际服务贸易交易会常态化活动的通用人工智能算力论坛在北京石景山成功举办。论坛以“智见·共创算力新时代”为主题,政府部门、院士专家学者及人工智能
    的头像 发表于 08-29 17:36 371次阅读
    2023<b class='flag-5'>通用人工智能</b>算力论坛在京举办

    aigc是什么意思和人工智能有什么区别?

    ——通用人工智能。与此相比,人工智能是一个更为广泛的概念,不仅包括通用人工智能,还涵盖了各种专业领域的智能应用,例如语音识别、图像识别、机器翻译等。本文将介绍AIGC和
    的头像 发表于 08-21 17:16 3162次阅读

    人工智能可能实现吗

    人工智能,也称为通用人工智能(AGI),指的是能够在各种情况下自主学习、理解、分析和解决问题的人工智能。与现有的窄人工智能(ANI)相比,其设计目标更加高级和复杂。
    的头像 发表于 08-14 15:41 974次阅读

    如何利用人工智能

    如何利用人工智能 人工智能是一种能够模拟人类智能,执行需要智力的工作的技术,它通过处理数据、识别模式和提供算法解决方案来进行智能化分析和决策
    的头像 发表于 08-12 16:49 2051次阅读

    科技部:人工智能法草案已列入国务院2023年立法工作计划

    当前,全球人工智能发展进入新一轮跃升期,超大规模预训练模型的重大突破实现了人工智能的一次技术飞跃,探索出通往通用人工智能的可能路径,并将继续向多模态
    的头像 发表于 07-07 16:53 409次阅读

    聆心智能上榜“北京市通用人工智能大模型行业应用典型场景案例”

    7月2日,作为 2023 全球数字经济大会同期举办的六大高峰论坛之一,人工智能高峰论坛率先亮相。以“智能涌现·重塑未来”为主题,聚焦通用大模型发展等热点问题,助力北京打造国际化的通用人工智能
    的头像 发表于 07-05 09:54 425次阅读
    聆心<b class='flag-5'>智能</b>上榜“北京市<b class='flag-5'>通用人工智能</b>大模型行业应用典型场景案例”

    【书籍评测活动NO.16】 通用人工智能:初心与未来

    已经变得越来越复杂而强大,但计算机科学还远未创造出通用人工智能(General AI)。作者结合人类自然智能的认知机理以及人工智能发展的初心与使命,带我们从不同方面细致分析了当前人工智能技术
    发表于 06-21 14:41