0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用深度学习融合各种来源的信息

Dbwd_Imgtec 来源:AI公园 作者:AI公园 2021-01-08 14:40 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

导读

使用深度学习融合各种来源的信息。

cac7da1a-44a1-11eb-8b86-12bb97331649.png

多模态数据

我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的方式,当一个研究问题包含多个模态时,它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够同时解释这些多模态的信号

例如,图像通常与标签和文本解释相关联,文本包含图像,以更清楚地表达文章的中心思想。不同的模态具有非常不同的统计特性。

多模态深度学习

虽然结合不同的模态或信息类型来提高效果从直观上看是一项很有吸引力的任务,但在实践中,如何结合不同的噪声水平和模态之间的冲突是一个挑战。此外,模型对预测结果有不同的定量影响。在实践中最常见的方法是将不同输入的高级嵌入连接起来,然后应用softmax。

cb354852-44a1-11eb-8b86-12bb97331649.png

多模态深度学习的例子,其中使用不同类型的神经网络提取特征

这种方法的问题是,它将给予所有子网络/模式同等的重要性,这在现实情况中是非常不可能的。

cb55f20a-44a1-11eb-8b86-12bb97331649.png

所有的模态对预测都有相同的贡献

对网络进行加权组合

我们采用子网络的加权组合,以便每个输入模态可以对输出预测有一个学习贡献(Theta)。 我们的优化问题变成-

cbab1460-44a1-11eb-8b86-12bb97331649.png

对每个子网络给出Theta权值后的损失函数。

cbe25358-44a1-11eb-8b86-12bb97331649.png

将权值附加到子网后预测输出。

把所有的都用起来!

准确性和可解释性我们在两个现实多模态数据集上得到了SOTA: Multimodal Corpus of Sentiment Intensity(MOSI) 数据集 —— 有417个标注过的视频,每毫秒标注的音频特征。共有2199个标注数据点,其中情绪强度定义为从strongly negative到strongly positive,线性尺度从- 3到+3。

模态包括:

1. 文本 2. 音频

3. 语言

cc055272-44a1-11eb-8b86-12bb97331649.png

每种模态对情绪预测的贡献量 Transcription Start Site Prediction(TSS)数据集 —— Transcription是基因表达的第一步,在这一步中,特定的DNA片段被复制到RNA (mRNA)中。Transcription起始位点是transcription开始的位置。DNA片段的不同部分具有不同的特性,从而影响其存在。

我们将TSS分为三个部分:

上游DNA

下游DNA

TSS位置

我们取得了前所未有的改善,比之前的最先进的结果3%。使用TATA box的下游DNA区域对这一过程影响最大。

cc3d0cf8-44a1-11eb-8b86-12bb97331649.png

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266940
  • 数据集
    +关注

    关注

    4

    文章

    1240

    浏览量

    26261
  • 深度学习
    +关注

    关注

    73

    文章

    5607

    浏览量

    124631

原文标题:多模态深度学习:用深度学习的方式融合各种信息

文章出处:【微信号:Imgtec,微信公众号:Imagination Tech】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    深度学习驱动的超构表面设计进展及其在全息成像中的应用

    当前,深度学习技术与超构表面(metasurface)全息成像技术的融合,有力推动了光学成像领域的发展。得益于超构表面对光波特性的精准调控,全息成像技术经处理后可生成对应的三维图像。因此,二者的结合
    的头像 发表于 04-09 13:55 134次阅读
    <b class='flag-5'>深度</b><b class='flag-5'>学习</b>驱动的超构表面设计进展及其在全息成像中的应用

    Atmel ATSHA204 CryptoAuthentication 芯片深度剖析:安全与应用的完美融合

    Atmel ATSHA204 CryptoAuthentication 芯片深度剖析:安全与应用的完美融合 在当今高度数字化的时代,信息安全显得尤为重要。Atmel公司的ATSHA204
    的头像 发表于 04-07 09:10 157次阅读

    2026视觉检测产业深度调研及未来趋势分析

    视觉检测技术融合深度学习与多模态传感,实现从辅助工具向决策中枢的转变,推动智能制造与工业4.0发展。
    的头像 发表于 04-01 09:26 233次阅读
    2026视觉检测产业<b class='flag-5'>深度</b>调研及未来趋势分析

    【智能检测】基于AI深度学习与飞拍技术的影像测量系统:实现高效精准的全自动光学检测与智能制造数据闭环

    内容概要:文档内容介绍了中图仪器(Chotest)影像测量仪融合人工智能深度学习与飞拍技术的自动化检测解决方案。系统通过AI深度学习实现
    发表于 03-31 17:11

    机器学习深度学习中需避免的 7 个常见错误与局限性

    无论你是刚入门还是已经从事人工智能模型相关工作一段时间,机器学习深度学习中都存在一些我们需要时刻关注并铭记的常见错误。如果对这些错误置之不理,日后可能会引发诸多麻烦!只要我们密切关注数据、模型架构
    的头像 发表于 01-07 15:37 350次阅读
    机器<b class='flag-5'>学习</b>和<b class='flag-5'>深度</b><b class='flag-5'>学习</b>中需避免的 7 个常见错误与局限性

    穿孔机顶头检测仪 机器视觉深度学习

    LX01Z-DG626穿孔机顶头检测仪采用深度学习技术,能够实现顶头状态的在线实时检测,顶头丢失报警,顶头异常状态报警等功能,响应迅速,异常状态视频回溯,检测顶头温度,配备吹扫清洁系统,维护周期长
    发表于 12-22 14:33

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算力限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度学习的集成
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    (第10系列)、YOLOv8-Tiny工业优化版(第9系列),满足产线端设备算力限制,模型推理速度提升300%。 LabVIEW生态整合 作为工业自动化领域主流开发环境,LabVIEW与深度学习的集成
    发表于 12-03 13:50

    如何深度学习机器视觉的应用场景

    深度学习视觉应用场景大全 工业制造领域 复杂缺陷检测:处理传统算法难以描述的非标准化缺陷模式 非标产品分类:对形状、颜色、纹理多变的产品进行智能分类 外观质量评估:基于学习的外观质量标准判定 精密
    的头像 发表于 11-27 10:19 329次阅读

    融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件

    *附件:ai study.zip*附件:融合AI的OpenHarmony应用软件开发:ai学习自律辅助软件.pdf 基于开源鸿蒙编写的ai辅助学习软件
    发表于 11-12 15:38

    微软Visual Studio 2026 发布!AI 深度融合、性能提升

    “  微软发布 Visual Studio 2026 预览版,新版本以深度融合的 AI Copilot 为核心,结合全新的 Fluent Design 界面与显著的性能提升,旨在打造前所未有的智能
    的头像 发表于 09-16 11:17 2349次阅读
    微软Visual Studio 2026 发布!AI <b class='flag-5'>深度</b><b class='flag-5'>融合</b>、性能提升

    如何在机器视觉中部署深度学习神经网络

    图 1:基于深度学习的目标检测可定位已训练的目标类别,并通过矩形框(边界框)对其进行标识。 在讨论人工智能(AI)或深度学习时,经常会出现“神经网络”、“黑箱”、“标注”等术语。这些概
    的头像 发表于 09-10 17:38 1049次阅读
    如何在机器视觉中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    深度学习对工业物联网有哪些帮助

    深度学习作为人工智能的核心分支,通过模拟人脑神经网络的层级结构,能够自动从海量工业数据中提取复杂特征,为工业物联网(IIoT)提供了从数据感知到智能决策的全链路升级能力。以下从技术赋能、场景突破
    的头像 发表于 08-20 14:56 1209次阅读

    自动驾驶中Transformer大模型会取代深度学习吗?

    [首发于智驾最前沿微信公众号]近年来,随着ChatGPT、Claude、文心一言等大语言模型在生成文本、对话交互等领域的惊艳表现,“Transformer架构是否正在取代传统深度学习”这一话题一直被
    的头像 发表于 08-13 09:15 4367次阅读
    自动驾驶中Transformer大模型会取代<b class='flag-5'>深度</b><b class='flag-5'>学习</b>吗?

    基于多传感器融合的切割深度动态补偿与晶圆 TTV 协同控制

    影响,单一传感器获取的信息存在局限性,难以实现切割深度的精确动态补偿与 TTV 的有效控制 。多传感器融合技术通过整合多源信息,为实现切割深度
    的头像 发表于 07-21 09:46 818次阅读
    基于多传感器<b class='flag-5'>融合</b>的切割<b class='flag-5'>深度</b>动态补偿与晶圆 TTV 协同控制