大模型真的会“好事多模”吗？-电子发烧友网

自从2018年谷歌发布BERT之后

到ChatGPT在火爆全球

大模型的超强能力以及背后的吸金属性

吸引着无数厂商对其趋之若鹜

纷纷投入到炼大模型的热潮中去

这大模型不仅是越来越大

模态还越“堆”越多

多模态大模型到底是个啥？

讲到这里，我们先来说说

多模态大模型中的

这个“多模态”到底是个啥

多模态的概念源于德国生理学家

赫尔姆霍茨提出的“感觉道”

加被称为“感觉通道”

主要探讨了人类在感知和认知过程中

多种感官的相互作用和协同工作

如视觉、听觉、触觉、味觉和嗅觉等

在人工智能领域

多模态意味着算法可以处理不止一个模态的数据

可以在文本、图像、音频等

多种类型的数据中理解、转译、生成

有效提高大模型处理多种信息的

准确性和鲁棒性

比如多模态大模型

理解文字和图片两种模态的数据

就能以文生图，让画手直面职业危机

理解音频、视频、图片多种形态的数据

在生成工业质检模型时

就能实现视频分析、图片分析

甚至音频分析等多样化的选择

自从OpenAI发布多模态大模型GPT-4后

全球各大厂商便又开始朝着“好事多模”进发

这模态越“堆”越多

前一段时间还出现了

六模态大模型和全模态大模型……

“堆模态”是喜还是忧？

看着大家争相发布多模态大模型

突然就有一个问题：

大模型的模态越多就真的越好吗？

答案却是……不一定。

举个例子，如果你要建造一栋房子

你会选择使用多少种不同的材料呢？

显然，选择过多的材料会导致

建筑成本增加、建设时间、精力增加等问题

而多模态大模型的模态过多

也会导致一些问题的出现，比如：

1.多模态不等于凑模态

如今厂商们都在争先恐后的发布

自家的多模态大模型

其中当然有许多精品

但也不乏粗制滥造的水货

比如在自然语言处理中

增加一个文字转换语音的功能

就生成自己家练出了多模态

2.多模态=高成本

算力资源是各大公司进入炼大模型的入场券

数据更熟训练大模型的关键

模态越多大模型

训练所需要的算力就越多

数据量也就越丰富

如果公司一味要求模态的丰富

最终很可能导致大模型模态多而不精

反而得不偿失

3.多模态不等于好落地

上文也提到了

多模态大模型在处理复杂的应用场景时

可能更加有效

然而不同的应用场景对模态的需求是不同的

例如，在自然语言处理领域

对于一些特定任务

如情感分析或文本分类

使用单一的文本模态可能已经足够

而不需要额外的图像或音频模态

“贪多嚼不烂”这句俗语

如今也可以用在炼大模型上

厂家们在决定“堆模态”前

不妨先考虑一下

落地场景、数据质量、算力资源等综合因素

适当选择模型结构

切记模型虽好，但不能贪多哦！

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

大模型

大模型

+关注

关注
2

文章
1532

浏览量
1117

模电和数电的区别和联系，你真的懂吗？

模电和数电的区别和联系，你真的懂吗？数电：我比你更能抗干扰。模电：我比你的精度高。数电：我可以实现各种算法。模电：我可以实现无线通讯。数电：没有我，电子行业还得倒退几十年呢。

发表于 03-01 08:43

#夸克全新升级，大模型到底能有多实用？

手机模型

脑极体

发布于 :2024年01月19日 23:58:30

Saber中如何更好地提高仿真的收敛性(一)

在仿真过程中，由于仿真模型的不连续性，或者模型没有适当地表征/参数化，或者当求解器无法求解控制模型行为的方程时，可能就会出现仿真的收敛问题。

发表于 12-05 14:43 •651次阅读

Saber中如何更好地提高仿<b class='flag-5'>真的</b>收敛性(一)

请问AD9124内部的PGA架构是否会自动偏移共模电压offset在AVDD-AVSS / 2?

请问AD9124内部的PGA架构，是否会自动偏移共模电压offset在AVDD-AVSS / 2? 还是设计上得放一颗OPA做Offset调整?

发表于 12-05 08:22

ADAU1772官网上没有Spice模型的情况下，设计电路时大家都是如何进行电路仿真的呢？

请教一下ADAU1772官网上没有Spice模型的情况下，设计电路时大家都是如何进行电路仿真的呢？是直接按照datasheet上的电路进行外围电路的连接就可以吗？

发表于 11-29 06:44

从HumanEval到CoderEval: 你的代码生成模型真的work吗？

本文主要介绍了一个名为CoderEval的代码生成大模型评估基准，并对三个代码生成模型（CodeGen、PanGu-Coder和ChatGPT）在该基准上的表现进行了评估和比较。研究人员从真实的开源

发表于 11-25 15:55 •768次阅读

从HumanEval到CoderEval: 你的代码生成<b class='flag-5'>模型</b><b class='flag-5'>真的</b>work吗？

仪表放大器AD620的共模输入范围超过电源电压会影响共模抑制比吗？

仪表放大器AD620的共模输入范围超过电源电压，会影响共模抑制比吗？比如AD620采用正负5V电源供电，放大倍数为10倍，测试时共模输入范围为7.07V / 100Hz，会影响共模抑制

发表于 11-15 06:49

LTspice自带的ADA4895模型和ADA4895.cir模型存在差异，具体以哪个为准？

图与最后一张（与TI pspice仿真的结果相近Vrms=1.74mV），同时也发现ADA4895.cir模型（ 1nV/sqrt(Hz)和1.6pA/sqrt(Hz) ）比 THS3001

发表于 11-14 07:46

使用rk3588多npu推理模型，模型总推理时间还增加了，这怎么解释

发表于 11-05 18:22

OpenHarmony应用模型的构成要素与Stage优势

迁移和多端协同 Stage模型实现了应用组件与UI解耦：在跨端迁移场景下，系统在多设备的应用组件之间迁移数据/状态后，UI便可利用ArkUI的声明式特点，通过应用组件中保存的数据/状态恢复用户界面

发表于 09-26 16:48

iTOP-RK3588开发板更新RKNN模型

RKNN 是 Rockchip NPU 平台(也就是开发板)使用的模型类型，是以.rknn 结尾的模型文件。 RKNN SDK 提供的 demo 程序中默认自带了 RKNN 模型

发表于 09-21 11:39

高速互连IBIS仿真模型

IBIS模型属于一种行为模型，它不是从要仿真的元件的结构出发进行定义的，而是从元件的行为出发进行定义的，描述了器件在特定负载、特定封装下的输入／输出行为，而不是实际的电气组成。

发表于 08-29 14:29 •221次阅读

求助，为什么将不同的权重应用于模型会影响推理性能？

生成两个 IR文件（相同的 .xml 文件，但不同的 .bin 文件）具有不同重量的类似模型，以不同的 fps （27fps 和 6fps）运行更多样化的权重是否会影响 Myriad X 上的推理性能？

发表于 08-15 07:00

SystemC循环模型11.2版用户指南

具有多实例化(MI)支持的Fast Models SystemC导出功能。系统C周期模型支持系统C导出(SCX)API函数的子集(这些函数由快速模型导出虚拟子系统(EVSS)提供)。有关详细信息

发表于 08-12 06:21

基于GaN电源集成电路的300W多模图腾柱PFC

采用GaN电源集成电路的300W多模图腾柱PFC

发表于 06-19 08:56

搜索历史

大模型真的会“好事多模”吗？

评论