以智能音箱为主的智能硬件持续增长交互模式也从单模态向多模态转变

近年来，以智能音箱为代表的智能硬件市场持续增长，交互模式从单模态向多模态转变的趋势也日益显著。带屏幕的智能硬件能够更好满足听觉和视觉的交互，也是人工智能和硬件厂商发力的方向。

12月10日，有消息指出，腾讯将在下周推出腾讯叮当品牌的首款自研硬件产品“腾讯叮当智能屏”。这款产品有屏、有音箱、还有智能AI助手，是我们熟悉的带屏智能音箱。

另外，在这一次曝光中，还有腾讯叮当这款带屏设备的上市时间和产品价格消息：12月18日正式发布、价格不到千元。

这并不是什么新消息。在供应链云集的深圳，腾讯叮当一直在打磨一款带屏的智能设备，早已有小道消息传出。

自从2017年4月份亮相以来，腾讯叮当一直都采用联合第三方合作伙伴的方式来打造产品，以弥补自身在硬件方面的弱势。而这一款“腾讯叮当智能屏”，未来有可能开启腾讯叮当在自研硬件领域的布局，并成为腾讯叮当将打开智能家居的入口级产品。

从已曝光的产品外观可以看到它配备一块大尺寸显示屏，在内容服务方面应该会承载腾讯视频、QQ音乐等丰富的影音娱乐资源，在显示效果和音质方面也值得期待。如果屏幕上带有摄像头，或将具备视频功能。

此外，从图片来看，腾讯叮当智能屏没有接线，可能会有内置电池。如果没有了线缆的束缚，则意味着它可以随意摆放在房间的每个角落，使用会变得更加灵活。

在AI交互方面，这款产品预计会搭载腾讯叮当AI语音助手。从腾讯叮当之前落地的产品来看，用户可以说出“叮当叮当”来唤醒语音助手，实现音乐／视频播放、查询天气、热点新闻等等。此次腾讯叮当智能屏通过与AI技术和资源的深度整合，定会打造出全新的智能影音娱乐系统，相信能够带给用户更好的使用体验。

不过，话又说话来了，这年头，无论是在行业市场，还是在消费市场，带屏智能音箱都已经不是什么稀罕物件。姗姗来迟的腾讯叮当智能屏，除了惯用的内容生态优势外，会有什么硬实力来应对同类产品的竞争呢？

阅读全文

AI(298894) AI(298894)
腾讯(50805) 腾讯(50805)
智能音箱(80632) 智能音箱(80632)

爱芯通元NPU适配Qwen2.5-VL-3B视觉多模态大模型

熟悉爱芯通元NPU的网友很清楚，从去年开始我们在端侧多模态大模型适配上一直处于主动紧跟的节奏。先后适配了国内最早开源的多模态大模MiniCPM V 2.0，上海人工智能实验室的书生多模态大模型

2025-04-21 10:56:46

2690

炬芯科技 2019 多模态交互技术开发者大会：AI多模态交互如何助力教育

赋能、语音赋能到视觉算法赋能、IP加速等多角度，共同探讨多模态交互在教育上的落地情况。多模态交互技术赋能新智能硬件喜马拉雅今年的用户突破6亿，拥有7000万以上的主播，其中100万以上是认证主播，在整个音频行业的覆盖率73%，每个用户平均每天的播放时长超过

2019-12-24 11:46:43

14450

千亿参数多模态大模型，“紫东太初”规模化应用加速

、文本、图像等单模态大模型研究和应用的基础上，向多模态大模型攻关，并于2021年7月正式发布了全球首个千亿参数多模态大模型紫东太初。 2023年6月16日，中国科学院自动化研究所和武汉人工智能研究院发布紫东太初2.0。2023年8月，中科院

2023-12-08 00:09:00

3530

语音识别技术最新进展：视听融合的多模态交互成为主要演进方向

电子发烧友网报道（文/李弯弯）所谓“模态”，英文是modality，用通俗的话说，就是“感官”，多模态即将多种感官融合。多模态交互技术是近年来人工智能领域的一项重要创新。随着语音识别技术的发展，采用

2023-12-28 09:06:45

6608

多模态感知+豆包大模型！家居端侧智能升级

电子发烧友网报道（文/李弯弯）日前，在火山引擎2025春季FORCE原动力大会上，星宸科技股份有限公司董事副总经理陈立敬谈到，在人工智能技术飞速发展的时代，多模态感知与大模型的融合成为推动各行业变革

2025-06-21 00:06:00

6835

大模型驱动下的人机交互革命，“超拟真人互动” 让玩具读懂你的情绪

电子发烧友网报道（文/黄山明）日前，在大湾区AI玩具生态大会上，百度智能云正式发布基于“超拟真人互动”理念的智能硬件多模态交互解决方案。该方案通过大模型与多模态技术的深度融合，从技术架构到场景落地

2025-10-31 09:21:04

6276

2018年Q2全球智能音箱出货量为1680万台同比增长187%

%和 12.2%。　　智能音箱销量正在快速增长，这一点并不令人感到意外。这肯定也与NPD公布的最新数据相符。但是，另一家市场研究机构Canalys的最新报告，让我们对全球智能音箱市场格局有更深

2018-08-30 09:25:43

智能音箱+智能家电整体解决方案

）认为人机交互的新方式，语音交互在未来控制端是大势所趋。未来的智能音箱不一定体现在产品形式上面，但一定能以产品的形式把智能交互和服务的产品密切捆绑在一起。归根结底，智能音箱的落点不能脱离了“音箱

2017-06-20 11:14:19

智能音箱哪家强？选购智能音箱还需谨慎！

式增长，智能音箱已经成为当下最热门的硬件产品之一。眼看一年一度的双十一年终大促来临，巨头们大战持续升温，频发补贴打出历史最低价，消费者也开始着手查看各种评测。去年的双十一上，仅阿里家的智能音箱就售出

2018-11-17 09:26:47

智能音箱大战：618为何突然哑火？

相对乏力。根据智东西产业链消息，单单是亚马逊去年Q4季度智能音箱的出货量就达到1500万台，不但智能音箱的爆发式增长在“黑色星期五”得到体现，在圣诞季中也持续增长。而在国内的618则并没有看到这一

2018-06-23 09:28:03

智能音箱成智能家居入口，最新国外智能语音音箱大盘点

“David&Sheiyl”的智能音箱新品。　　业内人士表示，音箱本身就具备发声功能，再为它配置麦克风、智能语音识别系统后，就可以实现一定的语音人机交互，让它在为你“放歌”的基础上，也能“听你

2018-12-01 09:30:52

智能音箱混战远场语音交互只是开始

　　导读：远场语音交互开始是智能音响，但是将来绝对不仅仅是智能音响，技术还会扩展到很多其他的产品。　　7月5日，阿里推出了自己的首款消费级AI产品天猫精灵X1，同日百度也宣布了DuerOS开放

2017-07-17 09:37:59

智能音箱用户年复合增长47.9% 是什么推动智能音箱的普及？

计数器或心脏监视器。eMarketer表示:“新数据显示，从2017年到2020年之间，我们预计美国智能音箱用户数量将显著增长。” [img][/img] 　　2017年到2020年之间美国智能音箱

2018-06-05 09:26:15

智能音箱的决定性一年，当智能音箱跌破百元

摆放的各种智能硬件也成为了企业们将用户纳入自己生态闭环中的重要一部分，而智能音箱正是目前绝大多数企业打造的智能家庭生态入口。　　与此同时，无论是传统家电巨头还是小米等互联网生态链企业，都开始发力智能

2018-05-29 09:28:36

智能音箱的实际作用有哪些？如何在家庭中使用智能音箱？

智能音箱的实际作用有哪些？如何在家庭中使用智能音箱？智能音箱也可以从具备网络或Bluetooth连接设备搜索并播放音频内容吗？

2021-06-17 08:37:02

智能音箱的血海江湖哪家最终只会是“陪跑”？

，这样的交互使用让生活更加智能化，因此，智能音箱可发挥的效能也不可想象。　　到现在，各大巨头企图通过智能音箱切入并试图占据智能家居的控制中心，尽早抢占这一大入口。从去年双十一大战之后，国内的智能音箱

2018-04-21 09:46:25

智能音箱还能走多远智能交互还未发展成熟

的鸡肋。　　不太乐观的是，语音交互的成熟度有被高估的可能，苹果、微软、阿里等后续发布的几款智能音箱在功能上并没有跳出亚马逊Echo在2014年画下的圈子，将近三年的时间内，软件和硬件方面均未出现长足

2017-07-11 09:32:17

智能音箱遇上瓶颈有待突破改善

双方提供最完美的解决方案；专注于为双方搭建沟通的桥梁。　　互联网巨头眼中，智能音箱被定义为是继PC电脑图形化系统+键鼠外设交互方式、智能手机+触屏操作交互方式之后的新形态交互方式，是后互联网时代的下一个

2018-11-20 15:02:45

模态窗口的设置问题

Labview中，一个窗口如果设置为模态窗口，则打开后，点击其他窗口应该是没有作用的。我设置的几个子VI为模态窗口，效果都没有问题。但有一个子VI，设置为模态窗口，打开后，点击其他窗口的按钮，虽然

2013-11-28 21:56:55

LMS Virtual Lab 流固模态分析

LMS Virtual Lab 流固模态分析的主要步骤：1、设置材料、属性、约束条件，进行结构有限元模态分析。注意：模态计算的频率范围不要太小，否则可能计算错误！2、对流体进行模态分析3、建立结构网格到流体网格的映射，再利用结构模态和流体模态进行流固耦合模态分析

2019-05-29 06:59:58

OpenHarmony实战开发-如何实现模态转场

状态变量改变调起模态界面。同时，也可以通过if范式，通过新增/删除组件实现模态转场效果。完整示例和代码如下。 @Entry @Component struct ModalTransitionWithIf

2024-04-28 14:47:21

labview 模态分析

用labview进行模态分析，有很多问题，望高手指点一二力锤激励信号+加速度传感器信号，请问下，labview什么控件可以计算系统的模态还是说仅仅两路信号是分析不了模态的。

2016-06-24 11:50:49

【「具身智能机器人系统」阅读体验】2.具身智能机器人大模型

中取得了令人瞩目的效果。阅读感悟从传统的手动编程到借助大模型实现智能化、自主化，从单一模态的交互到多模态信息的深度融合，再到扩散模型的应用，机器人控制技术正在以惊人的速度进化。这不仅让机器人在工业

2024-12-29 23:04:07

京东叮咚智能音箱魏强：目前智能音箱行业已然进入洗牌期

形态多样化的体验时代，也就是2.0时代。　　魏强称，在智能音箱2.0时代，用户会成为核心，凭借不同产品形态和全面推进深度学习，智能音箱将具备多模态的交互方式，并更加注重个性化技术和情感交互

2018-05-15 09:25:36

人工智能医生未来或上线，人工智能医疗市场规模持续增长

+医疗市场规模持续增长 　　由广州市妇女儿童医疗中心教授夏慧敏、加州大学圣地亚哥分校教授张康等专家领衔的医疗数据智能化应用团队，联合人工智能研究和转化机构研发出“辅诊熊”人工智能诊断平台，通过自动

2019-02-24 09:29:57

全球智能音箱保有量有望突破2亿台中国市场增长最快

：“本地厂商看好中国的智能音箱市场，他们今年的目标是通过向家庭销售更多设备，继续提高其设备保有量。”詹森·罗同时又指出：“如今硬件差异化正变得越来越困难，消费者对智能音箱和智能助手的期望也越来越高

2019-04-18 09:24:35

国美GOMEPOD智能音箱发布：支持免提通话内置电池可用室外

　　导读：国美GOMEPOD智能音箱搭载了科大讯飞先进的语音识别AI技术，可以通过语音交互实现全屋多设备间的连接，是国内首款支持免提通话的智能音箱。　　11月29日消息，以“智美家.生活

2018-11-30 09:26:17

巨头们都要做智能音箱，背后的逻辑是什么？

恰恰是国内厂商的短板所在。毕竟，即便在国内市场echo缺席的情况，在智能音箱这个市场，所有巨头玩了两年的全国量加起来还没有500万台。而GFK预计，2018年中国智能音箱的市场规模将持续增长，但总量也

2018-05-09 09:31:08

平价路线的智能音箱科技巨头如何过招？

了这一点，百度为何在智能音箱上砸以重金，原因就不难理解。　　智能音箱只是开始，百度们意在AI入口　　不管是亚马逊、谷歌还是百度、阿里，都不是所谓的硬件公司，和苹果、小米有着天壤之别，这一特殊背景也

2018-08-09 09:27:11

德州仪器怎么提升智能音箱的创新设计？

智能音箱行业的竞争愈发激烈，各大制造商都在争相开发功能更强大、使用更方便的产品。当今的智能音箱拥有语音交互、人工智能、智能家居控制及多媒体播放等丰富的功能。要在竞争中占据先机，智能音箱的设计必须在总体系统成本、电池续航能力、热效应、回声消除和音质方面具备优势。

2019-08-07 06:42:07

松灵新品丨全球首款多模态®ROS开发平台LIMO来了，将联合古月居打造精品课程精选资料分享

。为探索多场景交互学习的可行方案，领先的移动机器人底盘和软硬件系统提供商松灵机器人，借助多年的机器人硬件结构创新经验和软件算法开发优势，为科研教育用户开创了全球首款集四种运动模态和高性能传感器系统于

2021-08-30 08:39:33

简单的模型进行流固耦合的模态分析

单独导出提交计算即可。详细的求解过程与“白车身自由模态分析”相同，点击超链接回顾。下面直接给出声腔与结构各自的模态计算结果，由于分析的结构几何形状具有对称性，计算结果也同理具有对称性，所以你会发

2020-07-07 17:15:39

米尔RK3576部署端侧多模态多轮对话,6TOPS算力驱动30亿参数LLM

通过硬件算力优化与软件栈协同，将视觉编码、语言推理、对话管理三大核心能力封装为可落地的工程方案，而本文将聚焦其多轮对话的部署全流程，拆解从模型加载到交互推理的每一个关键环节。 RK3576 多轮对

2025-09-05 17:25:10

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

丰富外设配件配套多模态应用示例，支持快速上手体验大模型语音交互、智能视觉等 AI 应用板载 DAPLINK 调试器，外接一条USB 线即可实现烧录、调试、串口日志查看板载网络模组，支持开发联网类

2024-06-18 17:33:19

航空电子设备PCB组件的实验模态分析

就是通过求解系统的特征方程，一般多自由度系统的特征方程可以成式（1）所示的形式，来得到系统的特征值和特征向量，亦即振动系统固有频率和振型。　　式中，[M]－系统的质量矩阵，有限元模态分析中由单元质量矩阵

2018-09-13 16:40:12

苹果智能音箱HomePod开售：智能音箱却不智能

中国市场。　　多次跳票的HomePod能否被国内大众接受，还尤未可知。但从定价上来看，与国内现有的智能音箱相比，苹果并不占据优势。　　2010年，苹果公司以2亿美元收购Siri公司，随后与全球最大的语音

2019-01-25 09:25:52

集WIFI、蓝牙、语音控制的4.3寸串口屏应用于智能音箱

联网时代。在中国智能音箱竞争格局逐渐明朗之时，厂商不断探索着新的产品形态，带屏音箱成为新的竞争热点。从消费者的角度来说，智能音箱增加屏幕，不仅让人机交互更生动、更加可视化，在另一方面也大大拓宽了智能音箱

2022-10-12 09:59:33

lABCIWQmultyWindows多模态窗口2010

lABCIWQmultyWindows多模态窗口2010。

2016-05-17 17:47:59

体验MiniCPM-V 2.6 多模态能力

多模态组网

jf_23871869发布于 2025-01-20 13:40:48

多文化场景下的多模态情感识别

自动情感识别是一个非常具有挑战性的课题，并且有着广泛的应用价值．本文探讨了在多文化场景下的多模态情感识别问题．我们从语音声学和面部表情等模态分别提取了不同的情感特征。包括传统的手工定制特征和基于深度

2017-12-18 14:47:31

基于超图的多模态关联特征处理方法

传统的模式识别方法认为特征是相互独立的，容易忽略多模态特征之间多元的关联性，从而造成识别的误差。为此，基于超图模型，提出一种新的特征整合方法。定义共享熵的计算方法用以表示多个特征之间的关联程度，以

2018-03-07 11:01:41

小米手机和智能硬件如何持续增长？

全球手机销量下滑 “快手”小米力保增速 21世纪经济报道倪雨晴广州报道小米在海外市场上，手机和智能硬件会继续增长；而中国市场手机增长不明显，但是IOT智能家居有增量。处于上升期的小米在最佳

2018-05-05 01:09:00

4155

腾讯推出首款自研硬件产品“腾讯叮当智能屏”

近年来，以智能音箱为代表的智能硬件市场持续增长，交互模式从单模态向多模态转变的趋势也日益显著。带屏幕的智能硬件能够更好满足听觉和视觉的交互，也是人工智能和硬件厂商发力的方向。

2018-12-16 11:55:00

1986

有屏交互成为智能音箱市场新的爆发点

现如今，音箱已经不仅是播放音乐的载体，在AI技术的加持下，正向智能化迈进，并成为智能家居生态圈的一部分。特别是随着智能屏的应用，音箱已经朝着多模态人工智能交互的方向发展。智能音箱市场空间大智能

2019-12-17 17:39:43

5272

大咖齐聚、干货满满！2019炬芯Techlife多模态交互技术开发者大会与你共享！

技术的思考，给大家带来了更多新的灵感和火花。也感谢各位参加活动的小伙伴，感谢你们见证了炬芯 Techlife 的成长，共同经历并贡献了炬芯科技 Techlife 多模态交互技术开发者大会的高光时刻和心动瞬间。我们也将会议的精彩内容和大家分享，再现大咖的精彩分享，和大家共

2019-12-21 16:03:16

2029

浅谈智能人机交互的三个必然趋势

百度集团执行副总裁沈抖在演讲中提到，AI技术让人机交互模式有更多的可能性。从长远的角度来看，智能人机交互将有三个必然趋势：首先，未来智能终端将会指数级增长；其次，人和终端的交互将会多模态，语音、图像交互将会成为主流；第三个趋势是，信息和服务将会场景化。

2020-12-09 11:41:30

4204

厦门软件园多模态智能交互服务站已全部部署完成

的便捷生活。此次云知声智能化设备进园区，不仅能够更好地服务园区企业和员工，同时也为丰富园区智慧化场景应用、深化智能化园区建设提供有力支撑。多模态智能交互服务站是专为厦门软件园三期定制开发的全场景智能交互平

2021-01-10 10:28:55

2839

通用人工智能的多模态通用技术

现有的大多数人工智能模型和方法仍属于窄人工智能，也被称为弱人工智能（weak artificial intelligence）。相对而言，强人工智能（strong artificial

2021-02-04 10:44:40

7178

Transformer模型的多模态学习应用

随着Transformer在视觉中的崛起，Transformer在多模态中应用也是合情合理的事情，甚至以后可能会有更多的类似的paper。

2021-03-25 09:29:59

11783

基于注意力神经网络的多模态情感分析方法

近年来，越来越多的人热衷于在社交媒体上同时用图片和文本等媒体形式表达自己的感受与看法，使得以图片和文本为主要内容的多模态数据不断増长。相比单模态数据，多模态数据包含的信息更丰富，更能揭示用户的真实

2021-04-28 14:41:41

多模态MR和多特征融合的GBM自动分割算法

2021-06-27 11:45:54

简述文本与图像领域的多模态学习有关问题

来自：哈工大SCIR 本期导读：近年来研究人员在计算机视觉和自然语言处理方向均取得了很大进展，因此融合了二者的多模态深度学习也越来越受到关注。本期主要讨论结合文本和图像的多模态任务，将从多模态预训练

2021-08-26 16:29:52

7520

模态分析定义以及模态假设理论

模态分析的经典定义为，将线性定常系统振动微分方程组中的物理坐标变换为模态坐标，使方程组解耦，成为一组以模态坐标及模态参数描述的独立方程，以便求出系统的模态参数。

2022-04-26 10:43:28

3256

实现多模态的神经形态感知提供了一种新型硬件方案

论文中，课题组以装有水的杯子为例对多模态感知进行了说明：通常对于只有压力信息的单模态感知来讲，我们只能知道杯子的形状、以及杯中的水量，并不能获悉杯中的水温。如果想同时得知杯子形状、水量以及水温，那么就得引入另一个温度模态的信息。

2022-07-28 09:14:10

2269

机器学习多模态落地存在哪些挑战

多模态技术有着相当广泛的应用场景，如淘宝搜图、AI字幕、AI虚拟数字人、仿人交互、智能助手、商品推荐和信息流广告、视频帧人脸帧的图向量检索、语音交互等等。

2022-10-11 15:20:20

1547

多模态交互已成未来发展关键所在思必驰紧抓发展新契机

当前，车联网已经成为了国内外新一轮科技创新和产业发展的必争之地。其中，车内的语音交互正在从单纯的“控制方式”向“智能连接”进化，并且已经成为了现阶段人机交互最主要的方式之一。从很大程度上来说，在

2023-02-02 10:51:32

993

中文多模态对话数据集

随着大量预训练语言模型在文本对话任务中的出色表现，以及多模态的发展，在对话中引入多模态信息已经引起了大量学者的关注。目前已经提出了各种各样的多模态对话数据集，主要来自电影、电视剧、社交媒体平台等

2023-02-22 11:03:01

2185

AIGC最新综述：从GAN到ChatGPT的AI生成历史

本调查全面回顾了生成模型的历史、基本组件、AIGC 从单模态交互和多模态交互的最新进展。我们从单峰性的角度介绍了文本和图像的生成任务和相关模型。我们从多模态的角度来介绍上述模态之间的交叉应用。最后，我们讨论了 AIGC 中存在的开放性问题和未来的挑战。

2023-03-13 10:13:09

4058

ImageBind：跨模态之王，将6种模态全部绑定！

最近，很多方法学习与文本、音频等对齐的图像特征。这些方法使用单对模态或者最多几种视觉模态。最终嵌入仅限于用于训练的模态对。因此，视频 - 音频嵌入无法直接用于图像 - 文本任务，反之亦然。学习真正的联合嵌入面临的一个主要障碍是缺乏所有模态融合在一起的大量多模态数据。

2023-05-11 09:30:44

1973

邱锡鹏团队提出具有内生跨模态能力的SpeechGPT，为多模态LLM指明方向

LLM 与通用人工智能（AGI）之间仍存在显著差距。首先，大多数当前 LLM 只能感知和理解多模态内容，而不能自然而然地生成多模态内容。其次，像图像和语音这样的连续信号不能直接适应接收离散 token 的 LLM。

2023-05-22 14:38:06

1333

多模态数据定制服务：提升智能化应用的关键利器

可以获得更准确、全面且丰富的信息，为智能化应用提供强有力的支持。在这方面，数据堂是您的理想合作伙伴。作为一家领先的数据科技公司，数据堂致力于提供多模态数据定制服务，帮助企业实现数据驱动决策和智能化转型。数

2023-06-18 21:24:47

952

VisCPM：迈向多语言多模态大模型时代

随着 GPT-4 和 Stable Diffusion 等模型多模态能力的突飞猛进，多模态大模型已经成为大模型迈向通用人工智能（AGI）目标的下一个前沿焦点。总体而言，面向图像和文本的多模态生成能力

2023-07-10 10:05:01

1255

更强更通用：智源「悟道3.0」Emu多模态大模型开源，在多模态序列中「补全一切」

当前学界和工业界都对多模态大模型研究热情高涨。去年，谷歌的 Deepmind 发布了多模态视觉语言模型 Flamingo ，它使用单一视觉语言模型处理多项任务，在多模态大模型领域保持较高

2023-07-16 20:45:02

1369

UniVL-DR: 多模态稠密向量检索模型

for Multi-Modal Retrieval 背景介绍尽管当前主流搜索引擎主要面向文本数据，然而多媒体内容的增长一直是互联网上最显着趋势之一，各种研究表明用户更喜欢搜索结果中出现生动的多模态内容。因而，针对于多

2023-08-06 22:00:03

1796

基于Transformer多模态先导性工作

，不同模态之间的信息可以相互补充、交互作用，从而提供更深入、更全面的理解和沟通。以人类的感知为例，我们在日常生活中通常会同时接收多种感知信息。当我们观看一部电影时，我们不仅仅依靠视觉信息来理解情节和角色，还借助于听觉信息

2023-08-21 09:49:52

1517

DreamLLM：多功能多模态大型语言模型，你的DreamLLM~

由于固有的模态缺口，如CLIP语义主要关注模态共享信息，往往忽略了可以增强多模态理解的模态特定知识。因此，这些研究并没有充分认识到多模式创造和理解之间潜在的学习协同作用，只显示出创造力的微小提高，并且在多模式理解方面仍然存在不足。

2023-09-25 17:26:43

1532

基于视觉的多模态触觉感知系统

传统的多模态/多任务触觉感知系统通过集成多种传感单元来达到多模态触觉信息的解耦，但其往往导致系统结构的复杂性，以及需要应对来自不同刺激间的干扰。

2023-10-18 11:24:48

2013

探究编辑多模态大语言模型的可行性

不同于单模态模型编辑，多模态模型编辑需要考虑更多的模态信息。文章出发点依然从单模态模型编辑入手，将单模态模型编辑拓展到多模态模型编辑，主要从以下三个方面：可靠性（Reliability），稳定性（Locality）和泛化性（Generality）。

2023-11-09 14:53:22

1017

任意文本、视觉、音频混合生成，多模态有了强大的基础引擎CoDi-2

CoDi ）模型，让一种模型统一多种模态成为可能。CoDi 不仅支持从单模态到单模态的生成，还能接收多个条件输入以及多模态联合生成。近日，UC 伯克利、微软 Azure AI、Zoom、北卡罗来纳大学教堂

2023-12-03 20:20:02

1089

大模型+多模态的3种实现方法

我们知道，预训练LLM已经取得了诸多惊人的成就，然而其明显的劣势是不支持其他模态（包括图像、语音、视频模态）的输入和输出，那么如何在预训练LLM的基础上引入跨模态的信息，让其变得更强大、更通用呢？本节将介绍“大模型+多模态”的3种实现方法。

2023-12-13 13:55:04

3106

人工智能领域多模态的概念和应用场景

随着人工智能技术的不断发展，多模态成为了一个备受关注的研究方向。多模态技术旨在将不同类型的数据和信息进行融合，以实现更加准确、高效的人工智能应用。本文将详细介绍多模态的概念、研究内容和应用场景，并探讨人工智能领域多模态的未来发展趋势。

2023-12-15 14:28:44

13426

从Google多模态大模型看后续大模型应该具备哪些能力

前段时间Google推出Gemini多模态大模型，展示了不凡的对话能力和多模态能力，其表现究竟如何呢？

2023-12-28 11:19:52

2300

OneLLM：对齐所有模态的框架！

OneLLM 是第一个在单个模型中集成八种不同模态的MLLM。通过统一的框架和渐进式多模态对齐pipelines，可以很容易地扩展OneLLM以包含更多数据模式。

2024-01-04 11:27:19

1877

什么是多模态？多模态的难题是什么？

单模态大模型，通常大于100M～1B参数。具有较强的通用性，比如对图片中任意物体进行分割，或者生成任意内容的图片或声音。极大降低了场景的定制成本。

2024-01-17 10:03:12

6917

李未可科技正式推出WAKE-AI多模态AI大模型

文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕 GPS 轨迹+视觉+语音打造新一代 LLM-Based的自然交互，同时多模态问答技术的加持，能实现所见即所问、所问即所得的精准服务。此外，融合了人类意图理解、长期记忆机制、情感大模型及TTS 克

2024-04-18 17:01:29

1091

慕尼黑电子展回顾：启明智显多模态硬件智能体引领科技潮流

人流如织，热闹非凡。多模态硬件智能体：未来科技的集大成者展会现场，启明智显隆重推出了其自主研发的多模态硬件智能体。这一创新产品融合了HMI（人机界面）、语音交互、大

2024-07-10 16:17:30

950

云知声推出山海多模态大模型

在人工智能技术的浩瀚星海中，多模态交互技术正成为引领未来的新航标。继OpenAI的GPT-4o掀起滔天巨浪后，云知声以创新之姿，推出了其匠心独运的山海多模态大模型，正式宣告“Her时代”的帷幕缓缓拉开。

2024-08-27 15:20:21

843

Meta发布多模态LLAMA 3.2人工智能模型

Meta Platforms近日宣布了一项重要技术突破，成功推出了多模态LLAMA 3.2人工智能模型。这一创新模型不仅能够深度解析文本信息，还实现了对图像内容的精准理解，标志着Meta在AI多模态处理领域迈出了坚实的一步。

2024-09-27 11:44:14

982

云知声山海多模态大模型UniGPT-mMed登顶MMMU测评榜首

近日，多模态人工智能模型基准评测集MMMU更新榜单，云知声山海多模态大模型UniGPT-mMed以通用能力、医疗专业能力双双排名第一的优异成绩登顶榜首，力压GPT-4V，充分彰显其硬核实力。

2024-10-12 14:09:10

1077

利用OpenVINO部署Qwen2多模态模型

多模态大模型的核心思想是将不同媒体数据（如文本、图像、音频和视频等）进行融合，通过学习不同模态之间的关联，实现更加智能化的信息处理。简单来说，多模态大模型可以可以理解多种不同模态的输入数据，并输出相应反馈结果，例如图像理解，语音识别，视觉问题等。

2024-10-18 09:39:38

2710

超声界“内卷终结者”！ZRT智锐通提供全新引擎打造多模态影像融合系统

多模态影像融合超声系统的市场规模也在不断扩大，国内众多超声系统厂家也在不断寻找合适的硬件平台，用以承载旗下的多模态影像融合超声系统。

2024-11-11 10:52:22

1650

亥步多模态医疗大模型发布：人工智能引领医疗新纪元

当下，人工智能（AI）正以不可阻挡之势渗透到各行各业，包括医疗行业。12月14日，2024中国医学人工智能大会的召开。会上，一款名为“亥步”的多模态医疗大模型的正式发布。

2024-12-19 17:56:05

845

商汤日日新多模态大模型权威评测第一

刚刚，商汤科技日日新SenseNova多模态大模型，在权威综合评测权威平台OpenCompass的多模态评测中取得榜单第一。

2024-12-20 10:39:31

1573

海康威视发布多模态大模型文搜存储系列产品

多模态大模型为安防行业带来重大技术革新，基于观澜大模型技术体系，海康威视将大参数量、大样本量的图文多模态大模型与嵌入式智能硬件深度融合，发布多模态大模型文搜存储系列产品——文搜NVR、文搜CVR。

2025-02-18 10:33:56

1125

多模态交互技术解析

多模态交互多模态交互（ Multimodal Interaction ）是指通过多种感官通道（如视觉、听觉、触觉等）或多种交互方式（如语音、手势、触控、眼动等）与计算机系统进行自然、协同的信息交互

2025-03-17 15:12:44

3945

移远通信智能模组全面接入多模态AI大模型，重塑智能交互新体验

随着千行百业数智化进程的不断加速，多模态AI大模型的应用需求不断攀升，图像、语音、视频等多样化的交互方式正逐渐成为推动行业变革的新动力。3月20日，全球物联网整体解决方案供应商移远通信宣布，其全系

2025-03-20 19:03:54

704

移远通信智能模组全面接入多模态AI大模型，重塑智能交互新体验

随着千行百业数智化进程的不断加速，多模态AI大模型的应用需求不断攀升，图像、语音、视频等多样化的交互方式正逐渐成为推动行业变革的新动力。 3月20日，全球物联网整体解决方案供应商移远通信宣布，其

2025-03-21 14:12:14

454

XMOS为普及AI应用推出基于软件定义SoC的多模态AI传感器融合接口

多模态传感信号AI处理为智算中心和边缘智能开启感知智能的新篇章

2025-05-12 17:51:54

430

多模态+空间智能：盾华以AI+智慧路灯杆，点亮城市治理新方式

2025-06-12 10:17:08

473

汽车多模态交互测试：智能交互的深度验证

在汽车智能座舱测试的关键进程中，北京沃华慧通测控技术有限公司展现出了独特的价值与优势。作为一家专注于测控技术领域的企业，沃华慧通在智能座舱测试方面积累了丰富的经验和专业的技术能力。其研发的测试设备能够精准模拟各种复杂的车载环境，对智能座舱的多模态交互系统进行全面、深入的测试。

2025-06-25 09:00:50

1296

商汤科技多模态通用智能战略思考

时间是最好的试金石，AI领域尤其如此。当行业热议大模型走向时，商汤早已锚定“多模态通用智能”——这是我们以深厚研究积累和实践反复验证的可行路径。

2025-08-14 09:33:34

1085

浅析多模态标注对大模型应用落地的重要性与标注实例

在人工智能迈向AGI通用智能的关键道路上，大模型正从单一的文本理解者，演进为能同时看、听、读、想的“多面手”。驱动这一进化的核心燃料，正是高质量的多模态数据，而将原始数据转化为“机器可读教材

2025-09-05 13:49:27

1258

2025安凯微电子开发者技术论坛成功举办——发布多款芯片，探索多模态与智能体落地

Forum 2025，简称 “ADF 2025”）。本次论坛以 “从多媒体到多模态，从智能硬件到智能体” 为主题，汇聚了学界专家、产业链上下游核心合作伙伴以及深耕智能硬件与边缘计算领域的开发者，聚焦多模态、智能体，共同探讨边缘智能领域技术前沿与产业落地，发布了多款芯片产品及解决方案。

2025-10-27 11:54:14

412

多模态与智能体：学术界与产业界共话边缘智能新未来-2025安凯微电子开发者技术论

展开深度分享。主题报告张长水博士：多模态融合是智能体发展的核心方向清华大学教授、 IEEE Fellow 、安凯微电子首席科学家张长水博士在《多模态与智能体》报告中，系统梳理了AI从“专用”向“通用”的演进逻辑。他指出，以DeepSeek、豆包等为代表的大语言模

2025-10-29 10:15:10

3504

亚马逊云科技上线Amazon Nova多模态嵌入模型

专为Agentic RAG与语义搜索量身打造，以行业顶尖的准确率实现跨模态检索北京2025年10月29日 /美通社/ -- 亚马逊云科技宣布，Amazon Nova Multimodal

2025-10-29 17:15:16

174

集成端侧AI的可穿戴多模态生理参数采集设备是脑机接口家用的未来？

HUIYING集成端侧AI的可穿戴多模态生理参数采集设备系统概述随着对实时生理监测与人机交互需求的增长，传统可穿戴设备在多模态同步采集与端侧智能处理方面存在不足。BioGAP-Ultra应运而生

2025-11-05 18:03:29

1527

芯导科技AI智能交互硬件方案介绍

AI智能交互硬件是通过集成人工智能技术（如大语言模型、多模态交互、机器学习等），赋予传统玩具智能化交互能力的新型产品。其核心特点是‌拟人化交互和自适应学习‌，能够理解用户语言、动作甚至情绪，并提供个性化响应。‌‌

2025-12-03 17:00:09

2216

涂鸦Omni AI Foundation V2.6发布：低代码+多模态，重塑AI硬件创新体验

硬件产品的落地。今天，我们非常高兴地宣布：面向多模态AI硬件的基座平台OmniAIFoundation正式发布V2.6版本。本次升级不仅显著提升了端到端多模态交互体

2025-12-24 18:58:23

198

已全部加载完成

搜索历史

以智能音箱为主的智能硬件持续增长交互模式也从单模态向多模态转变

评论

搜索历史

以智能音箱为主的智能硬件持续增长 交互模式也从单模态向多模态转变

评论

以智能音箱为主的智能硬件持续增长交互模式也从单模态向多模态转变