0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

虹软推出新一代视觉大模型ArcMuse 2025 V1.1

虹软 来源:虹软 2025-03-05 17:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大模型从最初的“不计成本”探索,到如今的“可持续”商业化落地,经历了从技术突破到工程优化,再到产业融合的深度演进。在这一过程中,虹软始终走在创新前沿,依托深厚的视觉AI技术积累,以ArcMuse计算技术引擎为核心,不断推动视觉大模型的技术进步与行业落地,加速AI在各领域的深度应用。

自2023年推出以来,ArcMuse计算技术引擎凭借持续的 算法创新与工程优化 ,构建起多层次架构、跨模型协同优化、高效能计算引擎等核心能力,不断突破通用大模型在计算成本、适配效率、推理速度等方面的局限。如今,经过对算法、数据、工程及大模型生态的全面优化,ArcMuse迎来了全新升级 —— ArcMuse 2025 V1.1版本。新一代ArcMuse在生成质量、计算效率、端侧适配性等方面取得了显著突破 , 进一步 增强了视觉大模型的泛化能力与实用性 。其先进的视觉AI能力全面支持智能手机、智能汽车、AI眼镜、机器人、服装智造以及智能商拍的创新发展。

ArcMuse 2025 总体架构与核心愿景:视觉AI核心基座引擎,不止大模型

ArcMuse是一个 兼顾效果和性能的紧凑AI综合体 ,它以大底模和强化的垂直大模型为基础,用以生成远观悦目的基础效果,并利用一系列复杂或简单细分小模型、浅层模型、用于约束的CV&CG引擎包对基础效果进行控制,以达到近看自然、结构信息正确、细节丰富合理的最终图像和视频效果。

ArcMuse 2025核心思想与架构:

ArcMuse是一套深度耦合底模、细分大模型、控制浅层复杂模型和视觉库、约束细节的浅层小模型和视觉库,数据预处理引擎包、CV&CG处理引擎包、定制化文本生成模型的紧凑稳定AI平台库。

CPG(Control Packages) : 利用五大类小模型和引擎包对期望的结果进行约束与控制。

人 物: 手、脸、脚、四肢、体

深度: 各类摄像头、模组、模式的输入,都能得到高质量的深度

分割: 基于对象、区域、语义等

分类: 景、物、影调、情感等

边缘: 强、弱、结构、遮挡、悬空等

KDE(Keep Details Engines) :利用一些浅层模型保留弱纹理和细节,利用光照模型分析、去除、重光照处理和维持影调(Shading)。

高效计算优化: 采用FP8混合精度计算,对核心计算复杂度高的OPs进行汇编级优化。

训练和推理时的减冗余并行处理引擎包 :这点得益于公司定位实际应用落地有回报的降本压力,进而研发出高效的基础引擎和策略。

平台无关化的各种处理 :依托虹软 20 余年的视觉AI技术积累,使 ArcMuse 具备跨平台适配能力,可灵活部署于云端、高性能计算平台、移动端及嵌入式设备。

从实用落地的角度来看,真正可行的 AI 大模型方案必须实现 多层次协同与功能模块互补 ,降低计算成本,以推动大模型应用平权化,使其更广泛地赋能终端设备与各行业。ArcMuse 2025 正是基于这一理念让视觉 AI 在真实应用场景中 实现性能、效果与成本的三重突破 。

从 DeepSeek 到 ArcMuse 2025:构建大模型新范式

AI 计算的高效降本是大模型商业可行化落地的关键,其核心在于 降低计算资源消耗 、 减少存储需求与数据依赖 ,以更低的成本提供可接受甚至卓越的AI性能,使先进AI技术(包括大模型)能够更广泛地惠及各行业与终端设备。要实现这一目标,仅依赖单一大模型或传统Transformer架构的顶级云计算平台远远不够,而必须借助 多AI范式的深度耦合 ,并具备 动态多层次的自适应能力的AI计算架构 ,以应对不同计算环境的需求。

在这点上, DeepSeek 在文本和规则性较强的AI任务(如数学、代码等) 上的策略,提供了一个典型的成功案例。其通过 DS-MOE(动态路由稀疏专家网络)、MLA(KV矩阵缓存压缩)、MTP(多Token预测)、FP8(混合精度量化训练)、GRPO (强化学习采用群组相对策略优化)、DualPipe(调度算法) 等优化策略,极大提升了大模型的计算效率,并降低了硬件成本,为大模型高效降本提供了新的思路。然而,DeepSeek 在推理计算与存储占用上仍然存在一定的优化空间,特别是对于图像、视频等视觉任务而言,如何借鉴这些优化思想,并结合视觉AI的独特需求,是一个关键课题。

在这一背景下, 虹软对 DeepSeek 的优化策略进行了深入分析 ,并结合自身在视觉 AI领域的多年研发经验,取长补短、深度融合,同时针对视觉 AI 的特性进行了 定制化优化 。实践证明,这一耦合总体上带来了 显著的增益 ,不仅全面提升了ArcMuse的性能,尤其在 多模态数据理解、图像与视频推理增强方面效果突出 ;同时, 计算成本大幅降低 ,例如,在提示词工程推理方面, 显卡租赁成本减少了一半以上 ,使大模型的 AI计算更高效且可控 。

为直观展现 ArcMuse 2025 在视觉生成、影像修复及视频生成方面的能力,我们以非刚体拓扑难以保持的柔性衣物为背景,呈现其在复杂视觉任务中的卓越表现。

生成图像示例1:

弱纹理、细节提升

生成图像示例2:

细节、影调的提升

困难场景(Hard Case)示例:半透物(薄纱)、柔性物(裙装)、复杂版型(塞腰、束腕)、弱纹理细节(纹理花纹、花边领、暗条纹)

生成图像示例4 :

AI模特图大角度、模特表现力更新

生成图像示例5 :

AI生成图的光影效果、模特表现力更新

生成视频示例6:

AI模特复杂动作的稳定性、表现力更新

生成图像示例7:半透装、碎花裙

生成视频示例8:

让示例7生成图像再动起来

ArcMuse 2025 为垂直行业提供定制化解决方案

ArcMuse 2025 的架构是一种系统性优化方案,通过整合多个 AI 引擎,实现高效协同,即使在有限资源下仍能发挥最大效能,并为各类垂直行业提供定制化解决方案。这一架构理念使 ArcMuse 成为 虹软视觉 AI 赋能引擎 ,可广泛应用于移动智能终端 AI 影像处理、智能汽车、AI 眼镜、XR 3D 空间计算头显、服装智造和智能商拍以及智能机器人等垂直场景,推动行业创新升级。

在AI影像处理方面,ArcMuse 2025对AI影像模型进行了优化,特别是在图像增强与影像细节恢复过程中,显著减少了生成不真实效果的风险。升级后的模型在处理复杂纹理和高对比度场景时,展现出较为稳定的增强效果,降低了图像生成中的不确定性。另外,在语义分割与识别方面,ArcMuse 2025进一步增强了ArcMuse 2024对图像内容的理解精度,尤其是在文字纹理处理上,表现出比以往更强的模型细节还原能力。

在智能汽车方向,ArcMuse 2025的推理能力和场景理解能力得到提升,尤其在低能见度和复杂路况环境下,其优化后的推理方法能够结合不同的驾驶环境进行分析,为驾驶员提供更为合理的安全辅助建议。例如,在大雾天气和湿滑路况下,系统能够根据前方车辆的灯光信号、车速以及路面状态,提出合理的驾驶策略与建议,减少潜在的驾驶或行车风险。

在 AI 眼镜与 XR 3D 空间计算头显方向,ArcMuse 2025明显提升了对复杂环境下物体识别的精度,尤其是在图像语义分割和物体关系的理解上。在应用中,ArcMuse 2025能够更加精确地区分复杂环境中的物体和背景,减少误识别的情况。例如,在对图像中的窗户与画作进行区分时,ArcMuse 2025 通过优化图像分析流程,有效避免了误识别,提高了识别的准确度。

在智能商拍方向,ArcMuse 2025利用内部新迭代的蒸馏框架优化了文本与图像生成的控制精度,使得在提示词响应的准确性和图像生成的可靠性方面有更高的提升。升级后的ArcMuse有更强的文本与图像的匹配能力,能够更好地生成符合商业需求的图像。

在智能机器人方向,ArcMuse 2025通过优化多模态数据处理、实时目标识别、复杂场景理解等可显著提升机器人在动态环境中的适应性和自主性。同时,针对端侧部署深度优化,可使其在有限算力下依然高效运行 AI 任务,助力其在工业自动化、智能服务、家庭陪护、教育娱乐等应用落地。

视觉大模型实用化:多AI协同,驱动创新落地

虹软的视觉AI技术研发经历了20多年的历练,绝大多数技术都实现了产品化应用和实际落地,达到了100亿级端侧设备的实际应用。虹软的AI研发经历了从CV&CG到浅层学习,从端侧深度学习到复杂模型,从底座模型强化到领域大模型;效果和性能、功耗3指标并举的多阶段扎实迭代向前演进。

在当下的AI技术快速发展浪潮中,大模型成为行业关注的焦点,近来DeepSeek又带来一波强化剂。虹软认为真正高效的智能计算体系不是单一的通识大模型,每个AI引擎有各自的效果和性能优缺点,须深度耦合、效果性能权衡,这样才能帮助视觉大模型真正快速落地实用化。

另外,一个非常有意义的目标是:“大模型普及与可商业化”。其核心是算力要求要尽可能低,存储资源要尽可能少,数据要求要尽可能少,成本尽可能省,但效果尽可能好。这样的话,多AI范式的高度耦合,且是动态多层次的AI计算架构,才是逻辑合理的选择,仅靠目前单一的视觉大模型还不够、走不通,这就是ArcMuse的架构思路和定位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 视觉
    +关注

    关注

    1

    文章

    184

    浏览量

    24902
  • 虹软
    +关注

    关注

    1

    文章

    68

    浏览量

    4796
  • 大模型
    +关注

    关注

    2

    文章

    3884

    浏览量

    5311

原文标题:虹软新一代视觉大模型ArcMuse 2025 V1.1正式发布,全面赋能手机、汽车、眼镜、机器人、服装智造和智能商拍行业

文章出处:【微信号:ArcSoft_World_Wide,微信公众号:虹软】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    技嘉科技正式推出新一代AORUS PRIME 5高性能电竞主机

    近日,技嘉科技正式推出新一代AORUS PRIME 5高性能电竞主机,定位高端游戏与创作市场,主打即插即用的省心体验和顶级硬件的硬核性能。
    的头像 发表于 05-14 10:06 1220次阅读

    Flymaple V1.1:高性能四轴飞行器控制器板

    Flymaple V1.1:高性能四轴飞行器控制器板 在电子工程领域,款优秀的控制器板对于各类项目的成功实施至关重要。今天,我们就来深入了解下 Flymaple V1.1(SKU:
    的头像 发表于 05-13 17:00 324次阅读

    Nullmax推出新一代基于世界模型的闭环仿真系统

    针对端到端智驾大模型量产上车前所面临的测试成本高、问题定位难、长尾场景覆盖不足等挑战,Nullmax 基于世界模型(World Model)推出新一代闭环仿真系统。
    的头像 发表于 04-08 11:12 592次阅读
    Nullmax<b class='flag-5'>推出新一代</b>基于世界<b class='flag-5'>模型</b>的闭环仿真系统

    士兰微电子推出新一代组串电站逆变模块解决方案

    士兰微电子推出新一代组串电站逆变模块解决方案,采用与国际TOP友商最先进芯片技术对标的FS5+ IGBT芯片技术,最大化光伏电能转换效率;搭配士兰自主开发的D6封装,全面支持2000V系统应用需求。
    的头像 发表于 12-22 14:04 1218次阅读
    士兰微电子<b class='flag-5'>推出新一代</b>组串电站逆变模块解决方案

    长晶科技推出新一代SGT 30V MOSFET

    长晶科技重磅推出新一代 SGT Gen2.0工艺。在30V电压平台,与Gen1.0相比,Fom值可降低50%,超同期欧美系水平12.5%;相比上一代,Rsp值可降低41.6%,超同期欧美系水平
    的头像 发表于 12-18 10:08 809次阅读
    长晶科技<b class='flag-5'>推出新一代</b>SGT 30<b class='flag-5'>V</b> MOSFET

    通动力入选2025新一代信息技术应用优秀案例

    近日,DBC德本咨询正式发布“2025新一代信息技术应用优秀案例”榜单,通动力信息技术(集团)股份有限公司携手广西星网智云科技有限公司,为广西玉柴机器集团有限公司打造的“玉柴数智化审计业务场景项目”成功入选,位列榜单第二名,充
    的头像 发表于 09-28 17:48 1628次阅读

    通动力携手华为与庆电子推出AI视觉工业质检解决方案

    近日,华为全联接大会(HC)期间,华为联合通动力与庆电子在上海世博展览馆重磅发布‌AI视觉工业质检解决方案‌。庆电子执行总裁包中南,华为数据中心集成与辅助运营领域经理彭晶,华为江
    的头像 发表于 09-28 17:38 1731次阅读

    【内测活动同步开启】这么小?这么强?新一代模型MCP开发板来啦!

    【内测活动同步开启】这么小?这么强?新一代模型MCP开发板来啦! 聆思全新一代六合芯片「LS26系列」,搭载WIFI / BLE & BT / NPU,与「小聆AI」强强
    发表于 09-25 11:47

    扬杰科技推出新一代To-247PLUS封装1200V IGBT单管

    扬杰科技近日推出新一代 To-247PLUS 封装1200V IGBT单管,产品采用新一代微沟槽工艺平台,极大的优化了器件的导通损耗,产品参数
    的头像 发表于 09-18 18:01 2972次阅读
    扬杰科技<b class='flag-5'>推出新一代</b>To-247PLUS封装1200<b class='flag-5'>V</b> IGBT单管

    环旭电子即将推出新一代1.6T光模组产品

    全球领先的电子设计与制造服务供货商USI环旭电子宣布,即将推出新一代1.6T光模组产品,锁定高速运算与AI数据中心应用,协助客户提升数据中心网络拓扑效能,应对AI模型规模扩展所带来的庞大数据传输需求。
    的头像 发表于 07-30 10:45 2751次阅读

    亮相2025高通汽车技术与合作峰会

    此前,2025年6月26-27日,在刚刚落幕的2025高通汽车技术与合作峰会上,围绕视觉感知驱动智能进化,集中展示了基于高通骁龙汽车平台
    的头像 发表于 06-30 17:59 2717次阅读

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 1397次阅读

    展会回顾 | 赋能新一代工业网络!2025华南工博会圆满落幕

    6月4-6日,为期3天的2025华南国际工业博览会SCIIF在深圳国际会展中心(宝安)盛大举行。此次参展,科全方位展示了在工业领域的最新成果和解决方案,包括符合新一代CAN总线标准的CANXL协议
    的头像 发表于 06-11 17:32 1255次阅读
    展会回顾 | 赋能<b class='flag-5'>新一代</b>工业网络!<b class='flag-5'>虹</b>科<b class='flag-5'>2025</b>华南工博会圆满落幕

    科而美正式推出新一代RDM线条灯

    在照明技术快速迭代的今天,科而美正式推出新一代RDM线条灯,以颠覆性的技术突破重新定义行业标准!
    的头像 发表于 06-11 15:41 1780次阅读

    助力路虎全新一代Defender卫士系列上市

    近期,全球知名豪华汽车品牌路虎正式宣布全新一代Defender卫士系列在英国市场率先上市。作为服务于该车型生态体系的智能视觉AI技术提供方之
    的头像 发表于 06-05 17:34 1016次阅读