0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

虹软推出新一代视觉大模型ArcMuse 2025 V1.1

虹软 来源:虹软 2025-03-05 17:19 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

大模型从最初的“不计成本”探索,到如今的“可持续”商业化落地,经历了从技术突破到工程优化,再到产业融合的深度演进。在这一过程中,虹软始终走在创新前沿,依托深厚的视觉AI技术积累,以ArcMuse计算技术引擎为核心,不断推动视觉大模型的技术进步与行业落地,加速AI在各领域的深度应用。

自2023年推出以来,ArcMuse计算技术引擎凭借持续的 算法创新与工程优化 ,构建起多层次架构、跨模型协同优化、高效能计算引擎等核心能力,不断突破通用大模型在计算成本、适配效率、推理速度等方面的局限。如今,经过对算法、数据、工程及大模型生态的全面优化,ArcMuse迎来了全新升级 —— ArcMuse 2025 V1.1版本。新一代ArcMuse在生成质量、计算效率、端侧适配性等方面取得了显著突破 , 进一步 增强了视觉大模型的泛化能力与实用性 。其先进的视觉AI能力全面支持智能手机、智能汽车、AI眼镜、机器人、服装智造以及智能商拍的创新发展。

ArcMuse 2025 总体架构与核心愿景:视觉AI核心基座引擎,不止大模型

ArcMuse是一个 兼顾效果和性能的紧凑AI综合体 ,它以大底模和强化的垂直大模型为基础,用以生成远观悦目的基础效果,并利用一系列复杂或简单细分小模型、浅层模型、用于约束的CV&CG引擎包对基础效果进行控制,以达到近看自然、结构信息正确、细节丰富合理的最终图像和视频效果。

ArcMuse 2025核心思想与架构:

ArcMuse是一套深度耦合底模、细分大模型、控制浅层复杂模型和视觉库、约束细节的浅层小模型和视觉库,数据预处理引擎包、CV&CG处理引擎包、定制化文本生成模型的紧凑稳定AI平台库。

CPG(Control Packages) : 利用五大类小模型和引擎包对期望的结果进行约束与控制。

人 物: 手、脸、脚、四肢、体

深度: 各类摄像头、模组、模式的输入,都能得到高质量的深度

分割: 基于对象、区域、语义等

分类: 景、物、影调、情感等

边缘: 强、弱、结构、遮挡、悬空等

KDE(Keep Details Engines) :利用一些浅层模型保留弱纹理和细节,利用光照模型分析、去除、重光照处理和维持影调(Shading)。

高效计算优化: 采用FP8混合精度计算,对核心计算复杂度高的OPs进行汇编级优化。

训练和推理时的减冗余并行处理引擎包 :这点得益于公司定位实际应用落地有回报的降本压力,进而研发出高效的基础引擎和策略。

平台无关化的各种处理 :依托虹软 20 余年的视觉AI技术积累,使 ArcMuse 具备跨平台适配能力,可灵活部署于云端、高性能计算平台、移动端及嵌入式设备。

从实用落地的角度来看,真正可行的 AI 大模型方案必须实现 多层次协同与功能模块互补 ,降低计算成本,以推动大模型应用平权化,使其更广泛地赋能终端设备与各行业。ArcMuse 2025 正是基于这一理念让视觉 AI 在真实应用场景中 实现性能、效果与成本的三重突破 。

从 DeepSeek 到 ArcMuse 2025:构建大模型新范式

AI 计算的高效降本是大模型商业可行化落地的关键,其核心在于 降低计算资源消耗 、 减少存储需求与数据依赖 ,以更低的成本提供可接受甚至卓越的AI性能,使先进AI技术(包括大模型)能够更广泛地惠及各行业与终端设备。要实现这一目标,仅依赖单一大模型或传统Transformer架构的顶级云计算平台远远不够,而必须借助 多AI范式的深度耦合 ,并具备 动态多层次的自适应能力的AI计算架构 ,以应对不同计算环境的需求。

在这点上, DeepSeek 在文本和规则性较强的AI任务(如数学、代码等) 上的策略,提供了一个典型的成功案例。其通过 DS-MOE(动态路由稀疏专家网络)、MLA(KV矩阵缓存压缩)、MTP(多Token预测)、FP8(混合精度量化训练)、GRPO (强化学习采用群组相对策略优化)、DualPipe(调度算法) 等优化策略,极大提升了大模型的计算效率,并降低了硬件成本,为大模型高效降本提供了新的思路。然而,DeepSeek 在推理计算与存储占用上仍然存在一定的优化空间,特别是对于图像、视频等视觉任务而言,如何借鉴这些优化思想,并结合视觉AI的独特需求,是一个关键课题。

在这一背景下, 虹软对 DeepSeek 的优化策略进行了深入分析 ,并结合自身在视觉 AI领域的多年研发经验,取长补短、深度融合,同时针对视觉 AI 的特性进行了 定制化优化 。实践证明,这一耦合总体上带来了 显著的增益 ,不仅全面提升了ArcMuse的性能,尤其在 多模态数据理解、图像与视频推理增强方面效果突出 ;同时, 计算成本大幅降低 ,例如,在提示词工程推理方面, 显卡租赁成本减少了一半以上 ,使大模型的 AI计算更高效且可控 。

为直观展现 ArcMuse 2025 在视觉生成、影像修复及视频生成方面的能力,我们以非刚体拓扑难以保持的柔性衣物为背景,呈现其在复杂视觉任务中的卓越表现。

生成图像示例1:

弱纹理、细节提升

生成图像示例2:

细节、影调的提升

困难场景(Hard Case)示例:半透物(薄纱)、柔性物(裙装)、复杂版型(塞腰、束腕)、弱纹理细节(纹理花纹、花边领、暗条纹)

生成图像示例4 :

AI模特图大角度、模特表现力更新

生成图像示例5 :

AI生成图的光影效果、模特表现力更新

生成视频示例6:

AI模特复杂动作的稳定性、表现力更新

生成图像示例7:半透装、碎花裙

生成视频示例8:

让示例7生成图像再动起来

ArcMuse 2025 为垂直行业提供定制化解决方案

ArcMuse 2025 的架构是一种系统性优化方案,通过整合多个 AI 引擎,实现高效协同,即使在有限资源下仍能发挥最大效能,并为各类垂直行业提供定制化解决方案。这一架构理念使 ArcMuse 成为 虹软视觉 AI 赋能引擎 ,可广泛应用于移动智能终端 AI 影像处理、智能汽车、AI 眼镜、XR 3D 空间计算头显、服装智造和智能商拍以及智能机器人等垂直场景,推动行业创新升级。

在AI影像处理方面,ArcMuse 2025对AI影像模型进行了优化,特别是在图像增强与影像细节恢复过程中,显著减少了生成不真实效果的风险。升级后的模型在处理复杂纹理和高对比度场景时,展现出较为稳定的增强效果,降低了图像生成中的不确定性。另外,在语义分割与识别方面,ArcMuse 2025进一步增强了ArcMuse 2024对图像内容的理解精度,尤其是在文字纹理处理上,表现出比以往更强的模型细节还原能力。

在智能汽车方向,ArcMuse 2025的推理能力和场景理解能力得到提升,尤其在低能见度和复杂路况环境下,其优化后的推理方法能够结合不同的驾驶环境进行分析,为驾驶员提供更为合理的安全辅助建议。例如,在大雾天气和湿滑路况下,系统能够根据前方车辆的灯光信号、车速以及路面状态,提出合理的驾驶策略与建议,减少潜在的驾驶或行车风险。

在 AI 眼镜与 XR 3D 空间计算头显方向,ArcMuse 2025明显提升了对复杂环境下物体识别的精度,尤其是在图像语义分割和物体关系的理解上。在应用中,ArcMuse 2025能够更加精确地区分复杂环境中的物体和背景,减少误识别的情况。例如,在对图像中的窗户与画作进行区分时,ArcMuse 2025 通过优化图像分析流程,有效避免了误识别,提高了识别的准确度。

在智能商拍方向,ArcMuse 2025利用内部新迭代的蒸馏框架优化了文本与图像生成的控制精度,使得在提示词响应的准确性和图像生成的可靠性方面有更高的提升。升级后的ArcMuse有更强的文本与图像的匹配能力,能够更好地生成符合商业需求的图像。

在智能机器人方向,ArcMuse 2025通过优化多模态数据处理、实时目标识别、复杂场景理解等可显著提升机器人在动态环境中的适应性和自主性。同时,针对端侧部署深度优化,可使其在有限算力下依然高效运行 AI 任务,助力其在工业自动化、智能服务、家庭陪护、教育娱乐等应用落地。

视觉大模型实用化:多AI协同,驱动创新落地

虹软的视觉AI技术研发经历了20多年的历练,绝大多数技术都实现了产品化应用和实际落地,达到了100亿级端侧设备的实际应用。虹软的AI研发经历了从CV&CG到浅层学习,从端侧深度学习到复杂模型,从底座模型强化到领域大模型;效果和性能、功耗3指标并举的多阶段扎实迭代向前演进。

在当下的AI技术快速发展浪潮中,大模型成为行业关注的焦点,近来DeepSeek又带来一波强化剂。虹软认为真正高效的智能计算体系不是单一的通识大模型,每个AI引擎有各自的效果和性能优缺点,须深度耦合、效果性能权衡,这样才能帮助视觉大模型真正快速落地实用化。

另外,一个非常有意义的目标是:“大模型普及与可商业化”。其核心是算力要求要尽可能低,存储资源要尽可能少,数据要求要尽可能少,成本尽可能省,但效果尽可能好。这样的话,多AI范式的高度耦合,且是动态多层次的AI计算架构,才是逻辑合理的选择,仅靠目前单一的视觉大模型还不够、走不通,这就是ArcMuse的架构思路和定位。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 视觉
    +关注

    关注

    1

    文章

    171

    浏览量

    24710
  • 虹软
    +关注

    关注

    1

    文章

    66

    浏览量

    4718
  • 大模型
    +关注

    关注

    2

    文章

    3439

    浏览量

    4960

原文标题:虹软新一代视觉大模型ArcMuse 2025 V1.1正式发布,全面赋能手机、汽车、眼镜、机器人、服装智造和智能商拍行业

文章出处:【微信号:ArcSoft_World_Wide,微信公众号:虹软】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    通动力入选2025新一代信息技术应用优秀案例

    近日,DBC德本咨询正式发布“2025新一代信息技术应用优秀案例”榜单,通动力信息技术(集团)股份有限公司携手广西星网智云科技有限公司,为广西玉柴机器集团有限公司打造的“玉柴数智化审计业务场景项目”成功入选,位列榜单第二名,充
    的头像 发表于 09-28 17:48 1119次阅读

    环旭电子即将推出新一代1.6T光模组产品

    全球领先的电子设计与制造服务供货商USI环旭电子宣布,即将推出新一代1.6T光模组产品,锁定高速运算与AI数据中心应用,协助客户提升数据中心网络拓扑效能,应对AI模型规模扩展所带来的庞大数据传输需求。
    的头像 发表于 07-30 10:45 1536次阅读

    谷歌新一代生成式AI媒体模型登陆Vertex AI平台

    我们在 Vertex AI 上推出新一代生成式 AI 媒体模型: Imagen 4、Veo 3 和 Lyria 2。
    的头像 发表于 06-18 09:56 877次阅读

    展会回顾 | 赋能新一代工业网络!2025华南工博会圆满落幕

    6月4-6日,为期3天的2025华南国际工业博览会SCIIF在深圳国际会展中心(宝安)盛大举行。此次参展,科全方位展示了在工业领域的最新成果和解决方案,包括符合新一代CAN总线标准的CANXL协议
    的头像 发表于 06-11 17:32 904次阅读
    展会回顾 | 赋能<b class='flag-5'>新一代</b>工业网络!<b class='flag-5'>虹</b>科<b class='flag-5'>2025</b>华南工博会圆满落幕

    科而美正式推出新一代RDM线条灯

    在照明技术快速迭代的今天,科而美正式推出新一代RDM线条灯,以颠覆性的技术突破重新定义行业标准!
    的头像 发表于 06-11 15:41 968次阅读

    助力路虎全新一代Defender卫士系列上市

    近期,全球知名豪华汽车品牌路虎正式宣布全新一代Defender卫士系列在英国市场率先上市。作为服务于该车型生态体系的智能视觉AI技术提供方之
    的头像 发表于 06-05 17:34 637次阅读

    SEGGER推出新一代Flasher ATE在线编程器

    2025年5月,SEGGER推出新一代的Flasher ATE在线编程器Flasher ATE2。该设备的外形紧凑,可以安装在机架上或直接安装在ATE设备上。
    的头像 发表于 05-12 14:21 715次阅读

    科技亮相2025上海车展

    2025年4月23日至5月2日,多项智能汽车视觉核心技术参考设计及软件方案亮相上海国际车展,分别在欧冶、舜宇、长江三大生态合作伙伴展台同步展出。
    的头像 发表于 04-25 14:47 939次阅读

    联合推出新一代全语言交互式人社服务机器人“南小宁”

    日前,东与南宁智慧人社创新实验室以及华为携手,共同推出新一代全语言交互式人社服务机器人——“南小宁”。它是基于东“融智”解决方案智能化实施框架,适配DeepSeek推理模型,并结合
    的头像 发表于 03-25 10:04 884次阅读

    睿创微纳推出新一代目标检测算法

    随着AI技术的发展,目标检测算法也迎来重大突破。睿创微纳作为热成像领军者,凭借深厚的技术积累与创新能力,结合AI技术推出新一代目标检测算法,以三大核心技术带来AI视觉感知全场景解决方案突破,助力各产业智能化升级。
    的头像 发表于 03-20 13:49 797次阅读

    AI视觉赋能雷鸟V3 AI拍摄眼镜发布

    近日,雷鸟创新正式发布全新一代AI拍摄眼镜——雷鸟V3。该产品搭载多项创新技术,包括融合AI视觉算法的猎鹰影像系统、通义独家定制大
    的头像 发表于 01-08 10:58 2259次阅读

    Garmin佳明和天马推出新一代数字座舱解决方案

    在即将开幕的国际消费电子展(CES 2025)上,Garmin佳明推出新一代数字座舱解决方案Garmin Unified Cabin 2025。该方案配备了天马多款车规级显示屏,其中
    的头像 发表于 01-07 16:16 1278次阅读

    Garmin佳明和高通推出新一代数字座舱解决方案

    Garmin佳明和高通技术公司在2025年国际消费电子展(CES 2025)上宣布,双方将扩展在汽车技术领域的合作,推出新一代数字座舱解决方案Garmin Unified Cabin
    的头像 发表于 01-07 10:38 1181次阅读

    ArcMuse计算技术引擎全面升级

    经过半年多的潜心研发和技术攻关,ArcMuse计算技术引擎迎来全面升级,实现多项关键技术突破。升级内容涵盖高清视频生成、AI模特图高精度生成、智能试衣和平铺图生成等领域,有效攻克了商拍领域中的诸多核心难点。
    的头像 发表于 12-11 17:34 1293次阅读

    亚马逊云科技推出新一代Amazon SageMaker

    为数据、分析和AI提供统平台 北京2024年12月10日 /美通社/ -- 亚马逊云科技在2024 re:Invent全球大会上,宣布推出新一代Amazon SageMaker,将客户所需的快速
    的头像 发表于 12-10 15:53 652次阅读