7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1,金融推理大模型Agentar-Fin-R1是基于Qwen3研发,Agentar-Fin-R1包括有32B和8B参数两个版本。在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型。更为重要的是,Agentar-Fin-R1还能不断更新迭代,更新金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化。
蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。
正如蚂蚁数科表达的那样,AI智能体产业价值释放的关键在于“水平通用”向“垂直专用”的战略转变。金融AI应用更需要“可靠、可控、可优化”;这也是金融推理大模型Agentar-Fin-R1的优势。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
蚂蚁
+关注
关注
0文章
18浏览量
8122 -
大模型
+关注
关注
2文章
3771浏览量
5271
发布评论请先 登录
相关推荐
热点推荐
大模型推理服务的弹性部署与GPU调度方案
7B 模型 FP16 推理需要约 14GB 显存,70B 模型需要 140GB+,KV Cache 随并发数线性增长,显存碎片化导致实际利用率不足 60%。
LLM推理模型是如何推理的?
这篇文章《(How)DoReasoningModelsReason?》对当前大型推理模型(LRM)进行了深刻的剖析,超越了表面的性能宣传,直指其技术本质和核心局限。以下是基于原文的详细技术原理、关键
软通动力荣膺蚂蚁数科“领航AI Agent合作伙伴”
12月11日,首届蚂蚁数科生态合作伙伴大会在苏州召开。大会以“与AI同行· 价值共生”为主题,汇聚数字科技产业链核心力量,共探AI大模型产业落地路径与生态协同机遇,软通动力高级副总裁霍
华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案
规模化发展的拦路虎。在有限算力下,长序列输入导致首Token时延(TTFT)增加,甚至超长序列超出模型上下文窗口限制;随着并发数增加,推理吞吐开始下降,任务频繁卡顿;历史对话和行业知识的重复调用造成算力浪费,加大
什么是AI模型的推理能力
NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
华为亮相2025金融AI推理应用落地与发展论坛
近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布
请问如何在RK3588上使用npu,用onnx模型来推理
请问如何在瑞芯微 RK3588上使用npu,用onnx模型来推理。官网上介绍说要把ONNX模型转换成RKNN模型。但是我并不想这么干,请问有什么办法吗?
发表于 08-09 00:51
大模型推理显存和计算量估计方法研究
随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型的推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大模型
发表于 07-03 19:43
超低延时重构AI推理体验!白山云发布“大模型API”产品
白山云科技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全球边缘云架构
GAITC2025|张科:端云一体大模型推理应用实战
出席并在《行业大模型应用与发展》论坛发表演讲,首次深入介绍京东零售在端云一体大模型推理架构的实战经验与技术探索,并分享AI推理方向的未来发展思考。 以下为张
商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作
打开蚂蚁百宝箱,跳出一只商汤小浣熊。 商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作,双方联合打造“AI数据分析助手”,为百宝箱广大用户提供大模型服务
中兴通讯星云大模型登顶SuperCLUE推理专项榜单
近日,中文大模型权威测评基准SuperCLUE发布《中文大模型基准测评2025年5月报告》。报告显示,中兴通讯自主研发的星云大模型NebulaCoder-V6在
蚂蚁数科正式发布金融推理大模型
评论