0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

蚂蚁数科正式发布金融推理大模型

A面面观 2025-07-28 16:36 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1,金融推理大模型Agentar-Fin-R1是基于Qwen3研发,Agentar-Fin-R1包括有32B和8B参数两个版本。在FinEval1.0、FinanceIQ等权威金融大模型评测基准上超越Deepseek-R1等同尺寸开源通用大模型以及金融大模型。更为重要的是,Agentar-Fin-R1还能不断更新迭代,更新金融政策、市场动态等关键信息,并通过配套评测工具进行针对性优化。

蚂蚁数科还推出基于百灵大模型的MOE架构模型,获得更优推理速度。此外,还有非推理版本的14B和72B参数大模型,以满足金融机构在多样化场景下的部署需求。

正如蚂蚁数科表达的那样,AI智能体产业价值释放的关键在于“水平通用”向“垂直专用”的战略转变。金融AI应用更需要“可靠、可控、可优化”;这也是金融推理大模型Agentar-Fin-R1的优势。







声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 蚂蚁
    +关注

    关注

    0

    文章

    18

    浏览量

    8122
  • 大模型
    +关注

    关注

    2

    文章

    3771

    浏览量

    5271
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模型推理服务的弹性部署与GPU调度方案

    7B 模型 FP16 推理需要约 14GB 显存,70B 模型需要 140GB+,KV Cache 随并发线性增长,显存碎片化导致实际利用率不足 60%。
    的头像 发表于 03-03 09:29 403次阅读

    阿里巴巴发布通义千问旗舰推理模型Qwen3-Max-Thinking

    今天,我们正式发布千问旗舰推理模型Qwen3-Max-Thinking,创下数项权威评测全球新纪录。
    的头像 发表于 01-27 15:47 588次阅读
    阿里巴巴<b class='flag-5'>发布</b>通义千问旗舰<b class='flag-5'>推理模型</b>Qwen3-Max-Thinking

    LLM推理模型是如何推理的?

    这篇文章《(How)DoReasoningModelsReason?》对当前大型推理模型(LRM)进行了深刻的剖析,超越了表面的性能宣传,直指其技术本质和核心局限。以下是基于原文的详细技术原理、关键
    的头像 发表于 01-19 15:33 700次阅读
    LLM<b class='flag-5'>推理模型</b>是如何<b class='flag-5'>推理</b>的?

    软通动力荣膺蚂蚁“领航AI Agent合作伙伴”

    12月11日,首届蚂蚁生态合作伙伴大会在苏州召开。大会以“与AI同行· 价值共生”为主题,汇聚数字科技产业链核心力量,共探AI大模型产业落地路径与生态协同机遇,软通动力高级副总裁霍
    的头像 发表于 12-12 21:52 1416次阅读

    华为数据存储与「DaoCloud 道客」发布AI推理加速联合解决方案

    规模化发展的拦路虎。在有限算力下,长序列输入导致首Token时延(TTFT)增加,甚至超长序列超出模型上下文窗口限制;随着并发增加,推理吞吐开始下降,任务频繁卡顿;历史对话和行业知识的重复调用造成算力浪费,加大
    的头像 发表于 11-28 10:03 482次阅读
    华为数据存储与「DaoCloud 道客」<b class='flag-5'>发布</b>AI<b class='flag-5'>推理</b>加速联合解决方案

    什么是AI模型推理能力

    NVIDIA 的数据工厂团队为 NVIDIA Cosmos Reason 等 AI 模型奠定了基础,该模型近日在 Hugging Face 的物理推理模型排行榜中位列榜首。
    的头像 发表于 09-23 15:19 1469次阅读

    NVIDIA Nemotron Nano 2推理模型发布

    NVIDIA 正式推出准确、高效的混合 Mamba-Transformer 推理模型系列 NVIDIA Nemotron Nano 2。
    的头像 发表于 08-27 12:45 2012次阅读
    NVIDIA Nemotron Nano 2<b class='flag-5'>推理模型</b><b class='flag-5'>发布</b>

    华为亮相2025金融AI推理应用落地与发展论坛

    近日,2025金融AI推理应用落地与发展论坛在上海举行。中国银联执行副总裁涂晓军、华为数字金融军团CEO曹冲出席本次论坛并发表致辞。论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布
    的头像 发表于 08-15 09:45 1385次阅读

    商汤大装置跻身中国大模型推理算力厂商第一梯队

    近日,IDC发布首个《2025中国大模型推理算力市场分析报告》。
    的头像 发表于 08-14 09:29 5062次阅读

    请问如何在RK3588上使用npu,用onnx模型推理

    请问如何在瑞芯微 RK3588上使用npu,用onnx模型推理。官网上介绍说要把ONNX模型转换成RKNN模型。但是我并不想这么干,请问有什么办法吗?
    发表于 08-09 00:51

    模型推理显存和计算量估计方法研究

    随着人工智能技术的飞速发展,深度学习大模型在各个领域得到了广泛应用。然而,大模型推理过程对显存和计算资源的需求较高,给实际应用带来了挑战。为了解决这一问题,本文将探讨大模型
    发表于 07-03 19:43

    超低延时重构AI推理体验!白山云发布“大模型API”产品

    白山云科技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全球边缘云架构
    的头像 发表于 07-02 17:26 1253次阅读
    超低延时重构AI<b class='flag-5'>推理</b>体验!白山云<b class='flag-5'>发布</b>“大<b class='flag-5'>模型</b>API”产品

    GAITC2025|张:端云一体大模型推理应用实战

    出席并在《行业大模型应用与发展》论坛发表演讲,首次深入介绍京东零售在端云一体大模型推理架构的实战经验与技术探索,并分享AI推理方向的未来发展思考。 以下为张
    的头像 发表于 06-26 09:33 718次阅读

    商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作

    打开蚂蚁百宝箱,跳出一只商汤小浣熊。 商汤科技“小浣熊家族”与蚂蚁集团旗下智能体开发平台“蚂蚁百宝箱”正式达成生态合作,双方联合打造“AI数据分析助手”,为百宝箱广大用户提供大模型服务
    的头像 发表于 06-09 15:09 1524次阅读
    商汤科技“小浣熊家族”与<b class='flag-5'>蚂蚁</b>集团旗下智能体开发平台“<b class='flag-5'>蚂蚁</b>百宝箱”正式达成生态合作

    中兴通讯星云大模型登顶SuperCLUE推理专项榜单

    近日,中文大模型权威测评基准SuperCLUE发布《中文大模型基准测评2025年5月报告》。报告显示,中兴通讯自主研发的星云大模型NebulaCoder-V6在
    的头像 发表于 06-04 16:44 1583次阅读