0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?

爱云资讯 2024-06-28 23:05 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

一个“技术问题”,导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近100%。

想必很多小伙伴已经感受过了这则铺天盖地的消息,所带来的亿点点震撼。

而根据事后的消息来看,这个大故障是纽交所的合并报价系统(CTA)在更新软件时出现了问题。

许多专家都对此做了分析,有人认为是CTA软件在进行版本更新时出现了数据一致性问题;也有人提出最大的问题应该是出现在了数据库。

但总而言之,这并非是纽交所今年来第一次出现的故障,而是众多里的一个:

wKgaomZ-0TeACn4EAAEmBP8e0N8243.jpg

甚至某开源数据库联合创始人Jason直言不讳地表示:

>纽交所在CTA软件上相关的IT水平还不及中国的大型金融机构和互联网公司,在中国已经很少会发生这种低级错误了。

即便如此,这也不禁令人产生更大的顾虑和担忧——

传统软件问题尚能引发如此大的问题,那么站在大模型时代当下,AI+金融,是否又能做到准确可信?

正所谓实践是检验真理唯一标准,要回答的这个问题,我们不妨了解一下已经在金融领域“上岗”了的AI大模型。

大模型上岗金融,都在做什么?

诚然AI大模型的发展已然呈现势不可挡的趋势,但在金融领域真正应用的时候,依旧存在一些显著的困难和挑战。

例如数据隐私和安全方面,金融数据往往高度敏感,涉及个人和企业的财务信息,确保数据隐私和安全是首要挑战之一。

并且这些数据具有多源和异构的特点,需要进行有效的整合和处理,才能确保它们的准确性和完整性。

再如模型本身,大模型往往被视为“黑箱”,因为其内部决策过程难以解释;在金融领域,尤其是涉及风险管理和监管合规时,可解释性和决策透明性是非常重要的。

还有在实时性和资源消耗方面,金融市场瞬息万变,需要实时数据处理和决策支持,大模型的推理涉及到大量的矩阵乘法计算,对硬件的矩阵乘法计算能力提出较高要求,计算复杂性可能导致响应时间延迟,不利于实时应用。

加之大模型训练和推理过程需要大量的计算资源和能量消耗,这对企业的成本和环保要求提出了挑战。

而成立于1998年的老牌金融科技公司金证,面对上述固有的重重困难,却有着自己的一套解法。

wKgZomZ-0TeAJp2cAAFDO-sRQeY985.png

在金证看来,大模型的优势在于文本及非结构化数据处理能力、人机交互能力、生成能力和逻辑推理能力较强。

而相比小模型而言,大模型也存在明显的劣势,例如大模型“幻觉”问题(即大模型答非所问),大模型的部署算力要求高造成算力资源浪费,部署成本高等问题。

因此,金证的解法就是——通过组合式AI,即大模型+小模型+工具,以此来支撑各个业务场景AI需求。

大模型方面,包含金证去年年底推出的K-GPT以及业内众多顶流的大模型,在特定的金融任务中发挥大模型的特长。

小模型则是指诸如OCR、NLP、人脸识别、文字识别、财务分析等传统模型,可以细分任务做到快准狠地处理。

至于工具,则是指地图、天气、CRM、邮件、OA等。

wKgaomZ-0TeAIrAMAAHw_41kwRs418.png

一言蔽之,在某个金融领域任务中,这种模式可以让大模型、小模型和工具做到“专业的人干专业事”,尤其能极大地提高效率。

值得一提的是,相比于通用大模型,金证的K-GPT在数据查询的准确性方面表现更佳,能够更好地理解金融术语,提供专业且数据扎实的回复。

wKgaomZ-0TeAbJMxAAN3GjksO_0717.png

据了解,K-GPT 还支持查看引用的知识源,并具备与实时数据和模块化集成的能力,可以调取实时数据和组件。

依托庞大的金融知识库,K-GPT专为金融场景服务,其核心优势在于对金融的深入理解、数据准确、可验证性以及支持调用Agent功能。

从效果上不难看出,金证已然让大模型在金融领域中合格地上岗,那么针对成本和资源上的痛点,金证又是如何解决的呢?

背后是高带宽内存(HBM)的至强处理器在发力

金证K-GPT方案中,还有一点比较特别:与英特尔合作,采用了基于CPU的大模型推理方案。

据了解,他们主要是看中的是英特尔® 至强® CPU Max 系列处理器。

这是英特尔唯一一款基于x86架构并采用高带宽内存(HBM)的CPU系列,采用了片上HBM设计,内存带宽高达4TB/s。和传统DDR5内存相比,HBM具有更多的访存通道和更长的读取位宽,理论带宽可达DDR5的4倍之多。

要知道,大模型推理涉及大量的权重数据读取,对硬件平台的内存访问带宽提出了很高的要求。

至强® CPU Max具有64GB HBM,每个内核可以分摊到超过1GB的内存,对于包括大模型推理任务在内的绝大多数计算任务,HBM都可以容纳全部的权重数据。

内存带宽还不是金证选择这款CPU的全部理由。

英特尔® 至强® CPU Max系列还内置了英特尔® 高级矩阵扩展 (英特尔®️ AMX)引擎,大幅提升了大规模矩阵乘法运算性能。

金证K-GPT基于Transformer架构,其核心特点包括多头注意力机制和前馈神经网络层,这其中都包含大量矩阵运算,而英特尔® AMX通过1024位TMUL指令和8个独立的矩阵计算单元,可以每时钟周期执行8次独立的矩阵乘累加操作,为这些运算提供强大的加速能力。

如此一来,大模型推理的效果如何呢?

在只用单颗 CPU 的情况下,推理130亿参数大模型,首个词元生成时间就能压到1秒左右,模型推理TPS超过10 tokens/s,用户提问后约2秒内就能得到响应。

别忘了遇到负载高峰等情况,还可以同时启用2颗CPU,性能还能提升将近一倍,可以说足以满足金融场景的大部分应用需求了。

除了硬件层面的突破,英特尔还提供了经过优化的软件工具来挖掘硬件潜力。

比如广泛使用的OpenVINO™ 工具套件,就被用来专门调优加速模型的Embedding处理进行。

金融场景涉及大量专业文档的输入任务,Emedding正是把文本从离散变量转变为连续向量的过程,好让AI能够理解。

经过OpenVINO™ 工具套件优化后,K-GPT大模型的批量Embedding性能提升到3倍之多。

wKgZomZ-0TeASawVAACknFlOGVI410.png

图注:OpenVINO™ 工具套件优化前后 Embedding 性能比较

再比如金证与K-GPT配合使用的开源向量数据库Faiss,英特尔也提供了优化版本,以提升在至强® CPU Max上的模型推理性能。

在大规模向量相似性检索任务中,经英特尔优化过的版本性能可提升至4倍左右。

wKgaomZ-0TeAGbgoAACgiTxIsqI523.png

图注:英特尔优化版 Faiss 与原始 Faiss 性能对比(越高越好)

除了性能方面之外,金证选择英特尔® 至强® CPU Max系列作为算力底座还带来其他方面的优势:

首先是灵活性。由于与主流的 x86 架构完全兼容,金证可以继续使用原有的机器,灵活搭配适合自身业务的配置。而且 CPU 能同时应对推理和通用计算,可根据负载情况随时调配资源。

第二是总拥有成本 (TCO)。从长远来看,CPU路线能以更低的部署和维护开销,实现与专用加速器相媲美的性能。这对于需要控制预算的金融机构来说至关重要。

综合看下来,英特尔® 至强® CPU Max系列处理器在硬件能力、软件优化、生态适配、总拥有成本优势等方面都与金融场景非常契合,不失为业界大模型落地的一种新思路。

如何评价?

随着数字化转型的不断深入,大模型为金融行业带来的机遇与挑战并存。

越来越多的金融机构开始探索如何将 AIGC 技术与实际业务相结合,在提质增效的同时控制成本。但总的来说,大模型在金融行业的应用仍处于初步探索阶段。

金证携手英特尔打造的这套大模型推理方案,可谓是应用层、模型层、算力层的深度融合,为业界树立了标杆。

不久前举办的金证科技节,就吸引了众多金融机构前来"取经"。

作为连接金融与科技的重要平台,金证科技节吸引了众多来自银行、证券、保险等领域的金融行业玩家参与,共同探讨 AI 技术在金融领域的应用前景与优质实践。

可以预见,在英特尔的算力加持下,金证将在大模型技术上不断突破,助力更多金融机构实现数字化转型,为用户带来更智能、高效的服务体验。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20332

    浏览量

    254923
  • AI
    AI
    +关注

    关注

    91

    文章

    41103

    浏览量

    302585
  • 大模型
    +关注

    关注

    2

    文章

    3771

    浏览量

    5270
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    全国 1000W–10 万 W 大功率开关电源厂家

    年 ,半人工 / 小作坊故障率高 3–5 倍、虚标严重,严禁采购。 一、全国 TOP5 源头工厂(1kW–100kW,全自动化优先) 1. 台达电子(东莞)—— 全球龙头・全自动化标杆 功率覆盖
    发表于 04-23 08:32

    沐曦股份曦云C系列GPU产品Day 0适配智GLM-5.1旗舰模型

    4月8日,智新一代旗舰模型GLM-5.1实现开源。目前,沐曦股份曦云 C 系列 GPU已完成该系列模型Day 0 全量适配,再度以全栈自主技术实力,领跑国产 GPU 生态适配赛道。
    的头像 发表于 04-09 11:25 378次阅读

    UPS不间断电源是怎样排名的?哪家好?

      高科技的发展,让UPS不再是单纯的“备用电池”,而是保障NAS、服务器、家庭数据中心稳定运行的“电力守门员”。面对市面上五花八门的品牌和型号,我们应该怎样选呢?所谓的大品牌到底不靠
    的头像 发表于 03-12 16:58 521次阅读

    华为昇腾深度适配智AI全新开源模型GLM-5

    2026年2月12日,智AI发布Agentic Engineering时代最好的开源模型GLM-5,从“写代码”到“写工程”的能力进一步演进。在Coding与Agent能力上取得开源SOTA表现
    的头像 发表于 02-25 14:41 1340次阅读
    华为昇腾深度适配智<b class='flag-5'>谱</b>AI全新开源<b class='flag-5'>模型</b>GLM-5

    万兆单模光模块:高速长距传输的之选

    网络传输卡、慢、不稳定?不管是企业跨园区传文件,还是4G/5G基站回传、智慧项目落地,传输瓶颈总能精准“添堵”。 当数据量越来越大、传输距离越来越远,传统网络设备早已跟不上需求。这时候,能同时搞定“高速率”和“长距离”的万兆单模光模块,就成了之选。今天用通俗的话,聊
    的头像 发表于 02-06 18:37 1066次阅读
    万兆单模光模块:高速长距传输的<b class='flag-5'>靠</b><b class='flag-5'>谱</b>之选

    如何选择UPS电源品牌?容量与后备时间计算全指南

    时间?本文将为您提供专业、实用的指导。一、选择UPS电源品牌的五大核心标准1.技术底蕴与研发实力一个值得信赖的UPS品牌必须拥有深厚的技术积累。考察品牌是否具
    的头像 发表于 01-14 11:15 459次阅读
    如何选择<b class='flag-5'>靠</b><b class='flag-5'>谱</b>UPS电源品牌?容量与后备时间计算全指南

    通信电源选国产吗?有哪些实力派?广州邮科有什么优势?

    搞通信工程和运维的朋友,最近是不是也在为电源选型纠结?特别是看到招标书上越来越多的国产品牌,心里难免打鼓:通信电源选国产吗?​ 今天咱就打开天窗说亮话,聊聊国产电源的现状,盘盘市场上有哪些实力派,再具体说说像广州邮科这样的老牌子,
    的头像 发表于 12-31 09:25 477次阅读
    通信电源选国产<b class='flag-5'>靠</b><b class='flag-5'>谱</b>吗?有哪些实力派?广州邮科有什么优势?

    解码助听器 B 端合作的 “密码”

    旋音科技助听器厂家:解码助听器 B 端合作的 “密码” 在助听器 B 端市场,“” 是比 “低价” 更稀缺的合作资源。对于品牌方、经销商和跨境商家而言,
    的头像 发表于 12-29 17:20 703次阅读

    哪里能找到的合金电阻供应商?这几个渠道与考量点要知晓!

    在寻找合金电阻供应商时,可从线上平台、行业展会、同行推荐等渠道入手,并从产品质量、供货能力、技术支持等方面考量。本文将为您详细介绍相关内容,并重点推荐深圳市顺海科技有限公司,其线上采购平台为华年商城。
    的头像 发表于 12-02 17:02 471次阅读
    哪里能找到<b class='flag-5'>靠</b><b class='flag-5'>谱</b>的合金电阻供应商?这几个渠道与考量点要知晓!

    SMA压接接头:压接力度怎么拿捏?——小力气,大学问,稳了才!

    压接这活儿,看着简单,其实是个细活儿、技术活。 SMA接头不靠,就看那一压的“火候”。 在高频、震动、高温高湿的环境下,就那一下“刚刚
    的头像 发表于 10-08 15:46 1236次阅读
    SMA压接接头:压接力度怎么拿捏?——小力气,大学问,稳了才<b class='flag-5'>靠</b><b class='flag-5'>谱</b>!

    医疗级健康监测吗?橙子大健康Watch D Pro全面测评

    最近,很多朋友问到橙子大健康WatchDPro这款手表,大家最关心的问题是:用它来测血压准确吗?它的无创测血糖到底不靠?是不是真的不用扎手指就能实时掌握血糖波动?今天,我们就来对这
    的头像 发表于 08-19 11:55 6860次阅读
    医疗级健康监测<b class='flag-5'>靠</b><b class='flag-5'>谱</b>吗?橙子大健康Watch D Pro全面测评

    PCB为啥现在行业越来越流行“浅钻”了?

    ,那还钻个啥,又省钱又不会为难板厂,一举两得! 那问题来了,如果真的只有10mil的stub的话,到底值不值得钻呢?那我们把上面那个模型的走线层换到更
    发表于 08-18 16:30

    华为CANN与智GLM端侧模型完成适配

    2025年8月5日,在昇腾计算产业发展峰会上,华为宣布CANN(Compute Architecture for Neural Networks)技术体系及Mind系列工具链全面开源开放。此前,智
    的头像 发表于 08-11 11:00 2760次阅读

    蚂蚁数科正式发布金融推理大模型

    7月26日,以“智能时代,同球共济”为主题的2025世界人工智能大会在上海开幕;亮点很多。我们看到在世界人工智能大会论坛上,蚂蚁数科正式发布了金融推理大模型Agentar-Fin-R1,金融推理
    的头像 发表于 07-28 16:36 757次阅读

    华为AI大模型助力金融行业智能化转型

    第十三届华为全球智慧金融峰会HiFS2025在东莞三丫坡圆满落幕。会议期间,中国邮政储蓄银行(简称“邮储银行”)运营数据中心大模型工作组组长杜金鑫发表题为“AI大模型赋能创新,迈向智能运维新纪元”的主题演讲,分享邮储银行携手华为
    的头像 发表于 06-14 11:40 1454次阅读