0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

金融行业迎来大模型时代,存算基建成决胜关键

浪潮存储 来源:未知 2023-09-25 15:40 次阅读

去年年底,ChatGPT诞生,凭借强大、精准的自然语言理解和生成能力,令全球用户为之一震。

自此,各行各业纷纷投身大模型研发竞赛,掀起新一轮技术创新热潮。金融行业更是如此。如何构筑面向大模型时代的新型算力和存力基础设施,实现大模型能力向金融领域的迁移,成为金融机构热议的话题

金融大模型 在哪些场景有用武之地?

作为AI新基建,大模型在金融行业有着广泛的应用场景。

前台智能客服,是AI在金融领域最常见的应用方向之一。还记得钢铁侠电影里的AI管家贾维斯(Jarvis)么?金融大模型将大幅提升客户经理的专业水平和服务能力,大幅降低客户经理的运营成本,让每个人都拥有类似Jarvis的24小时在线的专业客户经理。

中台,AI大模型有机会改变金融机构内知识获取、内容创作、会议与沟通、代码开发与测试的方式,提升内部办公效率,甚至引发研发测试模式变革,全方位提升金融机构内部运营效率。

后台,大模型将成为智能科技底座的标配,大幅降低智能技术应用的门槛,只需少量标注数据就可以让智能技术覆盖广泛的场景。

总之,AI大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备非常出色的能力,在金融行业有广泛的应用前景。

万卡规模、万亿参数,大模型有“高门槛”

大模型的快速迭代,需要高效算力和存储基础设施的加持。

一方面,算力是大模型的引擎。语言类、视觉类模型容量和相应的算力需求都在快速扩大,金融大模型发展的背后是庞大的算力支撑。如果用“算力当量”(PetaFlops/s-day,PD),即每秒千万亿次的计算机完整运行一天消耗的算力总量,来对人工智能任务所需算力总量进行度量,大模型训练需要几百甚至几千PD的算力支持,也意味着需要巨大的算力成本。

wKgZomUmxCqAEx0tAANBrnu-lPc208.png

算力是大模型发展核心要素

例如,OpenAI 在2020 年推出的 GPT-3,对算力的需求至少要上万颗A100 GPU,一次模型训练总算力消耗约3,640PD的算力。又如,浪潮信息推出的“源”中文语言大模型有近2500亿个模型参数,算力消耗达4000PD。再如,当前GPT-4和PaLM-2的算力当量已经达到GPT-3的数十倍。这还不算,谷歌正在开发的下一代多模态大模型Gemini,其训练量碾压GPT-4,达到后者5倍。

快速攀升的AI算力消耗,有限的IT预算,让大多数金融机构陷入两难境地:想做大模型,但资源匮乏、成本压力大、人才稀缺;不做大模型,又只能坐看机会错失。

对此,分而治之或许是一种可行的办法。所谓分,就是把大模型分为通用大模型和行业大模型。金融机构不用自己打造通用大模型,而是基于第三方的通用大模型,在此基础上专注打造行业大模型。根据信通院发布的《行业大模型标准体系及能力架构研究报告》,通用大模型缺乏专业知识和行业数据,而且构建和训练成本很高,难以实现商用。为更好解决特定行业为题,行业大模型应运而生。行业大模型可以满足特定场景需求,更好地为行业提供优质的服务,促进行业智能化转型升级。

浪潮信息AI服务器产品专家郭磊表示,“金融机构可以集中资源在行业大模型上,不是‘在一千米的地上挖一米深的沟’,而是‘在一米的地方挖一千米深’”。

wKgZomUmxCqAb9PLAAJkIL2WnPU219.png

大模型训练四个阶段

具体来看,大模型训练的第一阶段是无监督预训练阶段,训练周期往往持续数十天到数月,需要数千张GPU卡同时计算,算力消耗巨大,训练时间非常长,训练出来的模型是基础语言模型。金融机构可以通过使用开源平台或者第三方合作(如浪潮信息的“源”大模型),获得基础语言能力。第二到第四阶段是有监督精调阶段、奖励模型训练和强化学习,这3个阶段需要数十张乃至上百张GPU卡同时计算,算力消耗的规模和训练时长相比第一阶段都有明显下降,所以金融机构可以在这三个阶段进行训练,打造有金融行业优势的大模型。

另一方面,大模型光有算力远远不够,还取决于数据规模和数据质量。

大模型的优势在于海量信息的搜集、提取和分析能力,这是人类难以企及的。

wKgZomUmxCqASibZAADjpER_fIc692.jpg

大模型参数规模的进化

近几年,通用大模型的参数量快速增长。2016年OpenAI发布Gym强化学习平台,2018年GPT-1问世,模型参数为1.17亿,经过不断迭代,GPT-4参数规模达到1.76万亿。Google从2017年发布Transformer(6500万参数)架构以来,陆续发布BERT(2018年,3亿参数)、T5(2019年,110亿参数),参数规模逐步提高。近期,Google发布通才模型PaLM-E,这是全球最大的视觉语言模型,包含5620亿参数。

在垂直行业,金融大模型的数据集在通用大模型基础上还需包含诸如金融研报、股票、基金、银行、保险等方向的专业知识,通过在训练过程中加入大量金融对话数据并针对金融领域进行特定的预训练调优,提升其在金融垂直领域的表现。

同时,多模态、跨模态成为常态,金融大模型的数据类型变得更加丰富。其中无监督数据,即原始数据,数据格式可以是网页、文本或语音数据;有监督数据,即经过标注的数据,格式可以为json或Query。此外,为了给投资者提供实时市场舆情和风险预测等服务,金融机构还要高效处理金融行业新闻、股票交易,乃至社交评论等金融数据。这些巨量、多模态、实时的金融数据新需求、新特征,传统集中式存储难以应对,需要弹性、灵活的新型分布式存储架构来支撑。

由此可见,随着金融大模型的演进,整个数据中心的架构都会发生改变,从AI服务器、到存储、再到网络的全栈方案都需要适应大模型时代的需求。

基础设施 如何“存得下、算得快、传得稳”

只有数据“存得下”、算力“算得快”、网络“传得稳”,数字基础设施才能充分发挥数据要素价值,推动大模型应用落地,带动新业态繁荣发展。

对此,浪潮信息基于智慧计算战略,从算力、算法、数据、互联四方面推进产品创新,为大模型打造强大底座。

算力方面,浪潮信息通过千亿参数规模的大模型创新实践,已在算力集群构建、算力调度部署、算法模型开发等方面,构建起全栈领先的大模型算力系统解决方案,助力大模型训练开发。其中最新一代融合架构的 AI 训练服务器 NF5688G7 采用 Hopper 架构的 GPU, 较上代平台大模型实测性能提升近 7 倍,同时支持最新的液冷解决方案,可实现更低的集群能耗比与运行成本,PUE 小于 1.15, 以一个 4000 卡的智算中心为例,每年可节电 620 万度、降碳 1700 吨。

存储方面,浪潮信息生成式AI存储解决方案用一套AS13000融合存储支撑生成式AI的全阶段应用,提供全闪、混闪、带库、光盘四种介质,支持文件、对象、大数据、视频、块多种协议。结合AIGC数据处理的五个阶段:数据采集、准备、训练、推理和归档,浪潮信息由同一套存储提供端到端的数据流支持,满足文本、音频、图像、视频、代码等多模态数据的存储和处理需求。

浪潮信息存储产品

在集群高速互联层面,浪潮信息基于原生 RDMA 实现整个集群的全线速组网,并对网络拓扑进行优化,可以有效消除混合计算的计算瓶颈,确保集群在大模型训练时始终处于最佳状态。

当前,国有大行、股份制银行以及部分城商行,均已经开展或计划开展金融大模型研发,AI算力和数据基建将迎来高速发展。根据IDC预测,未来5年中国智能算力规模的年复合增长率将达52%,分布式存储增速将达到中国市场增速的2倍。大模型时代,金融机构需要以AI的场景、架构为抓手,结合各行的数据特点,打造新一代智算基础设施。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 存储
    +关注

    关注

    12

    文章

    3863

    浏览量

    84677
  • 浪潮
    +关注

    关注

    1

    文章

    404

    浏览量

    23576

原文标题:金融行业迎来大模型时代,存算基建成决胜关键

文章出处:【微信号:inspurstorage,微信公众号:浪潮存储】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤科技联合海通证券发布业内首个面向金融行业的多模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的多模态全栈式大模型
    的头像 发表于 04-26 09:48 104次阅读
    商汤科技联合海通证券发布业内首个面向<b class='flag-5'>金融</b><b class='flag-5'>行业</b>的多模态全栈式大<b class='flag-5'>模型</b>

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型 小编给大家汇总一下近期的AI资讯。 华为助力金融行业加速拥抱AI
    发表于 04-15 12:32 99次阅读

    半导体发展的四个时代

    代工厂来开发和交付。台积电是这一阶段的关键先驱。 半导体的第四个时代——开放式创新平台 仔细观察,我们即将回到原点。随着半导体行业的不断成熟,工艺复杂性和设计复杂性开始呈爆炸式增长。工艺技术、EDA
    发表于 03-27 16:17

    度小满轩辕:金融行业的大模型实战派

    以小博大,智见金融
    的头像 发表于 03-12 09:12 1529次阅读
    度小满轩辕:<b class='flag-5'>金融</b><b class='flag-5'>行业</b>的大<b class='flag-5'>模型</b>实战派

    华为云盘古大模型通过金融模型标准符合性验证

    近日,在中国信通院组织的可信AI大模型标准符合性验证中,华为云的盘古大模型表现出色,成功通过了金融模型标准的符合性验证,并荣获优秀级(4+级)评分。此评级不仅是本次
    的头像 发表于 03-05 10:12 210次阅读

    华为云盘古大模型通过金融模型标杆验证,获最高评级

    该验证标准主要关注金融模型对语言,语音,视觉以及多模态任务等多元领域的适应能力,涵盖数据合规性,模型安全性和服务稳定性等关键要素。
    的头像 发表于 03-04 15:58 225次阅读

    数字金融大变革:国产金融工控机推动行业进入全新时代

    金融行业迈向智能化转型的关键硬件支持,具备强大的处理能力、大容量内存和高速存储等配置。这些特点使得金融行业的数据处理和存储需求得以满足,而先
    的头像 发表于 01-04 15:18 227次阅读

    声智科技联合中国信通院正式发布国内首个金融行业模型标准

    金融模型最新消息! 9月,2023可信AI大会暨南京人工智能产业发展大会成功召开,声智科技联合中国信通院正式发布国内首个金融行业模型标准
    的头像 发表于 09-22 09:58 467次阅读

    金融业需要的大模型,是一个系统化工程

    面向未来,金融机构应用大模型的能力,将成为关键竞争力
    的头像 发表于 09-21 09:14 789次阅读
    <b class='flag-5'>金融</b>业需要的大<b class='flag-5'>模型</b>,是一个系统化工程

    金融和大模型的“两层皮”问题

    金融机构也会成为更早挖掘到金矿的第一批大模型淘金者
    的头像 发表于 09-20 09:05 870次阅读

    模型时代的OCR,“CPU” 的味道更重了

    文件、身份证、路标等识别,可以说统统都离不开它。 而随着近几年大模型的不断发展,OCR也迎来了它的 “新生机” —— 凭借自身可以将文本从图片、扫描文档或其他图像形式提取出来的看家本领,成为大语言模型的一个 重要入口 。 在这个
    的头像 发表于 07-08 14:25 307次阅读
    大<b class='flag-5'>模型</b><b class='flag-5'>时代</b>的OCR,“CPU” 的味道更重了

    拓尔思发布拓天大模型,聚焦金融、政务等行业落地

    电子发烧友网报道(文/李弯弯)日前,拓尔思正式发布“拓天大模型”,并率先面向媒体、金融、政务领域推出了行业模型。据悉,今年下半年,拓尔思还将陆续推出网络舆情、公安、知识产权、法律、审
    的头像 发表于 07-05 00:10 1086次阅读
    拓尔思发布拓天大<b class='flag-5'>模型</b>,聚焦<b class='flag-5'>金融</b>、政务等<b class='flag-5'>行业</b>落地

    浪潮信息:2023年华南区金融行业客户交流会举办,共话金融数智转型

    代表进行了精彩分享与互动交流,共同探讨如何拥抱AI大模型、隐私计算、大数据、信息安全等新兴热点技术,加速金融业数智升级,构建面向未来智慧金融时代的核心竞争力。 2023年华南区
    的头像 发表于 06-13 18:15 453次阅读
    浪潮信息:2023年华南区<b class='flag-5'>金融</b><b class='flag-5'>行业</b>客户交流会举办,共话<b class='flag-5'>金融</b>数智转型

    华为云 GaussDB 助力金融关键信息基础设施行业数字化转型,获奖多多

    随着数字化时代的到来,金融关键信息基础设施行业也面临着更高的数据需求和安全要求。为满足这些需求,华为云 GaussDB 作为国内唯一自主研发的软硬协同、全栈自主的数据库,成为了众多
    的头像 发表于 06-08 15:43 272次阅读
    华为云 GaussDB 助力<b class='flag-5'>金融</b>及<b class='flag-5'>关键</b>信息基础设施<b class='flag-5'>行业</b>数字化转型,获奖多多

    半导体企业如何决胜2023秋招?

    ! 助力各位真正提升招聘效率! 本次大同学吧联合 上海思将企业管理咨询有限公司 (半导体HR公会) 上海肯耐珂萨人力资源科技股份有限公司 为大家带来 《2023集成电路行业秋招战略布局决胜点》 线上直播
    发表于 06-01 14:52