0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

度小满轩辕:金融行业的大模型实战派

脑极体 来源:脑极体 作者:脑极体 2024-03-12 09:12 次阅读

金融行业被广泛认为是AI大模型技术落地的前哨站,也是“人工智能+”行动的焦点所在。面向金融场景广泛、多样化的大模型需求,度小满轩辕系列全新发布了12款金融大模型。其中包括6B、13B、70B参数的基座模型、对话模型、int4/int8量化模型,并且实现了完全开源,供广大开发者下载使用。

总体来看,12款金融大模型包括3种参数。2023年5月,度小满开源了国内首个千亿级中文金融大模型“XuanYuan-176B”。2023年9月,“XuanYuan-70B”大模型在C-Eval和CMMLU两大权威榜单上位列所有开源模型榜首。本次度小满“轩辕”模型矩阵再次升级,十亿-百亿-千亿参数全覆盖,实现多场景任务适配。

而从效果上看,度小满轩辕达成了18大维度金融实战能力遥遥领先,多场景6B模型与72B模型表现相当;通用能力同样达到开源模型TOP水平看齐GPT-4,并且采用了独创的数据处理流水线,生产更丰富、更安全、更符合中文场景的数据。通过首次将人类偏好对齐引入金融垂域大模型训练,相关模型实现了安全性显著提升、有用性突破瓶颈、金融任务表现明显增强 。

让我们来走进度小满轩辕,透视金融领域的大模型变革。

度小满「轩辕」大模型:全参数矩阵

wKgZomXvBWmAIjL5AAC0QbbZoC4267.jpg

(度小满轩辕大模型发布时间轴)

度小满轩辕系列已经有17款开源大模型,适配广泛场景任务,满足不同开发者需要。

wKgaomXvBWqAODvoAADv-8gMgUg452.jpg

(度小满轩辕大模型矩阵)

模型矩阵的设计考虑了不同的应用场景和性能要求:70B及以上的模型专门针对需要深度分析、复杂指令执行以及全方位Agent调用的场景,而6B、13B的模型则更加适用于对响应速度有高要求、面向小规模场景和单任务的应用,它们也同样能够处理计算、编程、创作等一系列通用需求。特别地,最小化的XuanYuan-6B-4-bit量化Chat模型以其低推理部署成本,进一步降低了大模型的应用门槛。

模型效果:18大维度金融实战能力遥遥领先

01金融能力

将轩辕系列大模型在金融自动评测集FinanceIQ测试集上进行测试,FinanceIQ涵盖了注册会计师(CPA)、税务师、经济师、银行从业资格、基金从业资格、证券从业资格、期货从业资格、保险从业资格(CICE)、理财规划师等十大权威金融领域考试。结果如下表,XuanYuan-70B-V2在该项评测任务上拥有超过GPT-4的水平,在知识层面展示出金融领域专家的水平。

同时,为了考察轩辕大模型在金融实际任务上的能力,轩辕团队还特别组织了金融专家为对话大模型进行人工评测。任务的设计均是从金融行业实际应用场景出发,去判断轩辕是否在各项金融任务上具备“实战能力”。

wKgZomXvBWuAJ-jYAADz_UHwVVU390.jpg

(人工金融评测集任务构成)

最终结果显示,轩辕大模型各个参数上均具有“以小搏大”的实力,达到自己2倍甚至5倍参数量的模型水平。在各项金融评测任务上,XuanYuan-6B表现超越市面最新13B中文开源模型(左图),XuanYuan-13B表现超越市面最新72B中文开源模型(中图),XuanYuan-72B-V2表现可以媲美GPT4(右图),并且在金融法规、金融产品信息等中文场景上超越。

wKgaomXvBWuATqMFAAFiRP5fBts125.jpg

(轩辕拥有远超同参数水平的金融能力)

02通用能力

将轩辕大模型在MMLU、CEVAL、CMMLU、GSM8K、HumanEval等中外主流评测集上进行评测,观察大模型在知识、逻辑、代码等通用能力上的表现。同时加入类似参数矩阵的LLaMA2系列进行比较,结果显示轩辕不同参数大模型在各项榜单成绩上均有优异表现,在CMMLU、C-Eval等多个中文评测榜单上,更是有超越GPT-4的水准

进一步分析发现,经过专门优化以增强考试能力的XuanYuan-6B和XuanYuan-13B模型,在C-Eval和CMMLU这两个中文考试评测指标上有了显著提升。然而,需要注意的是,“高分”并不意味着“高能力”。评测集成绩可通过优化模型考试能力来提升,不直接等同于模型在实际应用中的优势。因此,尽管小参数模型在某些评测中表现出色,这并不意味着它们的各方面真实能力均超越了同系列大参数模型。

wKgZomXvBW6AQMu9AADp6ysui6k450.jpg

(轩辕大模型在各个评测集上的分数)

「轩辕」技术解析:对齐技术突破能力瓶颈,面向公众开放自动化训练框架

度小满轩辕大模型团队在过去一年,对大模型训练的各个环节积累了丰富的经验。这包括建立了一套完整的数据处理流水线、采用更适配领域模型的高效训练方法等,以及本次突破性的利用人类偏好对齐技术,极大地提升了6B、13B、70B模型的对话能力,显著增强了模型的场景适应性。

轩辕系列大模型使用DeepSpeed分布式训练框架,引入动态评估与调整机制以优化训练过程。在微调阶段,轩辕特别的采用了Self-QA策略来收集指令微调数据。该方法能够在没有人工标注的情况下生成大量高质量的问答数据,为模型提供有监督的训练样本,有效提升模型的学习效率和质量。

wKgaomXvBW6ADi9lAABpQJ7EIVY781.jpg

(轩辕大模型Self-QA数据构造方法)

针对金融领域的特定需求,轩辕大模型还开发了一种混合微调训练框架,旨在通过融合通用与特定领域数据来增强模型性能及适应性。这种混合微调方法不仅显著提高了模型在特定任务的表现,也增强了其整体的泛化能力和适应性,为金融领域任务的性能提升开辟了新途径。

度小满创新地在金融领域大模型中引入了人类偏好对齐技术,开创了领域内强化对齐训练的先河。通常,领域大模型仅在微调阶段引入特定领域数据,但这种方法在实际应用中常常显示出局限性。金融行业的复杂性要求模型能够更深入地理解并适应行业特定的需求,而强化对齐训练有助于突破仅依靠微调所能达到的性能瓶颈。

轩辕团队精心构建了涵盖通用性、安全性和金融特性的Prompt数据集,并组织了专业的标注团队对成对的回答进行偏好标注。接下来,团队通过一系列实践、分析和改进,成功完成了奖励模型(Reward Model)和后续的强化(采用近端策略优化算法)训练。下图以XuanYuan-6B为例展示了模型在通用性和金融能力的综合评估结果。从图中可以看出,在两个领域,经过人类偏好对齐后,模型的能力都有了极大的提升,证明了强化对齐训练的有效性。

wKgZomXvBW6AAQTOAAA-vMIkB-Q331.jpg

(RLHF-model vs SFT-model)

wKgaomXvBW-AOn0hAACKEVPWOMg177.jpg

(通用能力:RLHF-model vs SFT-model)

wKgZomXvBW-AXXK9AAB9jXqdbfc509.jpg

(金融能力:RLHF-model vs SFT-model)

度小满轩辕大模型团队一向贯彻开源开放的原则。为了让广大开发者能够更容易的上手使用大模型,使用真实数据和真实代码作为示例,详细介绍了训练模型的每个关键步骤。现在相关代码已经上传开源社区,供广大用户实操体验。

金融行业需要怎样的大模型?

金融领域对大模型的要求远超过基本的“判断”与“生成”能力,更加强调在“分析”与“决策”过程中的高级能力,这些能力是触及金融企业核心利益的关键。大模型的价值体现在其能否在核心业务场景中发挥实际作用,如通过综合分析用户信息以支持风险评估、客户画像绘制、精准营销策略,或通过企业数据分析支持财务审查、智能投顾和行业研究。

金融大模型的最终目标是提高企业ROI。这意味着,高效的金融大模型应当能够在实际应用中,如客服场景,通过提升对话处理、指令遵循和意图理解能力,不仅短期内提高客服效率,长期还可能实现机器人客服的全面替代,重塑客户服务流程,推动金融服务向更高智能化水平迈进。

结束语:关于度小满「轩辕」大模型

度小满轩辕大模型系列具有以下特色:

· 多尺寸开源,开发者友好。

· 拥抱开源,免费下载使用。

· 版本快速迭代,社区持续更新。

· 持续面向金融行业伙伴交流共建。

在今年的政府工作报告中,提出了“大力发展科技金融、绿色金融、普惠金融、养老金融、数字金融”。在这样的宏观背景下,AI大模型落地金融场景,为行业带来全新的智能化发展机遇,是金融行业本身的发展意愿,也是“新质生产力”的客观要求。

作为“实战派”的度小满轩辕,已经应用在金融领域的各个业务场景,并且初见成效。未来,度小满轩辕会成为金融行业的一个支点,为更多智能化探索打开大门。

欲知“轩辕”大模型详情,可移步Github官网。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26459

    浏览量

    264088
  • 人工智能
    +关注

    关注

    1776

    文章

    43873

    浏览量

    230629
  • 大模型
    +关注

    关注

    2

    文章

    1532

    浏览量

    1130
  • AI大模型
    +关注

    关注

    0

    文章

    197

    浏览量

    92
收藏 人收藏

    评论

    相关推荐

    商汤科技联合海通证券发布业内首个面向金融行业的多模态全栈式大模型

    4月23日,商汤科技正式推出“日日新SenseNova 5.0”大模型体系,并与海通证券联合发布业内首个面向金融行业的多模态全栈式大模型
    的头像 发表于 04-26 09:48 99次阅读
    商汤科技联合海通证券发布业内首个面向<b class='flag-5'>金融</b><b class='flag-5'>行业</b>的多模态全栈式大<b class='flag-5'>模型</b>

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型

    AI快讯:华为助力金融行业加速拥抱AI 马斯克xAI 展示首个多模态模型 小编给大家汇总一下近期的AI资讯。 华为助力金融行业加速拥抱AI
    发表于 04-15 12:32 99次阅读

    华为发布金融AICC智能云联络中心解决方案2.0,赋能全球金融行业

    陈君和数字金融军团解决方案资深经理吕晨分享了金融行业数字化未来趋势的见解:过去一年中基于大模型的AI飞速发展,各金融机构积极拥抱AI,在客服
    的头像 发表于 03-06 14:33 208次阅读
    华为发布<b class='flag-5'>金融</b>AICC智能云联络中心解决方案2.0,赋能全球<b class='flag-5'>金融</b><b class='flag-5'>行业</b>

    华为云盘古大模型通过金融模型标准符合性验证

    近日,在中国信通院组织的可信AI大模型标准符合性验证中,华为云的盘古大模型表现出色,成功通过了金融模型标准的符合性验证,并荣获优秀级(4+级)评分。此评级不仅是本次
    的头像 发表于 03-05 10:12 209次阅读

    华为云盘古大模型通过金融模型标杆验证,获最高评级

    该验证标准主要关注金融模型对语言,语音,视觉以及多模态任务等多元领域的适应能力,涵盖数据合规性,模型安全性和服务稳定性等关键要素。
    的头像 发表于 03-04 15:58 224次阅读

    数字金融大变革:国产金融工控机推动行业进入全新时代

    随着信息技术的飞速发展,金融科技成为推动金融行业创新和转型的重要动力。新兴技术如云计算、大数据和人工智能的涌现,已经彻底改变了传统金融服务的模式,为
    的头像 发表于 01-04 15:18 227次阅读

    金融行业迎来大模型时代,存算基建成决胜关键

    去年年底,ChatGPT诞生,凭借强大、精准的自然语言理解和生成能力,令全球用户为之一震。 自此,各行各业纷纷投身大模型研发竞赛,掀起新一轮技术创新热潮。金融行业更是如此。如何构筑面向大模型
    的头像 发表于 09-25 15:40 236次阅读
    <b class='flag-5'>金融</b><b class='flag-5'>行业</b>迎来大<b class='flag-5'>模型</b>时代,存算基建成决胜关键

    声智科技联合中国信通院正式发布国内首个金融行业模型标准

    金融模型最新消息! 9月,2023可信AI大会暨南京人工智能产业发展大会成功召开,声智科技联合中国信通院正式发布国内首个金融行业模型标准
    的头像 发表于 09-22 09:58 467次阅读

    金融业需要的大模型,是一个系统化工程

    面向未来,金融机构应用大模型的能力,将成为关键竞争力
    的头像 发表于 09-21 09:14 788次阅读
    <b class='flag-5'>金融</b>业需要的大<b class='flag-5'>模型</b>,是一个系统化工程

    金融和大模型的“两层皮”问题

    金融机构也会成为更早挖掘到金矿的第一批大模型淘金者
    的头像 发表于 09-20 09:05 870次阅读

    拓尔思发布拓天大模型,聚焦金融、政务等行业落地

    电子发烧友网报道(文/李弯弯)日前,拓尔思正式发布“拓天大模型”,并率先面向媒体、金融、政务领域推出了行业模型。据悉,今年下半年,拓尔思还将陆续推出网络舆情、公安、知识产权、法律、审
    的头像 发表于 07-05 00:10 1086次阅读
    拓尔思发布拓天大<b class='flag-5'>模型</b>,聚焦<b class='flag-5'>金融</b>、政务等<b class='flag-5'>行业</b>落地

    轩辕智驾荣获年度自驾供应商TOP10殊荣

        近日,由高工智能主办的“高工智能汽车开发者大会”及“年度智能驾驶行业供应商及产品方案评选颁奖典礼”在上海圆满落幕。备受关注的轩辕智驾在评选中脱颖而出,荣获年度自驾供应商TOP10殊荣,这一
    的头像 发表于 06-14 14:05 374次阅读

    浪潮信息:2023年华南区金融行业客户交流会举办,共话金融数智转型

    代表进行了精彩分享与互动交流,共同探讨如何拥抱AI大模型、隐私计算、大数据、信息安全等新兴热点技术,加速金融业数智升级,构建面向未来智慧金融时代的核心竞争力。 2023年华南区金融
    的头像 发表于 06-13 18:15 450次阅读
    浪潮信息:2023年华南区<b class='flag-5'>金融</b><b class='flag-5'>行业</b>客户交流会举办,共话<b class='flag-5'>金融</b>数智转型

    做实大模型的产业价值,度小满深耕“NLP+金融

    从度小满NLP开始,去看看AI走向产业的应用落地如何实现
    的头像 发表于 05-18 20:43 440次阅读
    做实大<b class='flag-5'>模型</b>的产业价值,度<b class='flag-5'>小满</b>深耕“NLP+<b class='flag-5'>金融</b>”