0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型各项性能持续优化

云知声 来源:云知声 2023-06-26 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

云知声山海大模型正式发布,交出其在AGI领域的第一份答卷,并进入有序迭代阶段。时隔一个月,山海大模型迎来了又一次比较大的升级——各项性能持续优化,且在核心能力上实现三大升级:通过迭代实现了在特定领域内的专业知识积累,诗词创作能力、数学计算能力实现突破。

技术加码,性能持续优化

01吞吐效率接近理论上限60%

UniScale通过引入全新的Attention高效计算方式和相关底层算子的优化来提高浮点运算效率,另外,也进一步优化了训练框架中的通信策略,进一步提升了多机多卡的吞吐效率。UniScale目前在多机多卡大模型训练计算效率接近理论上限的60%,而当前公开的主流框架训练效率约45%左右,因此所提方法能够吞吐量在原有基础上提升了15个点。在推理部分,通过解码策略优化、量化和高效算子适配,相对原始推理性能翻倍,并适配了不同性能的显卡推理部署。这意味着训推一体框架UniScale 具有出色的并行计算能力,能够同时处理多个任务,大大提高了模型的训练速度。也表明在相同的时间内,UniScale可以完成更加高效的计算任务,降低推理部署成本。

3be7ec68-1348-11ee-962d-dac502259ad0.png

02微调速度提升15倍

UniScale通过集成QLoRA微调(Dettmers et al., 2023)技术,不仅极大地减少了微调所需的硬件资源,还提高了微调速度。QLoRA是在LoRA微调(Hu et al., 2021)基础上结合了4位量化、双量化和统一内存分页技术,是一种高效的模型参数微调方法,不仅可以在普通消费级GPU上完成大规模语言模型的微调,还能够在较少的迭代次数内快速收敛。与此同时,我们实现了一种多指令统一微调技术,能够进一步减少模型的计算和通信开销,加快微调的速度。我们经过实验验证,UniScale在使用QLoRA微调和统一微调技术之后,微调速度提升了约15倍。

这一改进对于微调任务非常重要,特别是当资源有限的情况下在大规模数据集上进行微调的场景。传统的微调方法需要耗费较长的时间来逐步调整模型参数,而QLoRA微调能够通过多种量化方法显著减少显存占用,大大减少了微调所需的内存,同时性能几乎与标准微调相当。与此同时,微调后的模型可以直接用于模型部署,符合UniScale训练与推理一体化的设计理念,这项改进使得UniScale成为一个非常有效的深度学习平台,提供了更快速、高效的微调实验方案。

3bfa5ff6-1348-11ee-962d-dac502259ad0.png    

能力突破,效果加速提升

01医疗能力超越Med-PaLM 2

山海大模型实现了在特定领域内专业知识的快速积累,通过语料的不断迭代升级,专业能力持续突破。以医疗领域为例,山海大模型学习了大量教材、百科等高质量医学文献,使其能够提供更加全面、专业的医疗信息支持。在扩展了医疗大模型的领域知识的同时,山海大模型仍旧保持原有的高性能、高准确率等特点。医疗大模型的改进为医生们提供更强大的支持和指导,以提高医疗效果。目前该模型在MedQA任务上提升到了87.1%,超越Med-PaLM 2,临床执业医师资格考试提升到了523(总分600分),超过了99%的考生水平。

3c25c1be-1348-11ee-962d-dac502259ad0.png

02诗词创作能力升级

在诗词创作方面上,山海大模型不仅在预训练阶段增加了7万多首古诗词数据,补充诗词相关的知识,在指令学习阶段,也精心设计近40种不同的指令,基本覆盖日常对诗词数据相关知识考察的内容,充分发掘大模型的潜力,进一步提升创作能力。通过指令学习的方法,山海大模型学会了运用类似的修辞手法和表达方式,使其创作效果更富诗意、更具情感温度。不仅如此,山海大模型还能够根据主题和情感要求进行定制化创作——这一突破不仅得益于诗词相关的指令学习数据的引入,也归功于山海大模型自身强大的计算和学习能力。

03数学能力提升

山海大模型的数学计算能力主要依赖预训练阶段扎实、系统的数学理论体系和指令学习阶段基于插件的具体题型的求解能力。为了进一步提升山海大模型的数学能力,我们主要针对以下两方面进行优化:

a) 我们在预训练阶段提供人工和模型精心挑选的高质量预训练数据,其中包括从小学到大学所有数学学科的教材、练习册等,通过这些数据的学习,模型就具备了系统的数学理论体系和解决各种数学问题的基础。

b) 基于 react 思想的指令学习是大模型数学能力的必要步骤。在此阶段,对每一种题型,我们给出具体的解题思路,包括 reasoning and acting,教会大模型解决各种问题的能力。解题过程中,为了解决大模型无法做精确数值计算的问题,将数值运算移交给插件完成,插件完成数值计算或者方程求解之后,将答案返回大模型,大模型继续问题求解,直到给出最终答案。

从5月24日正式发布以来,山海大模型始终在不断训练、调优,致力通过自身不断的迭代进化兑现AI应用价值;保持高速演进的同时,也在探索与具体场景深度融合的更多可能。

目前,云知声山海大模型已深入到智慧医疗、智慧教育、知识管理、智慧营销、智能客服等具体场景中,基于山海大模型打造的场景应用正不断丰富、不断拓展。

7月6日-7月8日,云知声将携山海大模型及其医疗、银行、车载、客服等最新场景应用亮相2023世界人工智能大会,欢迎大家届时莅临云知声展位参观交流。

从能力升级到场景应用,基于多年技术积累,云知声正加速推进山海大模型的迭代演变。未来山海会有怎样的惊喜和亮点,值得你的期待。
责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 显卡
    +关注

    关注

    16

    文章

    2517

    浏览量

    71058
  • 模型
    +关注

    关注

    1

    文章

    3648

    浏览量

    51710
  • 云知声
    +关注

    关注

    0

    文章

    280

    浏览量

    9073

原文标题:山海大模型迎来新一轮迭代,医疗能力超越Med-PaLM 2

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    获批建设河南信阳人工智能大模型工程技术研究中心

    近日,河南省信阳市公示了《2025年度信阳市级科技研发平台拟新建名单》,由(信阳)数字科技有限公司申报的“信阳市人工智能大模型服务平台及应用工程技术研究中心”成功获批。该平台的筹
    的头像 发表于 11-03 17:16 1092次阅读

    联合行业伙伴推出多款智能硬件解决方案

    近日,智慧生活产品线迎来一系列新产品和解决方案升级,大模型全面进入产品线,让AGI从“技术概念”切实走进“日常好用”的智慧化生活。
    的头像 发表于 10-29 13:47 705次阅读

    与库帕思签署战略合作协议,共筑“模型+语料”新生态

    9月26日,智能科技股份有限公司(以下简称“”,股票代码09678.HK)与上海库帕
    的头像 发表于 09-26 21:32 2241次阅读

    多项业务营收大涨

    依托山海模型不断开拓阵地,开发了面向东盟等海外市场和国内方言市场的语音大模型
    的头像 发表于 09-10 15:44 464次阅读

    在港交所成功上市

    近日,智能科技股份有限公司(以下简称“”)于香港联合交易所主板挂牌上市,股份代号:0
    的头像 发表于 07-03 17:41 895次阅读

    AGI龙头企业港股上市,市值达147亿港元

      (电子发烧友网综合报道)6月30日,北京国内AGI龙头企业正式在港交所上市,股份代号:09678.HK。声发行价为205港元/
    的头像 发表于 06-30 11:44 2593次阅读
    AGI龙头企业<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>港股上市,市值达147亿港元

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海商汤智能科技有限公司(以下简称“商汤
    的头像 发表于 06-20 14:52 793次阅读

    荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。凭借山海模型的领先技术实力与多领域
    的头像 发表于 05-26 14:13 621次阅读

    再度登顶MedBench榜单

    近日,中文医疗大模型权威评测平台MedBench公布最新自测榜单结果,基于山海模型打造的
    的头像 发表于 05-20 10:12 636次阅读

    深度参与三项大模型国家标准编写

    在人工智能技术加速落地的当下,标准化建设已成为推动行业高质量发展的关键因素。近日,参与编写的3项人工智能大模型国家标准:20231736-T-469《人工智能 大
    的头像 发表于 03-18 18:19 767次阅读

    荣获南京市鼓楼高新区突出贡献企业奖

    新春伊始,万象更新,迎来了振奋人心的“开门红”!2月10日,在南京市鼓楼高新区“2025年推进产业高质量发展优化营商环境大会”上,江苏
    的头像 发表于 02-14 09:21 724次阅读

    山海模型多项评测名列前茅

    近日,智源研究院发布并解读了国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
    的头像 发表于 12-24 10:29 761次阅读

    近期斩获多项年度大奖

    在科技迅猛发展的当下,人工智能(AI)已成为推动各行业革新的核心动力。,以其卓越的技术实力和敏锐的市场洞察,在AI领域中脱颖而出,成为行业的领航者。近日,
    的头像 发表于 12-24 10:26 802次阅读

    陈吉胜:大模型应用分析与案例介绍

    近日,上海师范大学信息与机电工程学院第四届人工智能竞赛挑战周系列活动正式开幕。作为国内AI领域的头部独角兽企业,受到特别邀请。
    的头像 发表于 12-13 14:20 1055次阅读

    斩获2024高工智能汽车金球奖

    12月10日-12日,2024(第八届)高工智能汽车年会暨年度金球奖评选颁奖典礼在上海举行。端侧大模型解决方案凭借卓越的技术创新与出色的性能
    的头像 发表于 12-12 18:30 979次阅读