0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声山海大模型各项性能持续优化

云知声 来源:云知声 2023-06-26 11:07 次阅读

云知声山海大模型正式发布,交出其在AGI领域的第一份答卷,并进入有序迭代阶段。时隔一个月,山海大模型迎来了又一次比较大的升级——各项性能持续优化,且在核心能力上实现三大升级:通过迭代实现了在特定领域内的专业知识积累,诗词创作能力、数学计算能力实现突破。

技术加码,性能持续优化

01吞吐效率接近理论上限60%

UniScale通过引入全新的Attention高效计算方式和相关底层算子的优化来提高浮点运算效率,另外,也进一步优化了训练框架中的通信策略,进一步提升了多机多卡的吞吐效率。UniScale目前在多机多卡大模型训练计算效率接近理论上限的60%,而当前公开的主流框架训练效率约45%左右,因此所提方法能够吞吐量在原有基础上提升了15个点。在推理部分,通过解码策略优化、量化和高效算子适配,相对原始推理性能翻倍,并适配了不同性能的显卡推理部署。这意味着训推一体框架UniScale 具有出色的并行计算能力,能够同时处理多个任务,大大提高了模型的训练速度。也表明在相同的时间内,UniScale可以完成更加高效的计算任务,降低推理部署成本。

3be7ec68-1348-11ee-962d-dac502259ad0.png

02微调速度提升15倍

UniScale通过集成QLoRA微调(Dettmers et al., 2023)技术,不仅极大地减少了微调所需的硬件资源,还提高了微调速度。QLoRA是在LoRA微调(Hu et al., 2021)基础上结合了4位量化、双量化和统一内存分页技术,是一种高效的模型参数微调方法,不仅可以在普通消费级GPU上完成大规模语言模型的微调,还能够在较少的迭代次数内快速收敛。与此同时,我们实现了一种多指令统一微调技术,能够进一步减少模型的计算和通信开销,加快微调的速度。我们经过实验验证,UniScale在使用QLoRA微调和统一微调技术之后,微调速度提升了约15倍。

这一改进对于微调任务非常重要,特别是当资源有限的情况下在大规模数据集上进行微调的场景。传统的微调方法需要耗费较长的时间来逐步调整模型参数,而QLoRA微调能够通过多种量化方法显著减少显存占用,大大减少了微调所需的内存,同时性能几乎与标准微调相当。与此同时,微调后的模型可以直接用于模型部署,符合UniScale训练与推理一体化的设计理念,这项改进使得UniScale成为一个非常有效的深度学习平台,提供了更快速、高效的微调实验方案。

3bfa5ff6-1348-11ee-962d-dac502259ad0.png    

能力突破,效果加速提升

01医疗能力超越Med-PaLM 2

山海大模型实现了在特定领域内专业知识的快速积累,通过语料的不断迭代升级,专业能力持续突破。以医疗领域为例,山海大模型学习了大量教材、百科等高质量医学文献,使其能够提供更加全面、专业的医疗信息支持。在扩展了医疗大模型的领域知识的同时,山海大模型仍旧保持原有的高性能、高准确率等特点。医疗大模型的改进为医生们提供更强大的支持和指导,以提高医疗效果。目前该模型在MedQA任务上提升到了87.1%,超越Med-PaLM 2,临床执业医师资格考试提升到了523(总分600分),超过了99%的考生水平。

3c25c1be-1348-11ee-962d-dac502259ad0.png

02诗词创作能力升级

在诗词创作方面上,山海大模型不仅在预训练阶段增加了7万多首古诗词数据,补充诗词相关的知识,在指令学习阶段,也精心设计近40种不同的指令,基本覆盖日常对诗词数据相关知识考察的内容,充分发掘大模型的潜力,进一步提升创作能力。通过指令学习的方法,山海大模型学会了运用类似的修辞手法和表达方式,使其创作效果更富诗意、更具情感温度。不仅如此,山海大模型还能够根据主题和情感要求进行定制化创作——这一突破不仅得益于诗词相关的指令学习数据的引入,也归功于山海大模型自身强大的计算和学习能力。

03数学能力提升

山海大模型的数学计算能力主要依赖预训练阶段扎实、系统的数学理论体系和指令学习阶段基于插件的具体题型的求解能力。为了进一步提升山海大模型的数学能力,我们主要针对以下两方面进行优化:

a) 我们在预训练阶段提供人工和模型精心挑选的高质量预训练数据,其中包括从小学到大学所有数学学科的教材、练习册等,通过这些数据的学习,模型就具备了系统的数学理论体系和解决各种数学问题的基础。

b) 基于 react 思想的指令学习是大模型数学能力的必要步骤。在此阶段,对每一种题型,我们给出具体的解题思路,包括 reasoning and acting,教会大模型解决各种问题的能力。解题过程中,为了解决大模型无法做精确数值计算的问题,将数值运算移交给插件完成,插件完成数值计算或者方程求解之后,将答案返回大模型,大模型继续问题求解,直到给出最终答案。

从5月24日正式发布以来,山海大模型始终在不断训练、调优,致力通过自身不断的迭代进化兑现AI应用价值;保持高速演进的同时,也在探索与具体场景深度融合的更多可能。

目前,云知声山海大模型已深入到智慧医疗、智慧教育、知识管理、智慧营销、智能客服等具体场景中,基于山海大模型打造的场景应用正不断丰富、不断拓展。

7月6日-7月8日,云知声将携山海大模型及其医疗、银行、车载、客服等最新场景应用亮相2023世界人工智能大会,欢迎大家届时莅临云知声展位参观交流。

从能力升级到场景应用,基于多年技术积累,云知声正加速推进山海大模型的迭代演变。未来山海会有怎样的惊喜和亮点,值得你的期待。
责任编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 显卡
    +关注

    关注

    16

    文章

    2357

    浏览量

    65854
  • 模型
    +关注

    关注

    1

    文章

    2704

    浏览量

    47687
  • 云知声
    +关注

    关注

    0

    文章

    114

    浏览量

    8261

原文标题:山海大模型迎来新一轮迭代,医疗能力超越Med-PaLM 2

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    云知声山海模型医疗行业版登顶上海AI实验室权威大模型评测榜

    近日,上海AI实验室和上海市数字医学创新中心联合推出的MedBench评测更新榜单,云知声山海模型医疗行业版(UNIGPT-MED) 以综合得分54.7的优异成绩登顶榜首,充分彰显其硬核医疗实力。
    的头像 发表于 04-24 14:28 424次阅读
    云知声<b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>医疗行业版登顶上海AI实验室权威大<b class='flag-5'>模型</b>评测榜

    云知声山海模型获得华为昇腾技术认证

    云知声山海模型近日取得了重大突破,顺利通过了华为Atlas 800训练服务器和华为AI框架昇思MindSpore的兼容性测试。这一成就标志着云知声山海模型的技术实力得到了华为的充分
    的头像 发表于 02-05 09:32 533次阅读

    Sparse4D-v3:稀疏感知的性能优化及端到端拓展

    极致的感知性能与极简的感知pipeline一直是牵引我们持续向前的目标。为了实现该目标,打造一个性能优异的端到端感知模型是重中之重,充分发挥深度神经网络+数据闭环的作用,才能打破当前感
    的头像 发表于 01-23 10:20 430次阅读
    Sparse4D-v3:稀疏感知的<b class='flag-5'>性能</b><b class='flag-5'>优化</b>及端到端拓展

    数据转换器的各项直流性能特性

    电子发烧友网站提供《数据转换器的各项直流性能特性.pdf》资料免费下载
    发表于 11-28 11:04 1次下载
    数据转换器的<b class='flag-5'>各项</b>直流<b class='flag-5'>性能</b>特性

    智能汽车的山海之盾

    “芯”中有山海,智能汽车的安全之道
    的头像 发表于 11-25 17:19 293次阅读
    智能汽车的<b class='flag-5'>山海</b>之盾

    云知声山海模型助力实现换乘节点无缝高效换乘

    、出租车、网约车等多种出行方式于一体的大型综合交通枢纽,是南宁对外衔接的主要门户和窗口。 此次南宁火车东站升级,是以云知声山海模型为核心,融合云知声在智慧交通领域的多年技术沉淀,打造“信息易查、指引明确、换乘便利、
    的头像 发表于 10-31 09:27 735次阅读

    “数字龙华”再添新动力,云知声山海助力龙华构建深圳首个政务垂直领域GPT大模型

    随着大模型能力的不断完善,聚焦特定领域的大模型落地实践正迎来发展热潮。 近日,云知声携手深圳市龙华数据有限公司,以山海模型为底座,率先在深圳开发首个面向行业垂直领域的AI产品——“龙
    发表于 10-19 17:33 198次阅读
    “数字龙华”再添新动力,云知声<b class='flag-5'>山海</b>助力龙华构建深圳首个政务垂直领域GPT大<b class='flag-5'>模型</b>

    云知声千亿参数山海模型首次亮相

    8月28日,山海模型迎来又一次迭代升级,当前版本参数规模达到千亿,实现了多学科能力、医疗能力双提升,实测性能在C-Eval全球大模型综合性评测中超越GPT-4,以平均分70分的成绩进
    的头像 发表于 08-31 16:00 416次阅读
    云知声千亿参数<b class='flag-5'>山海</b>大<b class='flag-5'>模型</b>首次亮相

    一文带你详解芯片--SL8541e-系统性能优化

    ? 我们需要有客观标准的性能指标和对应的测试方法,避免不同的人主观意识不一样,导致出现不同的评价结果。 ----欲详情,请移步LAVAL社区芯片解决方案–SL8541e-系统性能优化
    发表于 08-22 09:12

    SwinTransformer模型优化

    SwinTransformer模型优化
    的头像 发表于 08-18 11:26 485次阅读
    SwinTransformer<b class='flag-5'>模型</b><b class='flag-5'>优化</b>

    为什么无法使用POT优化Tensorflow (TF)或MXNet模型

    无法使用 POT 优化 Tensorflow (TF) 或 MXNet 模型,以便在 英特尔凌动® 平台上使用 OpenVINO™ 工具套件进行推理。 运行 pot -h。 接收错误消息: 非法指令例外
    发表于 08-15 08:05

    Arm性能模型库发布说明产品修订版

    ARM®性能模型库是一个包,其中包含支持的ARM性能模型,用于动态建模和模拟已配置的ARM IP的性能。 您可以根据
    发表于 08-11 06:20

    点云标注的算法优化性能提升

    点云标注的算法优化性能提升是提高自动驾驶技术的关键因素。通过优化算法和提升性能,可以获得更准确、更高效的点云标注结果。 首先,算法优化可以
    的头像 发表于 07-13 15:20 313次阅读

    云知声携山海模型及系列场景应用亮相2023 WAIC

    7月6-8日,2023世界人工智能大会(以下简称2023 WAIC)在上海举办,云知声携山海模型及系列场景应用亮相2023 WAIC。
    的头像 发表于 07-11 16:02 416次阅读

    云知声发布山海模型,与京东科技、360达成合作!

    电子发烧友网报道(文/李弯弯)日前,云知声山海模型正式发布。在发布会现场,云知声实测山海模型十大核心能力,并发布一系列面向不同行业需求的产品应用。   云知声创始人、CEO黄伟表示
    的头像 发表于 06-01 01:07 1809次阅读