0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

云知声千亿参数山海大模型首次亮相

云知声 来源:云知声 2023-08-31 16:00 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

8月28日,山海大模型迎来又一次迭代升级,当前版本参数规模达到千亿,实现了多学科能力、医疗能力双提升,实测性能在C-Eval全球大模型综合性评测中超越GPT-4,以平均分70分的成绩进入前三甲。

42be64b4-47b8-11ee-97a6-92fbcf53809c.png


能力突破,持续领跑行业

多学科能力增强

本次山海大模型2.0版参数规模达到千亿,增加了更多的学科类的预训练语料,训练数据(Tokens)达到两万亿(2.0T)。

在本次模型升级过程中,山海团队充分利用了教材、文献、百科类语料的价值,这些语料包含了人类对客观世界知识的丰富理解、详尽解释以及在各个领域的深入研究所得到的科学结论。不同的学科领域的数据涵盖了各自学科的专业知识,这在一定程度上弥补了第一版山海大模型在某些专业领域的知识盲区。

为了使模型能更科学合理地汲取这些不同领域和来源的数据中的知识,山海大模型团队使用了DoReMi方法对数据进行了优化权重采样。通过这种策略,可以在较大范围内均匀并深入地提取各类信息。这一策略使得山海团队在本次模型升级过程中,能更有效地吸取和运用各种知识,使模型的知识库更加全面。

430728c0-47b8-11ee-97a6-92fbcf53809c.png

医疗能力再升级

云知声深耕医学领域多年,山海大模型2.0在预训练阶段使用了海量的医学病历、医学教材、临床指南和医学文献等数据,并在对齐阶段使用了人机结合方法构建的近百万级的病历理解、医学考试和医学知识问答等指令学习数据。C-Eval中医疗学科的结果表明,山海大模型2.0在基础医学、临床医学和医师资格数据集上都能获得接近90分的水平,为业内最高。

431a91ee-47b8-11ee-97a6-92fbcf53809c.png

云知声山海大模型团队参加了刚刚在沈阳结束的CCKS2023-PromptCBLUE评测,该评测是当前最权威的中文医疗大模型的评测榜单,我们同样也取得了第一名的成绩,再次证明了山海大模型专业的医学能力。

技术升级,性能加速提升

窗口长度大幅度扩展

山海团队发现,在运用位置插值(PositionInterpolation)方法进行大幅度扩展时——比如将窗口从4k扩展到32k——其性能会显著受到影响。这种影响主要体现在短距离情况下的使用。为了更好地解释这一点,假设原始数据中距离为1的两个token,当我们将数据从4k扩展到32k时,这两个token之间的距离实际上变成了1/8。这就意味着,在进行位置插值的过程中,原本距离很近的两个token之间的距离被大比例地拉远了。这种场景下,衰减规律在短距离的使用会受到较大的影响,这是因为衰减规律在短距离时可能具有非常突出的变化率,意味着原本应该很近的两个token在大规模扩展之后,它们之间的关联性会大幅度减小。因此,直接进行位置插值的方法会使得窗口大幅度扩展后的性能较大程度地降低。发现RoPE位置编码短距离之间的差异,主要体现在高频分量上,长距离之间的差异,主要体现在低频分量上。山海大模型2.0版根据神经正切核的思想,采用Neural Tangent Kernel (NTK)的非线性差值方法,实现高频外推、低频内插的大规模长度扩展。采用NTK扩展后模型能够更好的支持文本窗口扩展,当前山海大模型2.0版本已经支持32K的窗口长度。

受限解码支持业务落地

在大多数行业中,对大模型的并发使用和响应时间有很高的要求。这要求我们在保证大模型算法效果的基础上,更需要深思其推理速度。本次山海大模型2.0基于落地场景需要,设计了受限解码方法,在解码过程中不需要计算整个词表的概率,只需关注落地场景下关注的token,极大地提高了解码效率。如图所示,利用受限解码方法,生成token“今”后面只需考虑token“夕”和“天”的概率,而不需要完成整个词表概率分布的计算。

43713cba-47b8-11ee-97a6-92fbcf53809c.png

作为中国AGI技术产业化的先驱之一,云知声于2016年开始打造Atlas人工智能基础设施,并以此为基础,构建云知大脑(UniBrain)技术中台——以山海(UniGPT)通用认知大模型为核心,结合多模态感知与生成、知识图谱、物联平台等智能组件,为云知声智慧物联、智慧医疗等业务提供高效的产品化支撑,持续推动“U(云知大脑)+X(应用场景)”战略布局,践行“通过通用人工智能(AGI)创建互联直觉的世界”的公司使命。

云知声:通过通用人工智能(AGI)创建互联直觉的世界

43b6d34c-47b8-11ee-97a6-92fbcf53809c.png

云知声AI技术体系及U+X战略

山海大模型作为云知大脑的核心,能力体系涵盖语言生成、语言理解、知识问答、 逻辑推理、代码能力、数学能力等。此外,为提高大模型在具体场景的应用落地水平,山海大模型在通用能力基础上,增强物联、医疗等行业能力,致力为客户提供更智能、更灵活的解决方案,加速千行百业的智慧化升级。

自5月24日发布以来,山海大模型始终保持高速演进,不断拓展大模型场景应用边界——

6月25日

山海大模型通过迭代实现了在特定领域内的专业知识积累,诗词创作能力、数学计算能力实现突破。其中,医疗能力在6月的MedQA任务上提升到了87.1%,超越Med-PaLM 2,临床执业医师资格考试提升至523(总分600分),超过了99%的考生水平。

6月27日

北京市首批10个人工智能行业大模型应用案例公布,由云知声和北京友谊医院共同开发的基于山海大模型的门诊病历生成系统示范应用成功入选。

7月2日

凭借山海大模型卓越的研发和应用成果,云知声同时入选2023北京人工智能行业赋能典型案例、“北京市通用人工智能产业创新伙伴计划”第二批成员名单。

7月6日-8日

云知声携山海大模型及最新场景应用——基于山海大模型打造的智慧车载解决方案、智慧交通解决方案亮相2023 WAIC。

7月28日

山海大模型迎来新一轮迭代升级,并在本月的C-Eval全球大模型综合性考试评测中取得了60分以上的优异成绩,成功跻身榜单前十。

8月27日

CCKS 2023现场公布系列评测任务结果,云知声凭借基于山海大模型孵化的UNIGPT-MED 模型,在PromptCBLUE医疗大模型评测中夺得A、B榜双榜冠军。

云知声希望,通过山海大模型的持续升级,不仅打造基础能力更加强大的通用大模型,也进一步融合不同垂直领域的专业知识,让大模型更懂行业、更具专长,实现大模型应用场景的加速拓展,让大模型的产业价值在千行百业中绽放。

此次云知声跻身C-Eval全球大模型综合性考试评测前三甲,再一次印证了山海大模型的突出实力,也将持续推动云知声AGI基础设施能力的跃进提升,加速人工智能技术的创新与应用。未来,云知声将以其强大的技术实力、不断创新的科研能力以及对人工智能发展的深刻理解,不断构建长期竞争力和创新基石,持续探索AGI的无限可能。

附:C-Eval是由清华大学、上海交通大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集,包含13948道多项选择题,涵盖数学、物理、化学、生物、历史、政治、计算机等52个不同学科和四个难度级别,是全球最具影响力的综合性考试评测集之一。作为第三方发起的测试基准, C-Eval以其客观性、公正性备受业内关注,也吸引了多家企业、机构和高校的参与。

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38225

    浏览量

    297075
  • GPT
    GPT
    +关注

    关注

    0

    文章

    368

    浏览量

    16720
  • 云知声
    +关注

    关注

    0

    文章

    286

    浏览量

    9081
  • 大模型
    +关注

    关注

    2

    文章

    3460

    浏览量

    4975

原文标题:云知声千亿参数山海大模型首次亮相,C-Eval 评测达70分,超越GPT-4

文章出处:【微信号:云知声,微信公众号:云知声】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    入选2025中国AI大模型产业创新服务商TOP20榜单

    荣誉,(股票代码:09678.HK)凭借自主研发的山海模型在技术创新、产业落地与生态构建方面的卓越表现,成功入选 "2025 中国
    的头像 发表于 12-08 18:04 1443次阅读

    获批建设河南信阳人工智能大模型工程技术研究中心

    近日,河南省信阳市公示了《2025年度信阳市级科技研发平台拟新建名单》,由(信阳)数字科技有限公司申报的“信阳市人工智能大模型服务平台及应用工程技术研究中心”成功获批。该平台的筹
    的头像 发表于 11-03 17:16 1110次阅读

    联合行业伙伴推出多款智能硬件解决方案

    近日,智慧生活产品线迎来一系列新产品和解决方案升级,大模型全面进入产品线,让AGI从“技术概念”切实走进“日常好用”的智慧化生活。
    的头像 发表于 10-29 13:47 723次阅读

    与库帕思签署战略合作协议,共筑“模型+语料”新生态

    9月26日,智能科技股份有限公司(以下简称“”,股票代码09678.HK)与上海库帕
    的头像 发表于 09-26 21:32 2249次阅读

    多项业务营收大涨

    依托山海模型不断开拓阵地,开发了面向东盟等海外市场和国内方言市场的语音大模型
    的头像 发表于 09-10 15:44 481次阅读

    在港交所成功上市

    近日,智能科技股份有限公司(以下简称“”)于香港联合交易所主板挂牌上市,股份代号:0
    的头像 发表于 07-03 17:41 908次阅读

    AGI龙头企业港股上市,市值达147亿港元

      (电子发烧友网综合报道)6月30日,北京国内AGI龙头企业正式在港交所上市,股份代号:09678.HK。声发行价为205港元/
    的头像 发表于 06-30 11:44 2672次阅读
    AGI龙头企业<b class='flag-5'>云</b><b class='flag-5'>知</b><b class='flag-5'>声</b>港股上市,市值达147亿港元

    与商汤科技达成战略合作

    近日,智能科技股份有限公司(以下简称“”)与上海商汤智能科技有限公司(以下简称“商汤
    的头像 发表于 06-20 14:52 802次阅读

    荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。凭借山海模型的领先技术实力与多领域
    的头像 发表于 05-26 14:13 629次阅读

    再度登顶MedBench榜单

    近日,中文医疗大模型权威评测平台MedBench公布最新自测榜单结果,基于山海模型打造的
    的头像 发表于 05-20 10:12 654次阅读

    深度参与三项大模型国家标准编写

    在人工智能技术加速落地的当下,标准化建设已成为推动行业高质量发展的关键因素。近日,参与编写的3项人工智能大模型国家标准:20231736-T-469《人工智能 大
    的头像 发表于 03-18 18:19 773次阅读

    山海模型多项评测名列前茅

    近日,智源研究院发布并解读了国内外100余个开源和商业闭源的语言、视觉语言、文生图、文生视频、语音语言大模型综合及专项评测结果。
    的头像 发表于 12-24 10:29 769次阅读

    近期斩获多项年度大奖

    在科技迅猛发展的当下,人工智能(AI)已成为推动各行业革新的核心动力。,以其卓越的技术实力和敏锐的市场洞察,在AI领域中脱颖而出,成为行业的领航者。近日,
    的头像 发表于 12-24 10:26 810次阅读

    陈吉胜:大模型应用分析与案例介绍

    近日,上海师范大学信息与机电工程学院第四届人工智能竞赛挑战周系列活动正式开幕。作为国内AI领域的头部独角兽企业,受到特别邀请。
    的头像 发表于 12-13 14:20 1060次阅读

    斩获2024高工智能汽车金球奖

    奖”。   端侧大模型解决方案通过离线语义大模型的突破性落地,实现了业界首次
    的头像 发表于 12-12 18:30 985次阅读