0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

用技术望远镜看国内大模型:文心闪耀 双榜领跑

脑极体 来源:脑极体 作者:脑极体 2024-06-20 09:18 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

中国大模型应用,正在进入“可观测期”。

《中国大模型中标项目监测报告(2024年5月)》中显示,截至5月,中国大模型的相关中标金额已经超过2023年全部中标项目的披露金额。

在大模型全面落地四处开花的同时,大模型正摆脱“不可观测”状态,过去由于大量大模型应用在B端,信息相对封闭,对于产业来说,他们很难清晰获知大模型技术水平、擅长领域、落地能力,无形中增加了智慧化转型的决策成本。

随着大模型技术评测体系的逐渐成熟,我们仿佛拥有了天文望远镜,可以在群星闪耀中,找到那颗最耀眼的星。

wKgaomZy5EmAdGz7AAHqWvqZB6I677.jpg

最近,国际权威机构IDC发布了《中国大模型市场主流产品评估,2024》,智源研究院打造的FlagEval天秤大模型评测平台也发布了最新一期模型评测排行榜单,两项评测中百度文心大模型实现了双榜夺魁。

“望远镜”背后技术评价机制

我们可以简单看看,这两架“天文望远镜”分别采用了哪些评价机制。

IDC的评估分为基础能力和应用能力,其中基础方面涉及问答、推理、创作、数学、代码等能力,应用方面既考验toC通用场景,也考验金融、零售、法律等toB细分场景。

尽管有GPT-4这样的有力对手,文心一言仍然在七大维度全面领先。

智源研究院打造的FlagEval天秤大模型测评平台发布于2023年,面向视频、语音、多模态等多个领域,在FlagEval大语言模型评测体系当前包含6大评测任务,近30个评测数据集,超10万道评测题目。

wKgZomZy5EqAWk23AAIWRF-cRCQ209.jpg

在闭源对话模型榜单中,文心大模型4.0以89.72的综合评分排名第一,OpenAI的GPT-4o等位列其后。

wKgaomZy5EqAWnKiAAESNkipxcs831.jpg

可见不论是从全领域能力角度进行评估,还是考察至关重要的大语言水平,文心一言毫无疑问都是中文大模型的榜首,是星海中光芒最耀眼的一颗。

技术之光

抬头仰望星空时,我们看到的,其实是星星几年,甚至几十几百年以前留下的掠影。

同样,想要让大模型从“不可观测”变为“可观测”,除了对当下的技术能力进行评测,我们也要回溯光芒的源头,也就是大模型的技术内核。

从文心大模型来看,这种技术之光可以分为两个层面:

第一层,是技术投入的“原生光芒”。

百度对于深度学习的探索挖掘,包括对AI技术的应用,已经有十数年之久。在大模型热还未被掀起的2019年,百度就打造了第一代文心大模型体系,从而才有了建立在文心大模型之上的文心一言。

如今经过数次迭代,文心大模型在理解、生成、逻辑、记忆四大能力让其他厂商难以望其项背。IDC报告中就显示,在数学类和代码类等考验模型逻辑、推理等能力的评测中,百度文心大模型体现出了强大的体系化思维、逻辑思维和抽象思维能力。

能力迭代背后,是文心大模型有条不紊的全面技术布局。

比如通过文心飞桨的联合调优,通过高效算力和自研框架来提升大模型的训练效率,增加技术的迭代速度。

wKgaomZy5EuACxItAAKOMedpYks364.jpg

又比如面对近年来爆火的智能体Agent技术,文心大模型第一时间推出了文心智能体平台。在基础模型能力上叠加思考增强训练,以基础模型+思考模型的形式,让大模型更接近于人类的学习、理解和执行模式。

像百度自己,就通过这种模式打造了代码智能体和智能代码助手Comate,目前Comate生成代码整体采纳率已达46%,新增代码中生成比例已达27%。IDC的报告中我们也能发现,在代码类所有6个细分维度中,百度均入围优势厂商。

对于技术研发的深埋与前瞻,让这颗星体源源不断的释放着创新之火,点亮宇宙的一隅。

第二层,是产业协作的“折射光芒”。

文心大模型能力的来源,除了自身的研发投入,还有广泛的产业实践。

截至目前,文心一言累计用户规模已达2亿,日均调用量也达到了2亿。这一数字在同类生成式AI产品中一骑绝尘。

在toB领域,百度一方面将文心大模型全面落地于自身业务中,如搜索、地图、信息流。同时百度智能云还推出了千帆大模型平台,打造一站式企业级大模型开发平台。不久前,文心大模型还对外免费开放了ERNIE Speed、ERNIE Lite两款主力模型。

wKgZomZy5EuAfhBEAAInXsHC8Uo866.jpg

在不断对外开放的过程中,文心大模型的调用量呈几何式增长,合作伙伴与案例也越来越多。从国家电网、南方电网、中国航天这样的国之重器,到金融保险领域的浦发银行、泰康保险,再到终端领域的荣耀、三星,媒体领域汽车之家……在不断与合作伙伴共建行业大模型的过程中,文心大模型已经实现了中国最为广泛的产业落地规模。

在广泛的产业合作中,文心大模型得以被真实应用场景滋养,不断从中发掘细节需求,进而针对性地提升技术能力。

举例来说,在大量的实践中百度得以发掘,大模型落地过程中,效果、效率和成本都是重要考量。因此,推出了多模型推理技术来提升推理效率,以降低落地成本。

有对周围产业伙伴光芒的“折射”,我们观测到的星光可以更加立体。文心大模型的成就不仅仅来自机构评测的认可,更来自一个个坚实的落地案例。

大模型星光如何照耀产业星球

当我们望见星光时,它正在向轨道更远处运行着,从大模型元年,走入了大模型落地元年。

《中国大模型中标项目监测报告(2024年5月)》中显示,今年5月份大模型中标项目数量创下了新高。毫无疑问,随着大模型“不可观测性”逐渐褪去,产业对于大模型的需求,正在进入井喷状态。需求暴涨的情况下,大模型要如何站稳潮头,真正在行业领域站稳脚跟?以文心大模型为例,纵观文心大模型近一年来的动作,仿佛是一场星际旅行,不断从遥远的技术天空贴近我们所在的应用星球。

文心大模型留下了技术的轨迹,通过不断的研发,让大模型更加贴近AGI,在能力层面更适应应用领域的复杂任务。

文心大模型也留下了普惠的轨迹,主力模型的免费开放,落地成本的不断降低,都让大模型更加易用,让更多产业伙伴加入行业大模型的联合创新中。

文心大模型还留下了生态的轨迹,百度对于开发者生态的建设持之以恒,目前已在全国最大AI社区“星河社区”中打造了大模型板块,也推出了智能体平台这样降低大模型应用研发门槛的工具。开发生态的繁荣,让文心具备更多引力,加速向产业目标行驶而去。

有了这三道清晰的轨迹,我们也就能够望见文心,包括整体中国大模型的未来将如何到来。

星移斗转中,产业对于大模型能力与价值的认知正在逐渐清晰。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296812
  • 文心一言
    +关注

    关注

    0

    文章

    134

    浏览量

    2093
  • 大模型
    +关注

    关注

    2

    文章

    3446

    浏览量

    4972
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百度模型5.0-Preview文本能力国内第一

    11月8日凌晨,LMArena大模型竞技场最新排名显示,全新模型ERNIE-5.0-Preview-1022登上文本排行全球并列第二、
    的头像 发表于 11-11 17:15 1105次阅读

    Vicor携手Microgate打造全球最大地面光学望远镜

    在智利沙漠的中心 Cerro Armazones 山上,美国公司 Vicor 和意大利公司 Microgate 这两家技术领导者正在携手打造有史以来最大的地面光学望远镜 —— 极大望远镜 (ELT)。得益于高密度电源系统和革命性
    的头像 发表于 09-26 14:01 499次阅读

    百度模型X1.1正式发布

    今天,在WAVE SUMMIT深度学习开发者大会2025上,模型X1.1正式发布,在事实性、指令遵循、智能体等能力上均提升显著。
    的头像 发表于 09-10 11:08 1672次阅读

    宁畅与与百度模型展开深度技术合作

    与部署。 凭借覆盖训练、推理、微调全流程的AI 服务器产品矩阵,宁畅帮助企业在大模型时代一键打通算力与应用“任督二脉”,显著缩短模型落地周期。 在已启动的深度技术合作中,双方将基于
    的头像 发表于 07-07 16:26 658次阅读

    黑芝麻智能与模型技术合作升级

    近日,模型正式开源,黑芝麻智能即日起快速启动与模型
    的头像 发表于 07-04 17:24 1020次阅读
    黑芝麻智能与<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b><b class='flag-5'>技术</b>合作升级

    龙芯中科与心系列模型开展深度技术合作

              6月30日,4.5系列模型正式开源。龙芯中科在模型开源首日启动
    的头像 发表于 07-02 16:53 1144次阅读

    Vicor电源模块助力Microgate极大望远镜自适应光学系统制造

    揭开宇宙的秘密,首先需要清晰、详细的视角。遗憾的是,这对于地球望远镜来说是一项极具挑战性的任务,它们需要克服一个主要的障碍:地球大气层。这就是 Microgate 为欧洲南方天文台(ESO)的极大望远镜(ELT)所制造的自适应光学系统发挥作用之处。
    的头像 发表于 06-30 09:10 776次阅读

    百度模型X1 Turbo获得信通院当前大模型最高评级证书

    ,16项达5分,综合评级获当前最高级“4+级”, 成为国内首款通过该测评的大模型X1 Turbo逻辑推理、代码推理、推理效果优化等技术
    的头像 发表于 05-21 18:19 1111次阅读
    百度<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>X1 Turbo获得信通院当前大<b class='flag-5'>模型</b>最高评级证书

    VirtualLab应用:施密特-卡塞格林望远镜

    摘要 施密特-卡塞格林望远镜是业余天文望远镜中非常受欢迎的设计,因为它具有高对比度和低像差效应。它由施密特校正板和卡塞格林反射组成。卡塞格林反射由一个凹面主
    发表于 05-21 09:15

    百度发布模型4.5和文模型X1

    模型4.5是百度自主研发的新一代原生多模态基础大模型,通过多个模态联合建模实现协同优化,多模态理解能力优秀;具备更精进的语言能力,理解、生成、逻辑、记忆能力全面提升,去幻觉、逻辑
    的头像 发表于 03-18 16:29 709次阅读

    百度下一代模型正式开源

    随着模型的迭代升级和成本不断下降,一言将于4月1日0时起全面免费,所有PC端和APP端用户均可体验
    的头像 发表于 02-17 13:44 809次阅读

    百度搜索与心智能体平台接入DeepSeek及模型深度搜索

    近日,百度搜索与心智能体平台联合宣布了一项重要更新:将全面接入DeepSeek及模型最新的深度搜索功能。这一更新将为用户和开发者带来更加智能、高效的搜索和智能体创建体验。 据悉
    的头像 发表于 02-17 09:14 976次阅读

    百度模型将升级并开源

    百度近日宣布,其文模型系列将迎来新版本升级,计划在未来数月内逐步推出文模型4.5系列。这一消息无疑为AI领域注入了新的活力。 据悉,百度
    的头像 发表于 02-14 14:25 747次阅读

    凌智电子受邀参加模型生态大会

    12月26日在上海·张江科学会堂,由深度学习技术及应用国家工程研究中心主办,百度飞桨及模型承办,以“模力无限星河共创”为主题的
    的头像 发表于 01-03 16:35 949次阅读
    凌智电子受邀参加<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>生态大会

    模力无限,星河共创:启明云端与您共赴模型生态大会

    在人工智能的浪潮中,我们即将迎来一场科技界的盛会——模型生态大会。这场将于12月26日在上海·张江科学会堂举行的大会,由深度学习技术及应用国家工程研究中心主办,百度飞桨及
    的头像 发表于 12-24 18:01 1532次阅读
    模力无限,星河共创:启明云端与您共赴<b class='flag-5'>文</b><b class='flag-5'>心</b>大<b class='flag-5'>模型</b>生态大会