0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

垂直大模型竞争,能突破数据“卡点”吗?

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-05-19 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科技云报道原创。

AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。

随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。

企业涌入垂直大模型赛道

通用AI大模型像ChatGPT,能够处理各种领域和场景的自然语言,但由于需要巨大的计算资源和数据量,已经成为国内外大厂的重点项目。

这类企业往往有着强大的技术团队和资金支持,且有着自己的场景和流量优势。比如百度、阿里、腾讯、字节、华为等,在搜索、社交、电商、办公等领域都有着自己的通用AI大模型。

相较之下,创业公司、细分领域企业很难在这样的竞争中获得先发优势或者差异化优势。

而垂直AI大模型只关注某个特定的领域或者场景,它能够利用行业的数据和知识,提供更精准和高效的解决方案,更好地满足用户在某个领域或者场景下的需求和期待,如:医疗、金融、教育等。

同时,它可以利用一些开源或者闭源的通用AI大模型作为基础,然后在其上进行指令微调(instruction tuning),来适应自己的目标领域或者场景。

因此,它的参数规模比通用大模型低一个量级,如果让数据飞轮和模型训练能够很好结合,在某些特定领域甚至比通用大模型的效果更好、成本更低。

在这样的背景下,越来越多的企业加入了垂直大模型的赛道。

5月18日,深信服发布国内首个自研安全大模型,成为安全领域GPT技术应用首秀;

5月5日,学而思宣布正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构;

3月,达观数据公布正在开发曹植系统,专注于金融、政务、制造等垂直领域的大语言模型。

明确的商业化落地场景和更低的算力成本,为各类企业打开了进军垂直大模型的大门。

垂直大模型的考验

垂直大模型的优势在于不够大:算力不够大、算法难度低,但并不代表垂直大模型谁都能做。

众所周知,AI大模型三要素:算力、算法、数据,都是喂养AI的“饲料”。

先说算力。

大模型之所以“大”,就是因为参数众多和数据量庞大。AI大模型所需要的计算量,大致上相当于参数量与数据量的乘积。

过去5年,AI大模型的参数量几乎每年提升一个数量级,例如GPT-4参数量是GPT-3的16倍,达到1.6万亿个。

随着图像、音视频等多模态数据的引入,大模型的数据量也在飞速膨胀。这意味着想要玩转大模型,必须拥有大算力。

而一套垂直大模型的训练和推理成本,做个参考,在数字人垂类技术场景中,可以做到比Open AI同参数规模的模型低一个量级,像启元世界的战略总监王思捷就曾提到:先构建更小的垂类模型(比如百亿参数、十亿参数),让数据飞轮和模型训练能够很好结合,垂类模型在某些领域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已远远低于通用大模型,但对算力基础设施的投入依然会阻挡部分小公司的入局。

再说算法。

在三要素中,算法的研发难度相对较低,每家公司都有自己实现大模型的路径算法,且有众多开源项目可作为参考,中国公司最容易缩短甚至抹平差距。

最后说数据。

高质量的数据是助力AI训练与调优的关键,足够多、足够丰富的数据,是AI大模型的根基。

OpenAI此前披露,为了AI像人类那样流畅交谈,研发人员给GPT-3.5提供多达45TB的文本语料,相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等,甚至还将代码开源平台Github纳入其中。

但是聚焦到细分行业,数据的获取就没那么容易了。

兴业证券公开表示,要训练专业的行业大模型,优质的行业数据、公共数据至关重要。

就国内数据市场而言,据发改委官方批露,我国政府数据资源占全国数据资源的比重超过3/4,但开放规模不足美国的10%,个人和企业可以利用的规模更是不及美国的7%。

而行业数据更是非常核心的私域数据,私域数据量越大,质量越高,就越有价值。

比如,一个医疗公司拥有大量医疗数据、病例数据,那么它就能开发出医疗垂直大模型类的产品。同理,建筑行业的项目数据、金融行业的用户画像数据、海运行业的船位数据等,都是赋能垂直大模型的关键。

但是这些私域数据都攥在企业自己手中,而且为了数据安全和合规,绝大部分机构是要本地化部署才会尝试大模型训练,很难想象企业会把自己的核心数据拿给别人去训练。

此外,如何合理地给数据打上分级标签、做好标注也非常重要。数据分级分类能够帮助产品提效,而高精度的标注数据能够进一步提升大模型的专业表现。

但现阶段垂直行业想要获取高精度标注数据的成本较高,而在公开数据库中,行业专业数据也较少,因此对垂直大模型的建构提出了很高的要求。

总体而言,想要做好垂直大模型,数据的重要性,远超过算力和算法。

数据,已成为企业突破垂直大模型的“卡点”。

手握行业数据领先一步

垂类大模型讲求应用与场景先行的逻辑,而在国内更是强调产业侧的价值。

一方面,在当前中国的智能化浪潮下,产业侧数字化革新本就有广阔的市场需求;另一方面,在toB生态下,基于垂直应用的实践也有利于形成数据飞轮与场景飞轮。

而这一切的前提,是推出垂类大模型的公司在该行业已建立技术壁垒与护城河,即“人无我有”的竞争优势。

如此看来,在垂直行业深耕多年的企业或将有更大的赢面。

这类企业在数据层面、大模型以及知识图谱方面都有较为深厚的积累,对于大模型的优化更具优势。同时,它们对于to B客户需求和落地场景有很深的理解,能够更好地保证垂直大模型产品的可信和可靠,满足企业级对于安全可控合规的需求。

目前,已有一些垂类大模型在金融、教育、医药、营销等场景中得到试炼。

例如,彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT;

网易有道则面向教育场景,推出自研的类ChatGPT模型“子曰”;

在ChatGPT发布后仅几周,谷歌公布了一个专门用于回答医疗保健相关问题的大型医用语言模型Med-PaLM......

相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7350

    浏览量

    95067
  • AI
    AI
    +关注

    关注

    91

    文章

    41479

    浏览量

    302795
  • ChatGPT
    +关注

    关注

    31

    文章

    1604

    浏览量

    10404
  • 大模型
    +关注

    关注

    2

    文章

    3814

    浏览量

    5283
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    零基础手写大模型资料2026

    的梯度按比例缩放,确保训练过程平稳。例如在BERT训练中,全局梯度范数超过阈值时,会统一乘以阈值/范数进行裁剪。 3. 分布式训练:突破单机限制 当模型参数超过单机内存时,需采用数据并行或模型
    发表于 05-01 17:44

    AI Ceph 分布式存储教程资料大模型学习资料2026

    在人工智能的浪潮中,算力、算法与数据被誉为三驾马车。然而,随着大模型(LLM)参数量突破万亿级别,数据集规模膨胀至 PB 乃至 EB 级别,传统的存储架构已难以支撑这场算力竞赛的“粮草
    发表于 05-01 17:35

    AI大模型微调企业项目实战课

    取非结构化文本,通过去重、脱敏,最终转化为符合大模型阅读习惯的“指令-回复”对。几千条高质量、无矛盾的垂直行业数据,其效果远胜于几万条从网上爬取的劣质问答。 第二步:精准手术——参数高效微调(PEFT
    发表于 04-16 18:48

    九天菜菜大模型agent智能体开发实战2026一月班

    、蒙特洛树搜索等关键技术,将复杂任务拆解为可执行的子步骤,并根据实时反馈动态调整策略。工具使用模块让 Agent 突破模型固有局限,能够调用搜索引擎、数据库、代码解释器等外部工具,
    发表于 04-15 16:04

    设计党必看!解决大文件顿+数据安全痛

    作为设计行业从业者,想必都被GB级PSD/AI文件折磨过:多人协同访问时加载半天、传统存储频繁顿,热数据与冷数据混存效率低,数据安全还时刻提心吊胆。 最近实测铁威马专为企业打造的解决
    的头像 发表于 03-31 16:52 152次阅读
    设计党必看!解决大文件<b class='flag-5'>卡</b>顿+<b class='flag-5'>数据</b>安全痛<b class='flag-5'>点</b>

    云知声成功中标全国首个省级医保垂直模型项目

    2026年开年,智慧医保领域迎来里程碑式突破——云知声智能科技股份有限公司成功中标全国首个省级医保垂直模型项目“江苏省医保垂直模型及智能
    的头像 发表于 01-23 17:16 872次阅读

    英泰斯特获评2025年武汉市垂直行业优秀模型

    2025年12月15日,武汉市经济和信息化局发布《2025年武汉市垂直行业模型拟认定名单》,英泰斯特自主研发的“智能车联网故障预警大模型”,凭借其领先的技术创新性和广泛的应用前景成功入选,并获评优秀
    的头像 发表于 12-22 11:17 885次阅读

    安森美垂直GaN技术赋功率器件应用未来

    在传统横向结构的GaN器件中,电流沿芯片表面流动。而垂直 GaN 的 GaN 层生长在氮化镓衬底上,其独特结构使电流直接从芯片顶部流到底部,而不是仅在表面流动。这种垂直电流路径让器件能够承受更高的电压和更大的电流,从而实现更高
    的头像 发表于 12-04 09:28 2098次阅读
    安森美<b class='flag-5'>垂直</b>GaN技术赋<b class='flag-5'>能</b>功率器件应用未来

    安森美入局垂直GaN,GaN进入高压时代

    电子发烧友网综合报道 近日,安森美发布器垂直GaN功率半导体技术,凭借 GaN-on-GaN 专属架构与多项性能突破,为全球高功率应用领域带来革命性解决方案,重新定义了行业在效、紧凑性与耐用性上
    的头像 发表于 11-10 03:12 7877次阅读

    安森美推出垂直氮化镓功率半导体

    随着全球能源需求因 AI 数据中心、电动汽车以及其他高能耗应用而激增,安森美(onsemi)推出垂直氮化镓(vGaN)功率半导体,为相关应用的功率密度、效和耐用性树立新标杆。这些突破
    的头像 发表于 10-31 13:56 2392次阅读

    端到端语音交互数据 精准赋语音大模型进阶

    在语音大模型从“识别”向“懂语境”跨越的关键阶段,高质量场景化语音数据已成为制约技术突破的核心瓶颈。传统语音识别数据集采用孤立标注,在语音
    的头像 发表于 09-11 17:17 861次阅读

    模型工具的 “京东答案”

    随着大模型技术的迅猛发展,AI工具已成为重要的辅助生产力工具和工作伙伴。它能够显著提升工作效率、帮助解决业务痛,甚至通过知识延展与智能协同,帮助团队突破传统认知边界。掌握大
    的头像 发表于 08-25 16:09 702次阅读

    垂直GaN迎来新突破

    电子发烧友网综合报道 最近垂直GaN功率器件又迎来新进展。7月10日,广东致CEO黎子兰博士,在瑞典举办的全球氮化物半导体顶尖会议ICNS(国际氮化物半导体会议)上发表邀请报告,首次报道了广东致
    发表于 07-22 07:46 5168次阅读
    <b class='flag-5'>垂直</b>GaN迎来新<b class='flag-5'>突破</b>!

    【「DeepSeek 核心技术揭秘」阅读体验】第三章:探索 DeepSeek - V3 技术架构的奥秘

    融入 Transformer,通过替换 FFN 层、多机多训练等策略,试图拓展模型能力。看到模型容量因专家数量增加而扩展,处理更复杂任务,让我感受到创新的潜力。但同时,通信成本高、
    发表于 07-20 15:07

    数据标注与大模型的双向赋:效率与性能的跃升

    ​‌在人工智能蓬勃发展的时代,大模型凭借其强大的学习与泛化能力,已成为众多领域创新变革的核心驱动力。而数据标注作为大模型训练的基石,为大模型性能提升注入关键动力,是
    的头像 发表于 06-04 17:15 2286次阅读
    <b class='flag-5'>数据</b>标注与大<b class='flag-5'>模型</b>的双向赋<b class='flag-5'>能</b>:效率与性能的跃升