0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

垂直大模型竞争,能突破数据“卡点”吗?

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-05-19 14:04 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科技云报道原创。

AI大模型火遍全球,中国产业也激发了对人工智能应用的新热情。

随着各大厂商参与竞逐,市场正在分化为通用与垂直两大路径,两者在参数级别、应用场景、商业模式等方面差异已逐步显现。

企业涌入垂直大模型赛道

通用AI大模型像ChatGPT,能够处理各种领域和场景的自然语言,但由于需要巨大的计算资源和数据量,已经成为国内外大厂的重点项目。

这类企业往往有着强大的技术团队和资金支持,且有着自己的场景和流量优势。比如百度、阿里、腾讯、字节、华为等,在搜索、社交、电商、办公等领域都有着自己的通用AI大模型。

相较之下,创业公司、细分领域企业很难在这样的竞争中获得先发优势或者差异化优势。

而垂直AI大模型只关注某个特定的领域或者场景,它能够利用行业的数据和知识,提供更精准和高效的解决方案,更好地满足用户在某个领域或者场景下的需求和期待,如:医疗、金融、教育等。

同时,它可以利用一些开源或者闭源的通用AI大模型作为基础,然后在其上进行指令微调(instruction tuning),来适应自己的目标领域或者场景。

因此,它的参数规模比通用大模型低一个量级,如果让数据飞轮和模型训练能够很好结合,在某些特定领域甚至比通用大模型的效果更好、成本更低。

在这样的背景下,越来越多的企业加入了垂直大模型的赛道。

5月18日,深信服发布国内首个自研安全大模型,成为安全领域GPT技术应用首秀;

5月5日,学而思宣布正在进行自研数学大模型的研发,命名为MathGPT,面向全球数学爱好者和科研机构;

3月,达观数据公布正在开发曹植系统,专注于金融、政务、制造等垂直领域的大语言模型。

明确的商业化落地场景和更低的算力成本,为各类企业打开了进军垂直大模型的大门。

垂直大模型的考验

垂直大模型的优势在于不够大:算力不够大、算法难度低,但并不代表垂直大模型谁都能做。

众所周知,AI大模型三要素:算力、算法、数据,都是喂养AI的“饲料”。

先说算力。

大模型之所以“大”,就是因为参数众多和数据量庞大。AI大模型所需要的计算量,大致上相当于参数量与数据量的乘积。

过去5年,AI大模型的参数量几乎每年提升一个数量级,例如GPT-4参数量是GPT-3的16倍,达到1.6万亿个。

随着图像、音视频等多模态数据的引入,大模型的数据量也在飞速膨胀。这意味着想要玩转大模型,必须拥有大算力。

而一套垂直大模型的训练和推理成本,做个参考,在数字人垂类技术场景中,可以做到比Open AI同参数规模的模型低一个量级,像启元世界的战略总监王思捷就曾提到:先构建更小的垂类模型(比如百亿参数、十亿参数),让数据飞轮和模型训练能够很好结合,垂类模型在某些领域可能比Open AI的效果更好成本更低。

即便垂直大模型在算力要求上已远远低于通用大模型,但对算力基础设施的投入依然会阻挡部分小公司的入局。

再说算法。

在三要素中,算法的研发难度相对较低,每家公司都有自己实现大模型的路径算法,且有众多开源项目可作为参考,中国公司最容易缩短甚至抹平差距。

最后说数据。

高质量的数据是助力AI训练与调优的关键,足够多、足够丰富的数据,是AI大模型的根基。

OpenAI此前披露,为了AI像人类那样流畅交谈,研发人员给GPT-3.5提供多达45TB的文本语料,相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等,甚至还将代码开源平台Github纳入其中。

但是聚焦到细分行业,数据的获取就没那么容易了。

兴业证券公开表示,要训练专业的行业大模型,优质的行业数据、公共数据至关重要。

就国内数据市场而言,据发改委官方批露,我国政府数据资源占全国数据资源的比重超过3/4,但开放规模不足美国的10%,个人和企业可以利用的规模更是不及美国的7%。

而行业数据更是非常核心的私域数据,私域数据量越大,质量越高,就越有价值。

比如,一个医疗公司拥有大量医疗数据、病例数据,那么它就能开发出医疗垂直大模型类的产品。同理,建筑行业的项目数据、金融行业的用户画像数据、海运行业的船位数据等,都是赋能垂直大模型的关键。

但是这些私域数据都攥在企业自己手中,而且为了数据安全和合规,绝大部分机构是要本地化部署才会尝试大模型训练,很难想象企业会把自己的核心数据拿给别人去训练。

此外,如何合理地给数据打上分级标签、做好标注也非常重要。数据分级分类能够帮助产品提效,而高精度的标注数据能够进一步提升大模型的专业表现。

但现阶段垂直行业想要获取高精度标注数据的成本较高,而在公开数据库中,行业专业数据也较少,因此对垂直大模型的建构提出了很高的要求。

总体而言,想要做好垂直大模型,数据的重要性,远超过算力和算法。

数据,已成为企业突破垂直大模型的“卡点”。

手握行业数据领先一步

垂类大模型讲求应用与场景先行的逻辑,而在国内更是强调产业侧的价值。

一方面,在当前中国的智能化浪潮下,产业侧数字化革新本就有广阔的市场需求;另一方面,在toB生态下,基于垂直应用的实践也有利于形成数据飞轮与场景飞轮。

而这一切的前提,是推出垂类大模型的公司在该行业已建立技术壁垒与护城河,即“人无我有”的竞争优势。

如此看来,在垂直行业深耕多年的企业或将有更大的赢面。

这类企业在数据层面、大模型以及知识图谱方面都有较为深厚的积累,对于大模型的优化更具优势。同时,它们对于to B客户需求和落地场景有很深的理解,能够更好地保证垂直大模型产品的可信和可靠,满足企业级对于安全可控合规的需求。

目前,已有一些垂类大模型在金融、教育、医药、营销等场景中得到试炼。

例如,彭博社利用自身丰富的金融数据源,基于开源的GPT-3框架再训练,开发出了金融专属大模型BloombergGPT;

网易有道则面向教育场景,推出自研的类ChatGPT模型“子曰”;

在ChatGPT发布后仅几周,谷歌公布了一个专门用于回答医疗保健相关问题的大型医用语言模型Med-PaLM......

相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    7315

    浏览量

    94039
  • AI
    AI
    +关注

    关注

    90

    文章

    38247

    浏览量

    297238
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10091
  • 大模型
    +关注

    关注

    2

    文章

    3460

    浏览量

    4992
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    安森美垂直GaN技术赋功率器件应用未来

    在传统横向结构的GaN器件中,电流沿芯片表面流动。而垂直 GaN 的 GaN 层生长在氮化镓衬底上,其独特结构使电流直接从芯片顶部流到底部,而不是仅在表面流动。这种垂直电流路径让器件能够承受更高的电压和更大的电流,从而实现更高
    的头像 发表于 12-04 09:28 1087次阅读
    安森美<b class='flag-5'>垂直</b>GaN技术赋<b class='flag-5'>能</b>功率器件应用未来

    安森美推出垂直氮化镓功率半导体

    随着全球能源需求因 AI 数据中心、电动汽车以及其他高能耗应用而激增,安森美(onsemi)推出垂直氮化镓(vGaN)功率半导体,为相关应用的功率密度、效和耐用性树立新标杆。这些突破
    的头像 发表于 10-31 13:56 1908次阅读

    模型工具的 “京东答案”

    随着大模型技术的迅猛发展,AI工具已成为重要的辅助生产力工具和工作伙伴。它能够显著提升工作效率、帮助解决业务痛,甚至通过知识延展与智能协同,帮助团队突破传统认知边界。掌握大
    的头像 发表于 08-25 16:09 409次阅读

    垂直GaN迎来新突破

    电子发烧友网综合报道 最近垂直GaN功率器件又迎来新进展。7月10日,广东致CEO黎子兰博士,在瑞典举办的全球氮化物半导体顶尖会议ICNS(国际氮化物半导体会议)上发表邀请报告,首次报道了广东致
    发表于 07-22 07:46 4702次阅读
    <b class='flag-5'>垂直</b>GaN迎来新<b class='flag-5'>突破</b>!

    数据标注与大模型的双向赋:效率与性能的跃升

    ​‌在人工智能蓬勃发展的时代,大模型凭借其强大的学习与泛化能力,已成为众多领域创新变革的核心驱动力。而数据标注作为大模型训练的基石,为大模型性能提升注入关键动力,是
    的头像 发表于 06-04 17:15 1672次阅读
    <b class='flag-5'>数据</b>标注与大<b class='flag-5'>模型</b>的双向赋<b class='flag-5'>能</b>:效率与性能的跃升

    如何赋医疗AI大模型应用?

    “百模大战”。不仅如此,这些通用AI大模型还逐渐渗透到各个垂直行业中,其中生命科学和医疗健康行业成为了拓展速度较快的一个领域。从2023年2月至10月初,国内市场上
    的头像 发表于 05-07 09:36 536次阅读
    如何赋<b class='flag-5'>能</b>医疗AI大<b class='flag-5'>模型</b>应用?

    模型时代 垂直化是数据市场发展趋势 解决单点难题是核心竞争

    数据,作为一种革命性的生产资源,与算力、算法共同构成了人工智能产业的三大要素。受益于人工智能的蓬勃发展,人类加速进入到由数据驱动的数字化时代,数据作为核心要素的作用越来越重要。 01 大模型
    的头像 发表于 04-09 11:48 339次阅读

    人民出行首批入选广西人工智能垂直模型,以科技投入带领行业前行

    作为首批入选企业,凭借深度融合时空图神经网络、多目标优化算法、集成视觉传感器的骑行安全监控及能源路由算法等前沿技术所打造的 “大数据监控可视化平台 + APP 端实时推荐” 双引擎系统,成功破解共享出行行业痛,在众多竞争者中脱
    的头像 发表于 03-19 09:18 779次阅读

    垂直运动永磁同步直线电机的复合控制研究

    后,系统可以达到较好的抗干扰效果,基本上消除了响应滞后,准确的跟踪输入信号。文件过大,请点击下方附件免费下载~~~*附件:20250312_垂直运动永磁同步直线电机的复合控制研究.docx
    发表于 03-12 17:07

    数据采集卡:示波器不是万的!!!#数据采集卡 #示波器 #热电偶 #信号

    数据采集卡
    西安阿尔泰电子科技发展有限公司
    发布于 :2025年03月07日 16:38:13

    通用大模型垂直行业的应用

    随着DeepSeek这类通用大模型的普及,接下来会迎来更加精细化的垂直行业模型,那么哪些垂直行业会率先受益?以下是DeepSeek的整理预测,供大家参考。
    的头像 发表于 02-10 15:44 1408次阅读

    天数智芯与无问芯穹合作突破集群训练优化

    近日,天数智芯与无问芯穹宣布达成深度合作,并在千集群训练优化领域取得了重大技术突破。这一合作基于天数智芯的天垓150卓越计算能力和无问芯穹自主研发的大模型训练框架,共同推动了LLaMA千
    的头像 发表于 01-21 14:31 1383次阅读

    科普知识丨热变形维软化测试仪是什么?

    软化。热变形温度是指材料在一定负荷下,产生规定变形量时的温度;维软化则是在规定的升温速率下,标准压针在试样上压入规定深度时的温度。通过对这些参数的精确测量,
    的头像 发表于 01-08 10:40 718次阅读
    科普知识丨热变形维<b class='flag-5'>卡</b>软化<b class='flag-5'>点</b>测试仪是什么?

    【「大模型启示录」阅读体验】+开启智能时代的新钥匙

    ,NVDIA与微软的竞争 。计算能力的飞速提升是大模型得以兴起的重要基石。GPU/TPU 等高性能计算设备的迅猛发展,宛如为大模型的训练打造了一台强大的引擎。它们能够以极高的速度处理海量的数据
    发表于 12-24 13:10

    【「大模型启示录」阅读体验】营销领域大模型的应用

    使企业能够提前洞察市场动向,制定前瞻性的市场策略,从而在竞争中占据有利地位。 通过分析广告投放的效果数据,大模型可以帮助企业优化广告内容和投放策略。这包括确定最佳的广告渠道、投放时间和目标受众,以及
    发表于 12-24 12:48