0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

科技云报道:大模型的中场战事,深入垂直行业腹地

科技云报到 来源:jf_60444065 作者:jf_60444065 2023-05-31 14:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

科技云报道原创。

自从OpenAI于2022年11月推出ChatGPT后,一场波及全球科技界的“AI海啸”就此爆发。

自今年以来,国内已有超过30家企业入局大模型赛道。从百度“文心一言”、阿里“通义千问”的发布,到网易“玉言”、科大讯飞“星火”、昆仑万维“天工”等的推出,再到腾讯“混元”、京东“ChatJD”、华为“盘古”等的预告。互联网巨头、科技公司纷纷秀出“肌肉”,谁也不想在这场大模型混战中掉队。

在由OpenAI引发的这场狂奔中,大模型的发展阶段已经从“通用”迈入“垂类”。如果说通用大模型是大模型发展的初期阶段,那么垂直场景应用则可以视为“中场战事”。

在该阶段,应用与场景先行,倒逼垂直领域的大模型飞跃发展。不少医疗、金融、教育等行业内拥有用户数据积累的企业,已开始基于大模型“底座”,训练适配自身的垂类模型,比如近期由上海联通、华山医院联合开发的Uni-talk、医联“MedGPT”、云知声的“山海”等。

大模型路线分化

大模型让人类感受到的智能,是就像人类自身的学习那样,通过通用知识和逻辑能力的训练,具备了解决各种问题的能力。

大模型也有这种能力,基于文本语料采用无监督学习训练的模型可以用少量的监督样本,用于各类机器学习任务,比如图片分类、翻译、对话、写代码等,这样的能力就是所谓的通用能力。

当大模型发展到一定阶段,各领域企业意识到,其通用能力已无法承载更为专业的领域,比如医疗、金融等,每一个领域都是独立的知识体系,具备极为庞杂的知识量,显然仅靠通用大模型无法满足垂直领域的需求,这也为大模型之后发展路径的分化埋下了伏笔。

事实上,通用大模型发展至今,面临算力需求大、训练和推理成本高、数据质量不佳等挑战。一个成功的且可对外商业化输出的通用大模型,要求厂商拥有全栈大模型训练与研发能力、业务场景落地经验、AI安全治理举措、以及生态开放性等核心优势。

另外,训练基础模型的成本也是非常之高,做一个千亿级的大模型,需要单机群万卡以上的算力。从国内外来看,真正做通用模型的公司并没有那么多。相反,训练垂直领域模型所需要的代价和资源远远小于从零开始做通用模型。

因而,从商业逻辑的角度来看,大部分公司不具备做通用大模型的能力,巨头更适合做通用大模型,拥有丰富场景数据积累的公司更适合做垂域模型。

垂类大模型以深度解决行业需求为主,即企业在自己擅长的领域训练适合自己的“产业版GPT”。这类大模型生成的内容更符合特定垂类场景的需求,质量更高。

当前,已经可以看到不少垂类模型应用在金融、医疗、交易等场景中。比如,彭博社根据自身丰富的金融数据资源,基于GPT-3框架再训练,开发出了金融专属大模型BloombergGPT。

由此,大模型赛道目前出现了三类厂商:一类对标GPT的通用大模型,聚焦基础层的厂商;一类是在开源大模型基础之上训练垂类大模型,聚焦垂直行业的企业;另一类则是专注具体应用的纯应用公司。

通用VS垂类

从通用大模型到垂类大模型,是大模型技术发展到一定阶段的必然结果。

垂直大模型的发展主要体现在各个领域的模型性能持续提升,例如语音识别的错误率逐年下降,自然语言处理的语义理解能力不断提升等。通用大模型则在多任务学习、迁移学习等方面取得了显著进展,已经成为自然语言处理领域的重要研究方向。

比如,生物大模型能够提高AI制药效率。国外的研究报告显示,AI可以将新药研发的成功率提高16.7%,AI辅助药物研发每年能节约540亿美元的研发费用,并在研发主要环节节约40%至60%的时间成本。根据英伟达公开资料,使用AI技术可使药物早期发现所需时间缩短至三分之一,成本节省至两百分之一。

在产业角度来看,通用模型就是“百科全书”,能够有问必答,能够适用不同的产业土壤,而垂直模型类似于单领域的专家,虽然专业,但受众注定是少数人。

从演进路径上看,垂类模型是在通用大模型基础上训练而来,如果撇开通用大模型,垂类大模型不复存在。垂类模型强调领域的Know-How,对于特定领域来说,需要针对该领域的任务做指令学习。行业不同,场景不同,指令学习的区别也极大。比如,泛互联网行业更关注营销、推荐的效果,金融更领域更关注风控、可信、以及营销的效果。

两者的最大区别在于,垂类大模型在资源投入、成本投入等方面的要求下降了,但额外要求是行业Known-How,即对这个行业的知识要求提高了。

而从成本方面考量,通过通用大模型微调实现的垂类大模型相较通用大模型是“几何级别的下降”。根据国金证券的测算,在模型微调阶段,由于训练量级较小,仅为万级,相关的算力成本相比之下可忽略不计。

以斯坦福大学于2023年3月发布Alpaca为例,这是一个基于LLaMA-7B基座,应用5.2万指令对模型微调训练而来的对话类语言模型。该模型基于8块A100微调,微调时长3小时,算力成本不超过300元。

由于垂直应用大模型更符合垂类场景的需求、质量比通用大模型更高,也让众多企业看到了其中的机会。

医联近日发布了自主研发的基于Transformer架构的国内首款医疗大语言模型——MedGPT,其主要致力在真实医疗场景中发挥实际诊疗价值,可实现从疾病预防、诊断、治疗、康复的全流程智能化诊疗能力。

5月,微盟正式发布基于大模型的AI应用型产品WAI,该产品已正式上线包括话术生产、短信模板、商品描述、种草笔记、直播口播稿、公众号推文、短视频带货文案等25个实际应用场景。

作为聚焦物联网与医疗两大领域的人工智能企业,云知声正式发布山海大模型。该大模型针对知识密度高的领域,通过数据训练、训练数据、微调等方式,做一些专业的加强,这样模型既具备了通用应用水平,也针对特殊场景与领域进行了能力的加强。

山海大模型不仅在中文环境下的表现要好于GPT-4,甚至在医疗等个别场景下的表现效果,也已经开始优于GPT-4。目标是在今年内达到ChatGPT的通用能力水平,并在医疗、物联、教育等多个垂直领域的能力上全面超越GPT-4。

云知声创始人、CEO黄伟指出,在AI 1.0时代,虽然基于深度学习,每家都有强大的技术,但整体上并没有本质改变AI用于分类的任务,分类种类的增加仍然处在量变阶段,限制了AI创造价值的上限。

而在大模型引领的AI 2.0时代,为人工智能带来了新的能力,可以打造更多新的产品,满足客户更多的需求,例如医疗、营销、沟通等,能够创造更多的商业机会。

pYYBAGR25yeAEqcgAAD4tGxmDqw800.png

云知声创始人、CEO黄伟

AI对于复杂逻辑理解能力大幅增强,扭转了用户对于AI“人工智障”的刻板印象,也让更多人接受人工智能,为大模型的广泛应用创造的条件。

“大模型所谓的‘思维链’能力,可以告诉用户推导的过程,从而知道中间过程里有哪些东西是错的,优化的时候就可以获得提示了,而不是像过去一样只能看见和调整参数的权重。”

云知声创始人兼CTO梁家恩表示,但就目前而言,大模型仍然是有限的东西,但对于没有见过的东西,大模型会生成“似是而非”的回答,而随着AI生成能力的不断增强,但校验会更加困难,这也让AI行业需要不断去探索新的解决方法。

相信随着越来越多企业入局,垂直大模型在各个行业和细分领域中将大量涌现。而那些能将一个垂直领域做专、做透,用高质量的数据持续优化模型,跑通商业闭环,构建起产业生态的企业,最终将把价值链做到足够长。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、全球云计算大会官方指定传播媒体之一。深入原创报道云计算、大数据、人工智能、区块链等领域。

审核编辑黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38170

    浏览量

    296865
  • 人工智能
    +关注

    关注

    1813

    文章

    49752

    浏览量

    261621
  • ChatGPT
    +关注

    关注

    31

    文章

    1596

    浏览量

    10077
  • 大模型
    +关注

    关注

    2

    文章

    3448

    浏览量

    4974
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    英泰斯特入选2025年武汉市人工智能产品资源池名单

    近日,武汉市经济和信息化局正式公布《2025年武汉市人工智能产品资源池名单》,英泰斯特自主研发的“智能车联网故障预警大模型”,作为工业制造领域垂直行业模型,历经区级遴选推荐、市级权威专家评审、现场
    的头像 发表于 11-30 17:03 1039次阅读

    光庭信息成为百度智能模型行业合伙人

    论坛上,光庭信息作为受邀企业出席,正式成为百度智能“大模型行业合伙人”,并荣获“行业卓越贡献伙伴奖”。这标志着双方合作进入了一个全新的阶段,将为AI+汽车产业智能化升级创造更大价值。
    的头像 发表于 09-02 16:17 631次阅读

    阿里设备的物模型数据里面始终没有值是哪里的问题?

    如上图,不知道讲清楚没有。 IG502自定义TOPIC 上发到阿里没问题。采用阿里模型的格式来上发就不行。请大佬指教!
    发表于 08-05 06:43

    震撼!2025ECDC萤石开发者大会,萤石蓝海大模型2.0解锁垂直场景AI新玩法!

    6月26日,以“蓝海潮生全域进化”为主题的2025ECDC萤石开发者大会在杭州举办。作为全球领先的视觉物联网平台,萤石在过去一年以“AI+视觉能力”为核心驱动力,推出萤石蓝海大模型与新一代AI
    的头像 发表于 06-26 18:39 1174次阅读
    震撼!2025ECDC萤石<b class='flag-5'>云</b>开发者大会,萤石蓝海大<b class='flag-5'>模型</b>2.0解锁<b class='flag-5'>垂直</b>场景AI新玩法!

    模型在半导体行业的应用可行性分析

    的应用,比如使用机器学习分析数据,提升良率。 这一些大模型是否真的有帮助 能够在解决工程师的知识断层问题 本人纯小白,不知道如何涉足这方面 应该问什么大模型比较好,或者是看什么视频能够涉足这个行业
    发表于 06-24 15:10

    知声与商汤科技达成战略合作

    终端等核心领域展开深度合作,探索大模型垂直行业的落地实践。通过模型能力的深度融合,双方将在语音与视觉等多模态交互方面协同创新,为行业客户提供更自然、更高效的智能交互体验,加速智能技术
    的头像 发表于 06-20 14:52 798次阅读

    知声荣登甲子光年2025中国AI产业逐浪者榜单

    近日,由甲子光年主办的「AI共潮生·2025甲子引力X科技产业新风向」在上海工业智能中心成功举办。知声凭借山海大模型的领先技术实力与多领域产业落地成果,荣耀入选【星辰100】2025中国AI产业逐浪者榜单,成为AI大模型
    的头像 发表于 05-26 14:13 623次阅读

    望石智慧基于亚马逊科技构建医药行业专属大模型 推动药物研发创新

    人工智能辅助药物设计(AIDD)过程的效率,实现人工智能在医药行业创新应用场景的落地。在亚马逊科技的技术赋能下,望石智慧的多个医药项目依托该模型已收获显著成果,在成功构建多条自研管线的同时,还筛选出多个具有突破性的临床前候选项
    发表于 05-13 14:21 994次阅读

    如何赋能医疗AI大模型应用?

    “百模大战”。不仅如此,这些通用AI大模型还逐渐渗透到各个垂直行业中,其中生命科学和医疗健康行业成为了拓展速度较快的一个领域。从2023年2月至10月初,国内市场上
    的头像 发表于 05-07 09:36 526次阅读
    如何赋能医疗AI大<b class='flag-5'>模型</b>应用?

    【第二章 模型与设备连接】手把手教你玩转新版正点原子

    【第二章 模型与设备连接】手把手教你玩转新版正点原子玩过物联网的朋友们都知道,我们在接触各大主流平台时会知道物模型的概念。 本实验就是针对原子云中
    发表于 03-12 09:27

    广和通基于阿里通义大模型推出随身智能解决方案,赋能消费电子终端行业

    2月,广和通与全球领先的解决方案提供商阿里达成合作:广和通AI模组及解决方案,基于阿里通义千问大模型,推出“随身智能解决方案”,赋能消费电子
    的头像 发表于 03-03 17:55 1052次阅读
    广和通基于阿里<b class='flag-5'>云</b>通义大<b class='flag-5'>模型</b>推出随身智能解决方案,赋能消费电子终端<b class='flag-5'>行业</b>

    DeepSeek大模型如何推动“AI+物流”融合创新

    在人工智能技术的迭代浪潮中,大模型(Large Language Models, LLM)正从文本生成、图像创作走向垂直行业赋能。2025年新年,国产 AI 大模型 DeepSeek 横空出世,凭借其低成本、高精度和多模态能力,
    的头像 发表于 02-28 16:36 1048次阅读

    机械星球发布“星知”大模型,接入DeepSeek提升行业智能

    近日,机械星球正式推出了自主研发的工程机械垂直行业模型——“机械星球•星知大模型”。这一创新举措标志着机械星球在推动工程机械行业智能化方面迈出了重要一步。 “机械星球•星知大
    的头像 发表于 02-17 09:39 891次阅读

    通用大模型垂直行业的应用

    随着DeepSeek这类通用大模型的普及,接下来会迎来更加精细化的垂直行业模型,那么哪些垂直行业会率先受益?以下是DeepSeek的整理预测,供大家参考。
    的头像 发表于 02-10 15:44 1392次阅读

    【「大模型启示录」阅读体验】对大模型深入的认知

    内容让我对大模型技术的发展有了更全面的认识。我意识到,大模型不仅仅是一些算法和代码的堆砌,它们背后有着深刻的科技变革和产业竞争。 书中对大模型与不同行业结合的讨论,更是让我眼前一亮。我
    发表于 12-20 15:46