0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型

甲子光年 来源:甲子光年 2023-12-20 16:54 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

定义一种全新的“定制化”模式。

百川智能依然保持着一如既往的快节奏。

12月19日,百川智能宣布开放基于搜索增强的Baichuan2-Turbo系列API,包含Baichuan2-Turbo-192K及Baichuan2-Turbo。在支持192K超长上下文窗口的基础上,还增加了搜索增强知识库的能力。

即日起,API用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。

2个多月前的9月25日,百川智能便发布了Baichuan2-53B闭源大模型,全面升级了Baichuan1-53B的各项能力。作为首批通过备案的大模型企业之一,百川智能此次还开放了Baichuan2-53B API接口,正式进军to B领域,开启商业化进程。

在当天的媒体沟通会上,百川智能创始人、CEO王小川,百川智能联合创始人、联席总裁洪涛,百川智能技术联创陈炜鹏及百川智能商用业务部总经理李剑共同出席,为「甲子光年」等媒体解答了百川智能在to B模式中最新的技术与商业思考。

1.行业模型之外,大模型to B的第二条路

在过去一年对大模型商业化的讨论中,行业大模型一直被认为是大模型在B端商业落地的主要路径。

而百川智能此次走出了一条不同的路。

百川智能认为,企业自有数据/知识库是企业的核心竞争力。大模型如果不能与企业自有数据/知识库进行结合,对企业而言是没有价值的。

如何将大模型与企业自有数据/知识库更好地相结合呢?

一个已经为人熟知的方法是,打造行业大模型。然而,基于特定数据预训练或微调垂直行业大模型需要高密度的技术人才团队、大量的算力支持,并且每更新一次数据都要重新训练或微调模型。

这种方式不仅成本高昂、灵活性差,更关键的是不能保证训练的可靠性和应用的稳定性,多次训练后仍会出现问题。

此外,大部分企业数据,都是结构化的数据,也不适合SFT(Supervised fine-tuning,有监督微调),模型无法准确记忆结构化信息,就会带来幻觉。

针对这些痛点,行业摸索了一套基本操作,即“向量数据库+长上下文窗口”。而百川智能在此基础上进一步完善了大模型技术栈,拓展至四个维度:

向量数据库,百川智能在向量检索c-mteb位列第一

长窗口Baichuan2-192K,一次可输入35万字

实现稀疏检索(索引库)与向量搜索并行,模型的可用率从80%提升至95%

搜索系统和大模型对齐

具体来看,百川智能将向量数据库升级为搜索增强知识库,提升了大模型获取外部知识的能力;把搜索增强知识库和超长上下文窗口结合,让模型可以连接全部企业知识库以及全网信息,能够替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求。 这套技术栈背后,也反映了百川智能对于大模型更深层次的思考。 在百川智能的技术思考中,大模型+搜索增强是大模型时代的新计算机——

大模型类似于计算机的CPU,通过预训练将知识内化在模型内部,然后根据用户的Prompt生成结果;

上下文窗口可以看做计算机的内存,存储了当下正在处理的文本;

互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘。

那么,百川智能如何将这套技术栈真正落地在商业场景呢?

2.用“产品化”取代“项目化”

事实上,无论王小川还是他所召集的搜狗“旧部”,过往的工作经验更多集中在to C领域。此次带领百川智能进军to B,无疑会面临诸多挑战。

洪涛告诉「甲子光年」:“企业真正要用好大模型的起点,是把企业知识和大模型结合,而这也是最大的困难。”

王小川认为,to B要面对的最大需求是定制化,光靠调用API可能不够。

“我们今天用搜索增强最大的意愿不是解决幻觉问题,而是解决大模型可定制化的问题。如何让企业的私有数据为模型所用,让模型为企业服务,是大模型to B商业化过程中要解决的关键问题。”王小川表示。

在上一波以计算机视觉为核心的AI浪潮中,AI公司变成了集成商,需要下场做很重交付的定制化项目,往往利润很低,甚至越做越亏。如何避免在定制化项目中“越做越亏”的故事在大模型的商业化路上重演,是所有大模型创业公司今天要面对的一大难题。

在王小川的判断中,定制化是客户天生的需求,to B企业真正要避免的是“项目化”。

所以,基于上述技术栈,百川智能定义了一种全新的“定制化”方式——用“产品化”取代“项目化”。

“整体来看,一些能盈利的to B公司卖的大多是产品。我们目前打造的可配置、可调整的搜索增强知识库,就是希望用产品的方式,以更低的成本解决客户的定制化需求。客户提出的各种需求可以通过我们不同的产品组合来解决, 我们不需要单独开发一套全新的数据库。”洪涛进一步解释道。

据「甲子光年」观察,百川智能并不直接针对某个行业做“企业服务”,而是基于不同的场景需求,构建大模型解决问题的能力。这些能力最终可被应用在多个行业。

在众多场景中,百川智能主要瞄准有两大特征的场景——有大量文本数据,并且需要与客户打交道,如客服场景。

目前,和大多数企业类似,百川智能为企业提供API调用、云上部署以及本地部署三种大模型部署方式。

在此次沟通会中,王小川还透露了C端产品的最新信息。

王小川表示,C端产品依然是百川智能十分看重的方向。关于C端超级应用的定义,王小川认为:“以往做应用更多是在造工具,我们要求它以更精确的方式和我们互动,提高我们的效率。但今天,我们要造的是新物种,是一种人类的伙伴。”

王小川进一步透露,百川智能的C端产品第一重心是医疗方向,产品预计会在明年上线。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • API
    API
    +关注

    关注

    2

    文章

    2507

    浏览量

    67140
  • 大模型
    +关注

    关注

    2

    文章

    3864

    浏览量

    5299
  • 百川智能
    +关注

    关注

    0

    文章

    18

    浏览量

    196

原文标题:百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型|甲子光年

文章出处:【微信号:jazzyear,微信公众号:甲子光年】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    模型赋能制造业:AISOP 如何实现 SOP 全流程智能化生成与落地

    而非通用生成:基于细分行业知识库与 SFT 微调的工业大模型,懂工艺、懂标准,生成的 SOP 可直接落地执行,无需大量二次修改; 系统原生集成而非外挂补充:标准化 API 接口实现与
    发表于 05-22 17:12

    沐曦股份曦云C系列GPU产品Day 0适配度文心ERNIE-Image文生图模型

    4月15日,度文心大模型团队重磅推出ERNIE‑Image文生图模型,沐曦股份曦云 C 系列 GPU 已完成对 ERNIE‑Image 的Day 0 深度适配,同步支持 ERNIE‑
    的头像 发表于 04-15 17:39 602次阅读

    谷歌正式发布Gemma Scope 2模型

    大语言模型 (LLM) 具备令人惊叹的推理能力,但其内部决策过程在很大程度上仍然不透明。如果系统未按预期运行,对其内部运作机制缺乏可见性难以准确定位问题根源。过去,我们通过发布 Gemma
    的头像 发表于 01-24 14:01 829次阅读

    AI医疗领域风起云涌:巨头竞逐,创新浪潮席卷

    Anthropic进军医疗领域,以及英伟达与礼来在AI制药方面的深度合作,还有蚂蚁阿福在健康管理领域的积极拓展,AI医疗正迎来前所未有的发展机遇。   百川智能:M3模型引领医疗新变革   1月13日,在
    的头像 发表于 01-14 14:34 5397次阅读

    中车株洲所工业大模型“斫轮·灵构”正式发布

    近日,由中国中车集团统一组织、中车株洲所研发的工业大模型“斫轮·灵构”正式发布,标志着中国中车在轨道交通与能源装备智能设计领域迈出新的一步。
    的头像 发表于 11-24 16:20 666次阅读

    桔子数科以智能体开发平台“百川”引领金融业务高效变革

    。     面对这一行业发展趋势,桔子数科精准布局,依托强大的科技创新力深入推进 AI +战略,致力于 AI 技术深度融入金融业务的各个环节,为企业和行业发展注入新的活力与创新动力。 “
    的头像 发表于 09-19 14:45 1052次阅读

    禾赛科技激光雷达助力行致远S6系列低速无人车发布

    9 月 2 日,德赛西威旗下品牌——“行致远”在上海正式发布。现场,行致远 S6 飞翼款、S6 侧拉门款低速无人车首次公开亮相,开启了低速无人车
    的头像 发表于 09-05 14:20 1389次阅读

    光庭信息成为智能云大模型行业合伙人

    论坛上,光庭信息作为受邀企业出席,正式成为智能云“大模型行业合伙人”,并荣获“行业卓越贡献伙伴奖”。这标志着双方合作进入了一个全新的阶段
    的头像 发表于 09-02 16:17 1034次阅读

    弘信电子携手百川智能推动医疗AI技术落地应用

    近日,百川智能正式发布开源医疗增强大模型Baichuan-M2,该模型以卓越性能问鼎全球开源医疗
    的头像 发表于 08-19 10:58 1405次阅读
    弘信电子携手<b class='flag-5'>百川</b><b class='flag-5'>智能</b>推动医疗AI技术落地应用

    业大模型利用全流程数据采集推动显示行业生产制造升级

    挖掘与智能分析,显示工业大模型能够突破传统生产模式的局限,在工艺优化、质量管控、设备运维等关键环节实现智能化跃升,推动显示制造向更高效率、更高质量、更低成本的方向发展。 全流程数据:显
    的头像 发表于 07-28 10:37 824次阅读

    多摩协议编码器:助力数控机床行业迈向智能制造

    起着决定性作用。多摩编码器凭借其卓越的性能和先进的技术,成为了推动数控机床行业迈向智能制造的关键力量。 多摩协议编码器IC 多摩协议编
    的头像 发表于 07-18 17:11 1316次阅读

    中软国际在能源化工行业大模型项目取得重大突破

    近日,中软国际签约某大型石油企业大模型开发项目。作为中国能源化工行业首个备案的大模型,此次签约标志着中软国际在能源化工行业人工
    的头像 发表于 07-05 17:03 1628次阅读

    超低延时重构AI推理体验!白山云发布“大模型API”产品

    白山云科技正式发布“大模型API”产品,首发上线DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B、Qwen3-32B-FP8等大语言模型。基于白山全
    的头像 发表于 07-02 17:26 1331次阅读
    超低延时重构AI推理体验!白山云<b class='flag-5'>发布</b>“大<b class='flag-5'>模型</b><b class='flag-5'>API</b>”产品

    使用Openvino™ GenAI运行Sdxl Turbo模型时遇到错误怎么解决?

    使用 OpenVINO™ GenAI 运行 SDXL Turbo 模型。 遇到的错误: RuntimeError :- Check ov_tokenizer || ov_detokenizer Neither tokenizer nor detokenizer model
    发表于 06-24 06:38

    京东工业大模型Joy industrial重磅发布

    近日,中国领先的工业供应链技术与服务企业京东工业于上海正式对外发布行业首个以供应链为核心的工业大模型Joy industrial。Joy industrial锁定工业场景,聚焦“供应链
    的头像 发表于 05-28 17:12 1120次阅读