0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

单日获客成本超20万,国产大模型开卷200万字以上的长文本处理

E4Life 来源:电子发烧友 作者:周凯扬 2024-03-27 00:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

电子发烧友网报道(文/周凯扬)随着AGI生态的蓬勃发展,各种支持多模态的大模型推陈出新,比如最近比较火的音乐大模型Suno和文生视频大模型Sora等等。然而在传统基于文本的大语言模型上,除了追求更快更精准的推理和高并发流量以外,似乎已经没有太多值得厂商大肆宣传的特性了,直到最近超长文本处理的爆火。

国产大模型的新卷法,长文本处理

当下将大模型长文本处理炒热的,无疑是来自月之暗面的Kimi。作为去年发布的大模型,Kimi的主要卖点就是长文本,当时发布的初版Kimi,就已经支持到最多20万汉字的输入处理。

然而仅仅20万字的文本处理,还不至于给用户带来质变的交互体验,毕竟GPT-4 Turbo-128k已经支持到约合10万汉字的长文本处理,谷歌的Gemini pro也支持到最多70万个单词的上下文,但不少长篇小说、专业书籍的字数要远超这一数字。

wKgZomYCneCAMb8qAAM8v3nPbSs784.jpg
Kimi支持200万字上下文 / 月之暗面

Kimi在最近爆火源于一项重大迭代升级,月之暗面将长文本处理的字数限制扩展到200万字,远超Claude3、GPT-4 Turbo和Gemini Pro模型。在新功能推出和有效推广下,Kimi很快涌入了一大批用户,其app甚至短暂地冲进了苹果App Store前五的位置。然而这样也对Kimi的运营造成了不小的压力,Kimi在上周经历了多次宕机,这还是在月之暗面对服务器连续扩容的前提下。

面对竞争对手Kimi的用户量激增,阿里巴巴和360很快就坐不住了。3月22日,阿里巴巴宣布通义千问将向所有用户免费开放1000万字的长文档处理功能;3月23日,360智脑宣布正式内测500万字长文本处理功能,且该功能即将入驻360 AI浏览器。

除了阿里巴巴和360外,目前国内访问量第一的百度文心一言据传也会在下月开放长文本处理功能,并计划把字数上限提高至200万甚至500万字。

超长文本实现的技术难点和商业桎梏

尽管在用户看来,阿里巴巴、360等厂商宣布支持超长文本处理好像是一件无需多少时间的易事,但实际上超长文本处理的实现存在不少技术痛点和商业成本问题。要知道在2022年,绝大多数的LLM上下文长度最多也只有2K,比如GPT-3。

直到GPT-4和Claude 2等,这些大模型才从架构上对文本长度进行了优化,可即便如此,主流的文本输入长度依然不会超过100K。这也是因为对部分大模型而言,长文本不一定代表着更好的使用体验,尤其是在查全率和准确率上。

wKgaomYCne6ABP4QAADkljohAv4132.png
Claude的上下文长度和召回率关联图 / Anthropic


以Anthropic给出的数据为例,从上图可以看出,随着文本长度的增加,召回率是在逐步降低的,即便是最新的Claude3也是如此,而召回率代表了检索出相关信息量占总量的比率。至于精确度,则与上下文中的事实位置存在很大的关系,如果用户问题的事实存在于文本开头或后半部分的位置,那么更容易得到精确的结果,而位于10%到50%之间位置的文本,则精确度急剧下降。

除此之外,长文本对于GPU和内存的资源消耗太大了,即便是小规模地扩展文本长度,动辄也要消耗100块以上的GPU或TPU,这里指代的GPU还是A100这种单卡显存容量高达40GB或80GB的设备。

这也是Kimi在经历大量用户访问后,需要紧急扩容的原因。而阿里巴巴之所以能这么快开放长文本能力,也是凭借着手握庞大的服务器资源。至于Anthropic,我们从Claude3 Opus高昂的Tokens价格,也可以猜到其硬件成本绝对不低。

另外,在持续火爆一年之后,目前的大模型应用也难以单纯靠技术立足市场吸引用户了,商业推广也已经成了必行之路。就以Kimi为例,在社交媒体上有关该应用的推广可谓铺天盖地,很明显对于新兴的大模型应用而言,收获第一批用户才是至关重要的。

据传Kimi在广告投放上,吸引每位新用户的花费在10元左右,而新用户参与到使用中带来的额外算力开销在12元至13元左右。如果单单只是根据手机平台app的下载量计算,那么Kimi的每日获客成本至少为20万人民币,而这还未计算来自网页端和小程序端的用户。

wKgZomYCnf2AOjdbAADS5hsoY5M413.png
AI产品国内总榜 / AI产品榜


而且Kimi的推广也不是从200万长文本功能的推出才开始的,早在二月份Kimi就开始以长文本这一特性加强商业推广了。从AI产品榜中可以看出,Kimi在2月的访问量飙升,在国内总榜中仅次于百度文心一言和阿里通义千问,足见其在商业推广和产品运营上都下了血本。但相对ChatGPT和New Bing之类的应用而言,其访问量还是存在很大的差距。

这也充分说明了为何国外的大模型应用没有去卷200K以上文本长度的原因,目前算力、准确度和长文本之间的冲突限制了他们去发展长文本。但这对于中国的大模型应用来说,反而是一个弯道超车的机会,因为大模型上的长文本能力确实带来了用户体验上的改变。

长文本对于用户体验的改变

国产大模型为什么要去卷长文本,这是一个与大模型应用落地息息相关的问题。在过去,正是由于长文本能力不足,绝大多数大模型应用才会给人不堪大用的感觉,比如虚拟助手由于长文本能力不足,会遗忘重要信息;基于大模型来设计剧本杀等游戏规则时,上下文长度不够只能在规则和设定上缩水,从而简化游戏难度;在论文分析和法律法规解读这样的关键领域,更是因为缺乏长文本的支持,无法给到用户精准的答案。

这与大模型卷参数规模不同,因为用户已经发现了即便是70B这个量级的大模型,在面对用户的问题时,也会出现胡编乱造的问题。反倒是长文本提供了更多的上下文信息,大模型在对语义进行分析判断后,会提供更加精确的答案,所以不少用户才会借助Kimi来分解长篇小说、总结论文等。

不过在享受长文本处理带来便利的同时,我们也应该注意下长文本处理背后潜在的信息安全和版权问题。对于过去短文本的处理,就已经存在一些可能暴露用户真实身份和隐私信息的问题,随着长文本支持对于更大文件和更长文本的处理,有的人可能会选择将合同、条例或标准等包含敏感信息的专业文件上传到大模型上,又或是引入一些盗版文档资源。

所以国家层面也开始出台各种管理办法,对于大模型语言模型在内的生成式人工智能进行规范,不能侵犯知识产权并保护个人隐私。如此一来,对于大模型应用本身的信息脱敏也提出了更高的要求。

写在最后

相信经过一年的大模型应用轰炸后,不少用户对于基本的AGI玩法已经玩腻了,所以长文本、文生视频这种新的交互方式才会让人趋之若鹜。但我们也很少看到成功的长文本大模型商业化落地项目,毕竟在高额的获客成本下,RAG这种外挂知识库的方式可能更适合手中资金有限的初创AGI应用开发商。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Agi
    Agi
    +关注

    关注

    0

    文章

    104

    浏览量

    10872
  • 大模型
    +关注

    关注

    2

    文章

    3863

    浏览量

    5296
  • LLM
    LLM
    +关注

    关注

    1

    文章

    351

    浏览量

    1409
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    效率跃升:将Gemini 3.1 Pro镜像站设为主力后,如何搭建自动化文本处理流水线

    国内AI深度用户早已不满足于“用上模型”,而是追求“用顺模型”。将Gemini 3.1 Pro固化为日常文本处理主力后,下一步自然是将重复性任务串成自动化流水线。目前无需特殊网络环境、每日提供免费
    的头像 发表于 05-06 10:16 487次阅读
    效率跃升:将Gemini 3.1 Pro镜像站设为主力后,如何搭建自动化<b class='flag-5'>文本处理</b>流水线

    工作流大模型节点说明

    用与端侧匹配版本的插件进行返回。 配置技能后,大模型节点的能力更接近一个独立运行的智能体,可以自动进行意图识别,并判断调用技能的时机和方式,大幅度提高此节点的文本处理能力和文本生成效果,简化
    发表于 03-19 14:56

    中科曙光3套scaleX集群落地国家算互联网郑州核心节点

    2月5日,由中科曙光提供的3套集群系统在国家算互联网郑州核心节点同时上线试运行,成为全国首个实现3卡部署、且实际投入运营的最大国产
    的头像 发表于 02-09 10:32 820次阅读

    Linux Shell文本处理神器合集:15个工具+实战例子,效率直接翻倍

    在 Linux 系统中,文本是数据交互的 “通用语言”—— 日志文件、配置文件、数据报表、程序输出几乎都以文本形式存在。手动编辑文本不仅繁琐,还容易出错,而掌握 Shell 文本处理
    的头像 发表于 02-03 15:42 3285次阅读
    Linux Shell<b class='flag-5'>文本处理</b>神器合集:15个工具+实战例子,效率直接翻倍

    Neway微波国产化替代方案

    关键技术指标上已与进口产品持平,同时采购成本降低30%-45%。通过优化拓扑结构和散热设计,国产模块在高温老化测试中展现出更稳定的性能曲线,MTBF(平均无故障时间)突破10小时。电源模块优化降低
    发表于 01-30 08:45

    部分能力超越2027年NVL576,中科曙光发布scaleX集群

    2025年12月18日,在昆山举行的光合组织2025人工智能创新大会(HAIC2025)上,中科曙光发布并展出了全球领先的大规模智能计算系统——scaleX集群,这也是国产卡级
    发表于 12-18 18:30 1214次阅读
    部分能力超越2027年NVL576,中科曙光发布scaleX<b class='flag-5'>万</b>卡<b class='flag-5'>超</b>集群

    禾赛科技激光雷达已累计交付200

    今日,全球激光雷达领导者禾赛科技(NASDAQ: HSAI;HKEX: 2525)宣布,公司累计第 200 台激光雷达已于 11 月中旬在禾赛麦克斯韦智造中心正式量产下线并交付客户。禾赛成为全球首个累计量产并交付
    的头像 发表于 11-17 15:47 2727次阅读

    万字长文AI智能体:17种体架构详细实现

    数据科学AI智能体领域发展迅猛,但许多资源仍然过于抽象和理论化。创建此项目的目的是为开发者、研究人员和AI爱好者提供一条结构化、实用且深入的学习路径,以掌握构建智能系统的艺术。
    的头像 发表于 11-07 13:16 846次阅读
    <b class='flag-5'>万字长文</b>AI智能体:17种体架构详细实现

    广和通成功部署DeepSeek-R1-0528-Qwen3-8B模型

    近日,广和通在MediaTek MT8893平台上成功部署并运行了DeepSeek-R1-0528-Qwen3-8B模型,显著提升了端侧AI设备的处理效率与智能化水平,特别是在本地化复杂文本处理
    的头像 发表于 09-26 13:35 1066次阅读

    3万字长文!深度解析大语言模型LLM原理

    我们正在参加全球电子成就奖的评选,欢迎大家帮我们投票~~~谢谢支持本文转自:腾讯技术工程作者:royceshao大语言模型LLM的精妙之处在于很好地利用数学解决了工业场景的问题,笔者基于过往工程经验
    的头像 发表于 09-02 13:34 3663次阅读
    3<b class='flag-5'>万字长文</b>!深度解析大语言<b class='flag-5'>模型</b>LLM原理

    产品拆解 | 添可芙“极”洗地机(上):AI 全向助力如何实现?

    2个滚轮电机、1个滚刷电机、1个风机、1个水泵,5个电机的电控和主控方案应该如何设计?“AI全向助力”怎么实现?元器件国产比例如何?本期拆解添可芙8月新品极洗地机的设计方案思路,看看国产
    的头像 发表于 08-25 16:24 3677次阅读
    产品拆解 | 添可芙<b class='flag-5'>万</b>“极<b class='flag-5'>客</b>”洗地机(上):AI 全向助力如何实现?

    产品拆解 | 添可芙“极”洗地机(下)

    收纳底座如何同时完成烘干、风干和充电三大功能?电池管理模块在充放电控制与安全保护上采用了怎样的设计?国产功率器件和控制芯片在其中的占比如何?本期拆解下篇聚焦添可芙洗地机的电源与BMS方案。 在
    的头像 发表于 08-25 16:23 2416次阅读
    产品拆解 | 添可芙<b class='flag-5'>万</b>“极<b class='flag-5'>客</b>”洗地机(下)

    小马智行L4域控制器路测200公里

    近日,小马智行宣布第七代Robotaxi所搭载的L4车规级域控制器已累计测试200公里。作为全球首个L4 Robotaxi车规级量产域控制器,200
    的头像 发表于 07-26 09:14 1362次阅读

    万字全文科普:什么是IP?

    半导体行业在一个复杂且快速发展的生态系统中运作,并由持续创新驱动。该生态系统的核心是半导体价值链,它包含几个关键阶段:芯片设计、晶圆制造、最终组装和原材料采购。每个阶段对于半导体器件的生产和功能都至关重要。IP提供商在这一框架中发挥着关键作用,尤其是在芯片设计阶段,该阶段是整个价值链的基础。他们提供专业的尖端技术,以增强创新、促进无缝集成、确保合规性并加快产
    的头像 发表于 07-21 09:53 1432次阅读
    <b class='flag-5'>万字</b>全文科普:什么是IP?

    万字长文】物联网的激荡二十年

    2005年11月,在突尼斯举办的信息社会世界峰会(WSIS)上,国际电信联盟(ITU)发布了一份名为《ITU互联网报告2005:物联网》,正式向世人展示了什么是“物联网(InternetofThings)”。虽然业界一致认为,1999年,麻省理工学院的KevinAshton首次提出”物联网”这一术语,但仅仅只是一个理念,没有成体系的解释,也无法形成共识。而I
    的头像 发表于 06-27 13:42 1786次阅读
    【<b class='flag-5'>万字长文</b>】物联网的激荡二十年