0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

2024年AI开发者中间件工具生态全面总结

OSC开源社区 来源:OSC开源社区 2025-02-14 09:45 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

最近,开源中国 OSCHINA、Gitee 与 Gitee AI联合发布了《2024 中国开源开发者报告》。 报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。

在第二章《TOP 101-2024 大模型观点》中,生成式 AI 开发者莫尔索总结了 2024 年 AI 开发者中间件工具生态。

全文如下:

AI 开发者中间件工具生态 2024 年总结

文 / 莫尔索 AI 应用开发者工具自下而上涵盖了模型托管与推理服务、代理工作流编排、大型模型应用的监控与追踪、模型输出的可控性以及安全工具等多个层面。模型是 AI 应用的核心组成部分,其服务需依赖推理引擎实现。开发者接入模型的方式大致可分为四类:

首先是以模型初创企业为代表,提供先进的商业闭源模型,如 OpenAI、Anthropic、智谱及 MiniMax 等。

其次是由 TogetherAI、Groq、Fireworks、Replicate、硅基流动等组成的 GPU 推理集群服务提供商,它们处理扩展与缩减等技术难题,并在基本计算费用基础上收取额外费用,从而让应用公司无需承担构建和管理 GPU 推理集群的高昂成本,而是可以直接利用抽象化的 AI 基础设施服务。

第三类是传统的云计算平台,例如亚马逊的 Amazon Bedrock、阿里云百炼平台、微软的 Azure AI、谷歌 Vertex AI 等,允许应用开发者轻松部署和使用标准化或定制化的 AI 模型,并通过 API 接口调用这些模型。

最后一类是本地推理,SGLang、vLLM、TensorRT-LLM 在生产级 GPU 服务负载中表现出色,受到许多有本地托管模型需求的应用开发者的欢迎,此外,Ollama 和 LM Studio 也是在个人计算机上运行模型的优选方案。

除模型层面外,应用层面的工具同样在快速发展,工具的进步紧密跟随 AI 应用的发展趋势。自 ChatGPT 发布以来,应用构建方式大致经历了三个阶段。

首先是基于单一提示词模板的聊天助手类应用,此阶段重点关注模型和提示词的安全性以及模型输出的可控性。例如,garak 可用于检测模型幻觉、数据泄露和生成毒性内容等问题;rebuff 则针对提示词注入进行检测;DSPy 框架提供了系统高效的编程方法,帮助解决应用开发中的提示编写问题;而 LMFormat Enforcer、Guidance 及 Outlines 等项目旨在帮助开发者控制模型输出的结构,以获得高质量的输出。

第二个阶段涉及通过组合一系列提示词和第三方工具或 API 来编排复杂的工作流,这是目前成熟的 AI 应用构建思路之一。值得注意的是,RAG 技术的出现,得益于大语言模型天然适合处理知识密集型任务,RAG 通过从外部记忆源检索相关信息,不仅提高了模型生成的精确性和相关性,还解决了大语言模型在数据隐私保护、实时数据处理和减少幻觉问题等方面的局限。RAG 技术在数据预处理和索引构建方面的努力,直接影响最终应用的效果。 尤其是在本地数据预处理方面,PDF 内容处理成为一大难点,众多开源项目应运而生,如基于传统 OCR 技术和版面分析的 Unstructured 和 Marker 库,以及结合了多模态大模型识别能力的 ZeroX 和 GPTPDF 库。

此外,还有融合了 OCR 和多模态大模型方案的 PDF-Extract-API 库。在公开在线数据处理方面,Jina Reader、Crawl4AI 和 Markdowner 等开源项目,能够将网页内容转换成适合大模型处理的上下文,从而利用最新信息提升问题回答的质量。这些项目的共同目标是将原始数据转化为有价值的资产,助力企业大规模部署 AI。 对于结构化数据,如对话历史记录和其他数据源的存储管理同样重要。向量数据库如 Chrom、Weaviate、Pinecone、Milvus 等,提供了语义检索和向量存储功能,使得 AI 应用能够利用超出模型上下文限制的数据源。传统数据库 PostgreSQL 现在也支持通过 pgvector 扩展进行向量搜索,基于 PostgreSQL 的公司如 Neon 和 Supabase 为 AI 应用提供了基于嵌入的搜索和存储解决方案。 为了有效管理 AI 应用的复杂工作流程,市场上涌现了 Dify、Wordware、扣子等低代码平台,它们集成了多种大模型,支持外部数据接入、知识库管理和丰富的插件库,通过拖拽式配置帮助初学者快速构建 AI 应用。 同时,在开源生态系统中,LangChain、Haystack、Semantic Kernel 等编排框架的出现,使开发者能够构建、定制和测试 Pipeline,确保这些 Pipeline 的组合能够达到特定应用场景的最佳生成效果。 对于 RAG 应用,这是一种由多个环节构成的工作流应用,出现了许多端到端的开源解决方案,如 LlamaIndex 框架,它集成了数据预处理、索引构建、 多样化检索方法等功能,专为大语言模型设计;RAGFlow 是一个基于深度文档理解的开源 RAG 引擎,提供高质量的问答能力,适用于处理大规模的复杂格式数据;Verba 是向量数据库厂商 Weaviate 开源的一个模块化 RAG 框架,允许开发者根据不同的应用场景灵活定制 RAG 应用的不同环节。

第三个阶段,一些产品团队正探索开发完全由大模型驱动的代理应用。这类代理应用具备从历史记忆中反思、自主规划和使用工具执行特定动作的能力。大语言模型负责选择要调用的工具及其参数,而具体的执行动作则在沙箱环境中进行,以确保安全。 E2B、Modal 等服务提供商正是为了满足这一需求而诞生。代理通过 OpenAI 定义的 JSON 模式调用工具,这使得代理和工具能够在不同的框架中兼容,促进了代理工具生态系统的增长。例如,Composio 是一个支持授权管理的通用工具库,Exa 则提供了一个专门用于网络搜索的工具。随着更多代理应用的构建,工具生态系统将持续扩展,提供更多新功能,如认证和访问控制。 在代理应用中,记忆管理同样关键。开源项目 Mem0 将记忆分为短期记忆和长期记忆,后者进一步细分为事件记忆、语义记忆和程序记忆,并基于此抽象出一套记忆管理 SDK。Zep 通过时态知识图谱管理和更新用户信息,跟踪事实变化并提供最新数据线索。MemGPT 借鉴了计算机操作系统内存管理机制,模拟虚拟内存工作原理,构建了一套记忆管理系统。这些项目使 AI 应用能够记住对话历史,提供更个性化、上下文感知的交互体验,极大地增强了用户的满意度。

此外,代理应用的另一个探索方向是多个代理之间的协同工作。开源社区中出现了许多解决方案,如 CrewAI 和 AutoGen 具备原生的多代理通信抽象,而 LangGraph 和 Letta 中的代理可以互相调用,良好的多代理系统设计使得跨代理协作变得更加容易实现。 鉴于生成模型本质上是一个概率黑盒,AI 应用作为一个复杂的系统,其在生产环境中的质量评估与监控尤为重要。实际应用中最大的挑战之一就是输出结果的不确定性。 面对这些挑战,需要采用科学的评估方法。LangSmith、Arise、Langfuse、Ragas 和 DeepEval 等项目提供了评估和监控所需的各种指标和工具,帮助开发者量化测量、监控和调试他们的 AI 应用系统。 展望未来,o1 模型的发布标志着大模型研究进入了新的时代。o1 模型的推理能力提升对 AI 基础设施提出了更高的要求,例如并行计算部分思维链路、减少不必要的思维过程等。研究的重点重新回到了算法层面,而非简单的算力堆砌,这对于中小型模型开发公司和学术界而言是一大利好。o1 模型的更强推理能力推动了越来越多真正的 autopilot 类产品进入⽇常生活,预示着 AI 技术将更加深入地融入人类社会的方方面面。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40919

    浏览量

    302511
  • 开发者
    +关注

    关注

    1

    文章

    779

    浏览量

    18059

原文标题:AI开发者中间件工具生态2024年总结

文章出处:【微信号:OSC开源社区,微信公众号:OSC开源社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    回望2025:与162万开发者一起,让AI硬件触手可及

    致每一位涂鸦开发者:2025农历年即将画上句号。这一AI浪潮席卷全球,AI硬件赛道迎来前所未有的机遇与挑战。而你们——162万涂鸦开发者
    的头像 发表于 02-12 18:59 361次阅读
    回望2025:与162万<b class='flag-5'>开发者</b>一起,让<b class='flag-5'>AI</b>硬件触手可及

    2025-2026MCU生态全景分析:国产替代的下一个战场是\"工具链\"

    ,帮助低功耗设计 CubeMX带来的变化: 学习周期缩短:从2-4周缩短到2-3天 开发效率提升:配置时间节省80% 开发者门槛降低:新手也能快速上手STM32 \"工具链即生态\&q
    发表于 01-27 08:54

    安霸推出开发者社区,拓展端侧AI生态版图

    安霸开发者社区为合作伙伴提供优先体验通道,助力其在安霸 AI SoC 及 Cooper 开发软件上评估、构建并大规模部署端侧 AI 应用。 美国加利福尼亚州圣克拉拉市2026
    的头像 发表于 01-09 08:37 525次阅读
    安霸推出<b class='flag-5'>开发者</b>社区,拓展端侧<b class='flag-5'>AI</b><b class='flag-5'>生态</b>版图

    2025华为开发者大赛暨开发者年度会议成功举办

    12月27日-12月28日,以“成就AI原生时代先锋开发者”为主题的2025华为开发者大赛暨开发者年度会议在上海华为练秋湖研发中心举办。本次会议旨在汇聚先锋
    的头像 发表于 12-31 13:32 963次阅读

    润和软件亮相2025开放原子开发者大会

    11月21-22日,2025开放原子开发者大会在北京圆满举行。大会以“一切为了开发者——AI共智,开源共享”为主题,聚焦人工智能与开源技术的深度融合,全面展现开源
    的头像 发表于 11-26 15:19 596次阅读

    2025开放原子开发者大会成功举办

    11月21日,2025开放原子开发者大会在京开幕。大会以“一切为了开发者——AI共智,开源共享”为主题,聚焦人工智能与开源技术的深度融合,全面展现开源
    的头像 发表于 11-25 17:19 1013次阅读

    华为云与开发者共赢AI未来

    ,与开发者共赢”主题演讲,详细阐述了华为云生态的最新进展,并宣布华为开发者空间全面升级,全新集成多种AI原生应用
    的头像 发表于 09-20 15:58 1801次阅读

    华为与全球开发者共赢昇腾生态

    在华为全联接大会2025期间,华为昇腾计算业务总裁张迪煊发表了“以开发者为中心,加速自主创新,共赢昇腾生态”的主题演讲,宣布CANN技术指导委员会正式成立,并表示昇腾将持续聚焦开发者诉求,围绕昇腾的开放性、易用性和兼容性进行架构
    的头像 发表于 09-20 15:57 2105次阅读

    AI赋能谷歌Chrome与Web工具全面升级

    2025 Google 谷歌开发者大会带来了最新 Web 工具,包括全面升级的 Chrome 开发体验、极大简化的 UI 开发,到云端两侧的
    的头像 发表于 08-29 09:33 1298次阅读

    超过200万开发者加入NVIDIA机器人技术生态

    已经有超过 200 万开发者加入 NVIDIA 机器人技术生态系统。这些开发者正在推动制造业、食品配送、农业、医疗健康、设施维护等众多行业的变革。 自 2014 NVIDIA Je
    的头像 发表于 08-21 19:47 2092次阅读
    超过200万<b class='flag-5'>开发者</b>加入NVIDIA机器人技术<b class='flag-5'>生态</b>

    迅龙软件参加昇腾 AI 开发者创享日・广东站,为开发者打造沉浸式实操体验

    7月18日,线下顶尖人才汇聚的开发者盛会——昇腾AI开发者创享日・广东站在广州举行。活动以“创未来享非凡”为主题,聚焦广东本地产业特点,分享前沿AI创新技术,搭建
    的头像 发表于 07-23 17:18 1413次阅读
    迅龙软件参加昇腾 <b class='flag-5'>AI</b> <b class='flag-5'>开发者</b>创享日・广东站,为<b class='flag-5'>开发者</b>打造沉浸式实操体验

    2025开发者必备的DevOps工具盘点:JetBrains IDE、Perforce P4、TESSY、Loom等

    2025开发者必备的工具盘点来啦!11款高效利器,涵盖IDE、版本控制、自动化构建、单元测试、AI编程助手等多个关键领域。来看看你的团队是否跟上趋势↓↓↓
    的头像 发表于 07-10 15:55 2306次阅读
    2025<b class='flag-5'>年</b><b class='flag-5'>开发者</b>必备的DevOps<b class='flag-5'>工具</b>盘点:JetBrains IDE、Perforce P4、TESSY、Loom等

    中科创达与ETAS推出预集成多域中间件解决方案

    近日,ETAS 与 ThunderSoft(中科创达)宣布双方建立了紧密合作关系,并将在今年6月24日至25日于路德维希堡举行的汽车电子大会上,联合展示其新开发的、面向高性能计算(HPC)SoC 车载系统的多域预集成中间件解决方案。
    的头像 发表于 06-25 10:16 1425次阅读

    华为正式启动HarmonyOS 6开发者Beta

    在2025华为开发者大会(HDC)上,华为正式启动HarmonyOS 6开发者Beta,并全面展示一多以来与合作伙伴共建鸿蒙
    的头像 发表于 06-24 15:42 978次阅读

    深开鸿CEO王成录:开发者是开源鸿蒙生态的原点

    发布会上表示:“操作系统的成功,取决于生态体系的竞争力。开源鸿蒙生态的建设,必须始于开发者。”他强调,开发者生态的原点,是推动技术演进与产
    的头像 发表于 05-26 12:06 1003次阅读
    深开鸿CEO王成录:<b class='flag-5'>开发者</b>是开源鸿蒙<b class='flag-5'>生态</b>的原点