0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何为Orca-2-13B创建一个与OpenAI兼容的API服务呢?

jf_wN0SrCdH 来源:Second State 2023-11-27 10:46 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Orca-2-13B[1] 是微软最新发布的 Orca 2 系列中的一款模型,Orca 2 另外还提供 7B 版本。Orca 2系列模型是由 LLAMA 2 基础模型中微调而来。Orca 2系列模型擅长推理、文本总结、数学问题解决和理解任务,是在原始 13B Orca 模型的基础上进一步发展而来,模仿更强大的 AI 系统推理过程从而提高小型模型在复杂任务中的能力。

本文将以 Orca-2-13B 为例,将介绍:

如何在你自己的设备上运行 Orca-2-13B

如何为 Orca-2-13B 创建一个与 OpenAI 兼容的 API 服务

你也可以使用同样的方式运行 Orca-2-7B 模型,只需要替换 Orca-2-7B模型的 GGUF 格式的下载链接。

我们将用 Rust + Wasm 技术栈来开发和部署这个模型的应用程序。无需安装复杂的 Python 包或 C++ 工具链!了解我们为什么选择 Rust+Wasm 技术栈[2]。

在自己的设备上运行 Orca-2-13B

步骤 1:通过以下命令行安装 WasmEdge[3]。

curl-sSfhttps://raw.githubusercontent.com/WasmEdge/WasmEdge/master/utils/install.sh|bash-s----pluginwasi_nn-ggml

步骤 2:下载模型 GGUF 文件[4]。由于模型文件有几 GB,所以可能需要很长时间。

curl-LOhttps://huggingface.co/second-state/Orca-2-13B-GGUF/resolve/main/Orca-2-13b-ggml-model-q4_0.gguf

步骤 3:下载一个跨平台的可移植 Wasm 文件,用于聊天应用。该应用能让你用命令行与模型进行交流。戳这里[5]查看该应用的 Rust 源代码。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/chat/llama-chat.wasm

就这样。接下来,可以通过输入以下命令在终端与模型进行聊天。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13b-ggml-model-q4_0.ggufllama-chat.wasm-pchatml-s'YouareOrca,anAIlanguagemodelcreatedbyMicrosoft.Youareacautiousassistant.Youcarefullyfollowinstructions.Youarehelpfulandharmlessandyoufollowethicalguidelinesandpromotepositivebehavior.'--stream-stdout

这个可移植的 Wasm 应用会自动利用你设备上的硬件加速器(如 GPU)。

在我的 Mac M1 32G 内存设备上,它的速度约为每秒 9.15 个token。

[USER]:What isanOrca?

[ASSISTANT]:
Anorca,orkillerwhale,isalargetoothedpredatorbelongingtotheoceanicdolphinfamily.Theyarehighlyintelligentandsocialanimals,knownfortheircuriosityandplayfulness.

[USER]:

为 Orca-2-13B 创建一个与 OpenAI 兼容的 API 服务

一个与 OpenAI 兼容的网络 API 能让 Orca-2-13B 与大量的 LLM 工具和代理框架(如 flows.network、LangChain 和 LlamaIndex)一起工作。

首先,先下载一个 API 服务器应用。它也是一个可以在许多 CPU 和 GPU 设备上运行的跨平台可移植 Wasm 应用。

curl-LOhttps://github.com/second-state/llama-utils/raw/main/api-server/llama-api-server.wasm

然后,使用以下命令行启动模型的 API 服务器。

wasmedge--dir.:.--nn-preloaddefaultAUTO:Orca-2-13B.Q5_K_M.ggufllama-api-server.wasm-pchatml

从另一个终端,你可以使用 curl 与 API 服务器进行交互。

curl-XPOSThttp://0.0.0.0:8080/v1/chat/completions-H'accept:application/json'-H'Content-Type:application/json'-d'{"messages":[{"role":"system","content":"YouareahelpfulAIassistant"},{"role":"user","content":"WhatisthecapitalofFrance?"}],"model":"Orca-2-13B"}'

就这样。WasmEdge 是运行 Orca-2-13B 大模型应用程序最简单、最快、最安全的方式[6]。试试看吧!





审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • C++语言
    +关注

    关注

    0

    文章

    147

    浏览量

    7774
  • python
    +关注

    关注

    58

    文章

    4885

    浏览量

    90301
  • 硬件加速器
    +关注

    关注

    0

    文章

    43

    浏览量

    13548
  • Rust
    +关注

    关注

    1

    文章

    241

    浏览量

    7649
  • OpenAI
    +关注

    关注

    9

    文章

    1249

    浏览量

    10277

原文标题:跨设备运行微软最新大语言模型 Orca-2-13B,只需4个命令行

文章出处:【微信号:Rust语言中文社区,微信公众号:Rust语言中文社区】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    【飞凌嵌入式RV1126B开发板试用体验】+ 4. “小龙虾”openClaw部署(2)--openClaw部署和测试

    本帖最后由 slmxiaodai_163 于 2026-3-23 15:45 编辑 接着 第篇:【飞凌嵌入式RV1126B开发板试用体验】+ 1. 开发环境搭建https
    发表于 03-23 10:56

    1688按图搜索API技术实现详解

    ​ 在电商系统开发或货源查找工具中,按图搜索商品是项非常实用的功能。1688平台作为国内领先的B2B电商平台,提供了官方的按图搜索商品API接口。本文将详细讲解如何调用该接口。
    的头像 发表于 03-13 17:01 844次阅读
    1688按图搜索<b class='flag-5'>API</b>技术实现详解

    调用乐天平台API获取商品详情数据

    。 1. 准备工作 在开始调用API之前,你需要完成以下准备工作: 注册开发者账号 :访问乐天开发者门户,注册并创建开发者账号。 创建应用 :在开发者门户中创建
    的头像 发表于 02-02 16:25 334次阅读
    调用乐天平台<b class='flag-5'>API</b>获取商品详情数据

    1688交易APIB2B订单自动化,加速成交!

    ​ 在B2B电商领域,订单处理效率直接影响供应链响应速度。1688开放平台的交易API为商家提供了自动化订单管理能力,可显著缩短交易周期。本文将从技术实现角度解析核心功能与应用场景。 AP
    的头像 发表于 01-04 15:46 1024次阅读
    1688交易<b class='flag-5'>API</b>:<b class='flag-5'>B2B</b>订单自动化,加速成交!

    1688商品详情API指南

    、摘要 1688平台为开发者提供了完整的商品详情API接口,支持获取商品的详细信息、规格参数、价格库存等核心数据。基于您之前了解的工厂数据API,商品详情API
    的头像 发表于 12-11 11:09 911次阅读

    系统调用和API有什么区别

    很棒的功能模块,恰好我也想使用这个模块,但我又懒的去看你的代码,我只想使用你的代码,不像去关心实现细节,你想了想把所有的功能封装在了几个函数上,这几个函数就是这个功能模块对外提供的API。 现在
    发表于 12-03 06:52

    如何评价OpenRouter这样的大模型API聚合平台?

    我个人认为OpenRouter的商业模式特别优雅,大模型时代的轻资产 “卖水人”。 open router自己不训练模型,也不买显卡推理,他做的就是调用别家的API,聚合了各家的API成为
    的头像 发表于 10-28 10:04 732次阅读

    RESTful API设计原则: 构建易用、可扩展的API接口

    (Representational State Transfer)架构原则,构建易用、可扩展的API接口,帮助开发者创建经得起时间考验的服务、理解REST架构的核心约束 1.1
    的头像 发表于 10-20 13:45 1470次阅读

    什么是 API接口?

    API接口的工作原理理解 API接口最简单的方式,是从“请求-响应”模型入手: 1.客户端发起请求:比如在电商网站点击“使用支付宝付款”,此时系统会通过
    的头像 发表于 10-08 08:57 1198次阅读

    别再搜了!国内用户搞定OpenAI API Key的两种最佳实践(保姆级教程)

    需要国际卡? 拿到Key了,却不知道怎么在代码里安全地使用? 别慌,你遇到的坑,我都踩过。这篇教程就是你的避坑指南,我将以“技术学长”的身份,带你走通两条获取OpenAI API Key的路径,从注册到代码调用,帮你搞定!
    的头像 发表于 08-24 19:02 1.4w次阅读

    OpenAI发布2款开源模型

    OpenAI开源了两款高性能权重语言模型gpt-oss-120b和gpt-oss-20bOpenAI CEO Sam Altman表示:「gpt-oss 发布了!我们做了
    的头像 发表于 08-06 14:25 1145次阅读

    电商API的微服务架构优化策略

    ,电商API在高并发、低延迟和数据致性方面面临严峻挑战。本文将从基础概念出发,逐步分析优化策略,帮助开发者构建高性能、可靠的电商API系统。 1. 微服务架构在电商中的应用 微
    的头像 发表于 07-23 14:30 728次阅读
    电商<b class='flag-5'>API</b>的微<b class='flag-5'>服务</b>架构优化策略

    具有载波聚合的 RX 分集 FEM(B26、B8、B12/13B2/25、B4 和 B7) skyworksinc

    电子发烧友网为你提供()具有载波聚合的 RX 分集 FEM(B26、B8、B12/13B2/25、B
    发表于 06-19 18:35
    具有载波聚合的 RX 分集 FEM(<b class='flag-5'>B</b>26、<b class='flag-5'>B</b>8、<b class='flag-5'>B</b>12/<b class='flag-5'>13</b>、<b class='flag-5'>B2</b>/25、<b class='flag-5'>B</b>4 和 <b class='flag-5'>B</b>7) skyworksinc

    安卓原生兼容服务

    安卓原生兼容服务器的定义 安卓原生兼容服务器‌指基于Android系统内核和服务框架构建的服务
    的头像 发表于 06-19 17:32 673次阅读

    如何获取 OpenAI API Key?API 获取与代码调用示例 (详解教程)

    OpenAI API Key 获取与使用详解:从入门到精通 OpenAI 正以其 GPT 和 DALL-E 等先进模型引领全球人工智能创新。其 API 为开发者和企业提供了强大的 AI
    的头像 发表于 05-04 11:42 1.8w次阅读
    如何获取 <b class='flag-5'>OpenAI</b> <b class='flag-5'>API</b> Key?<b class='flag-5'>API</b> 获取与代码调用示例 (详解教程)