0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

产品应用 | 小盒子跑大模型!英码科技基于算能BM1684X平台实现大模型私有化部署

英码科技 来源:英码科技 作者:英码科技 2024-06-14 16:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

当前,在人工智能领域,大模型在丰富人工智能应用场景中扮演着重要的角色,经过不断的探索,大模型进入到落地的阶段。而大模型在落地过程中面临两大关键难题:对庞大计算资源的需求和对数据隐私与安全的考量。为应对这些挑战,在边缘侧私有化部署大模型成为了一个有效的解决方案。

将大模型部署到边缘侧,不仅能够减少延迟和带宽消耗,使得大模型能够在边缘节点快速进行推理和应用;还能增强数据隐私保护,这对于维护企业的数据安全至关重要。

为响应市场需求,英码科技推出了基于算能BM1684X平台的大模型私有化部署产品方案,包括:边缘计算盒子IVP03X-V2、云边加速卡AIV02X和AIV03X,助力企业实现垂直大模型应用落地!

wKgaomZr_fqAdrBeAAbmBEryjaQ258.png

▎边缘计算盒子IVP03X-V2

IVP03X-V2是英码科技基于BM1684X推出的高性能边缘计算盒子,INT8算力高达32Tops,配置了16GB大内存,支持适配Llama2-7B/ChatGLM3-6B/Qwen-7B和SAM/StableDiffusion等大模型,是业内少数能同时兼容国内外深度学习框架,并且能够流畅运行大语言模型推理的边缘计算设备之一。

▎大模型推理加速卡AIV02X & AIV03X

AIV02X和AIV03X算力可达64 TOPS@INT8和72 TOPS@INT8,显存配置32GB和48GB,支持多芯分布式推理及支持大语言/提示型/图像生成模型等大模型推理;这两款云边大模型推理加速卡均可应用于边缘大语言、文生图等通用大模型、垂直行业私有模型的推理应用。

接下来,以英码科技IVP03X边缘计算盒子为例,为大家介绍实测大语言模型、文生图大模型的部署流程和效果演示:

英码科技IVP03X-V2实测大语言模型

一、前期准备工作

demo下载地址:

https://github.com/sophgo/sophon-demo

二、大模型内存配置

1、建一个存放工具的文件夹:

mkdir memedit && cd memedit


2、下载内存配置工具:

wget -nd https://sophon-file.sophon.cn/sophon-prod-s3/drive/23/09/11/13/DeviceMemoryModificationKit.tgz tar xvf DeviceMemoryModificationKit.tgz cd DeviceMemoryModificationKit tar xvf memory_edit_{vx.x}.tar.xz #vx.x是版本号 cd memory_edit

3、重配内存:

./memory_edit.sh -p #这个命令会打印当前的内存布局信息 ./memory_edit.sh -c -npu 7615 -vpu 3072 -vpp 3072 #npu也可以访问vpu和vpp的内存 替换emmbboot.itb: sudo cp /data/memedit/DeviceMemoryModificationKit/memory_edit/emmcboot.itb /boot/emmcboot.itb && sync

4、重启生效:

reboot 重启后,检查配置: free -h cat /sys/kernel/debug/ion/bm_npu_heap_dump/summary | head -2 cat /sys/kernel/debug/ion/bm_vpu_heap_dump/summary | head -2 cat /sys/kernel/debug/ion/bm_vpp_heap_dump/summary | head -2

三、实测Chat-GLM3大模型(英文模式)

1、demo下载(Chat-GLM3)

进到Chat-GLM2案例目录下:sophon-demo-release/sample/Chat-GLM2/

安装pip3,安装dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下载模型:

sudo apt install unzip chmod -R +x scripts/ ./scripts/download.sh

2、安装依赖

安装python依赖:

pip3 install -r python/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ Sail安装包,下载安装: python3 -m dfss --url=open@sophgo.com:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl pip3 install sophon_arm-3.7.0-py3-none-any.whl

3、大模型运行测试:

python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_int4.bmodel --token python/token_config --dev_id 0 python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_int8.bmodel --token python/token_config --dev_id 0 python3 python/chatglm3.py --bmodel models/BM1684X/chatglm3-6b_fp16.bmodel --token python/token_config --dev_id 0

9

四、实测Qwen大模型(中文模式)

1、demo下载(Qwen)

进到Chat-GLM2案例目录下:sophon-demo-release/sample/Qwen/

安装pip3,安装dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下载模型:

sudo apt install unzip chmod -R +x scripts/ ./scripts/download.sh

2、安装依赖

安装python依赖:

pip3 install -r python/requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ Sail安装包,下载安装: python3 -m dfss --url=open@sophgo.com:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl pip3 install sophon_arm-3.7.0-py3-none-any.whl

3、大运行测试:

python3 python/qwen.py --bmodel models/BM1684X/qwen-7b_int4_1dev.bmodel --token python/token_config --dev_id 0 python3 python/qwen.py --bmodel models/BM1684X/qwen-7b_int8_1dev.bmodel --token python/token_config --dev_id 0

英码科技IVP03X-V2实测文生图大模型

1、demo下载(StableDiffusionV1_5)

进到Chat-GLM2案例目录下:sophon-demo-release/sample/Qwen/

安装pip3,安装dfss

sudo apt install python3-pip pip3 install dfss -i https://pypi.tuna.tsinghua.edu.cn/simple/ pip3 install dfss --upgrade

下载模型:

sudo apt install unzip chmod -R +x scripts/ ./scripts/download_controlnets_bmodel.sh ./scripts/download_multilize_bmodel.sh ./scripts/download_singlize_bmodel.sh

2、安装依赖

安装python依赖:

pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ 安装sail包 python3 -m dfss --url=open@sophgo.com:sophon-demo/ChatGLM3/sail/soc/sophon_arm-3.7.0-py3-none-any.whl

3、大模型运行测试:

①文本生成图像

迭代20次

python3run.py--model_path../models/BM1684X--stagesinglize--prompt"Aparrotrestingonabranch"--neg_prompt"worstquality"--num_inference_steps20--dev_id0

迭代500次

python3 run.py --model_path ../models/BM1684X --stage singlize --pr ompt "A parrot resting on a branch" --neg_prompt "worst quality" --num_inference_steps 500 --dev_id 0

wKgZomZr_zWAOsD4AA-bPEXwDNo060.png

② Controlnet插件辅助控制 生成图像

一只小兔子晚上在酒吧喝酒 :迭代次数,20次

python3 run.py --model_path ../models/BM1684X --stage multilize --controlnet_name scribble_controlnet_fp16.bmodel --processor_name scribble_processor_fp16.bmodel --controlnet_img ../pics/generated_img.jpg --prompt "a rabbit drinking at the bar at night" --neg_prompt "worst quality" --num_inference_steps 100 --dev_id 0

一只小兔子晚上在酒吧喝酒 :迭代次数,200次

python3 run.py --model_path ../models/BM1684X --stage multilize --controlnet_name scribble_controlnet_fp16.bmodel --processor_name scribble_processor_fp16.bmodel --controlnet_img ../pics/generated_img.jpg --prompt "a rabbit drinking at the bar at night" --neg_prompt "worst quality" --num_inference_steps 200 --dev_id 0

wKgaomZr_0iAARqMABC_rCt6XA0763.png

结语

随着大模型技术的不断落地和应用,大模型涌现的强大能力不再局限于云端,模型的算法正逐渐向边缘端延伸;未来,英码科技将结合自身在软硬件方面的技术优势和丰富的经验,以AI赋能更多企业低门槛、高效落地边缘侧大模型应用,从而推动各行业智能化转型的进程。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    89

    文章

    38153

    浏览量

    296810
  • 人工智能
    +关注

    关注

    1813

    文章

    49746

    浏览量

    261602
  • 大模型
    +关注

    关注

    2

    文章

    3446

    浏览量

    4972
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    国产超新星|EA500I PRO智能工作站:小盒子大能量,千元级解锁大模型

    随着AI从小模型向大模型的加速渗透,力已成为企业构建智能力的核心关键。对于渴望切入AI赛道的中小企业,既具备成本优势又能快速部署的边缘计
    的头像 发表于 11-11 10:53 1134次阅读
    国产超新星|EA500I PRO智能工作站:<b class='flag-5'>小盒子</b>大能量,千元级解锁大<b class='flag-5'>模型</b>

    AI边缘盒子TS-SG-SE7系列产品规格书

    是基于国产嵌入式ARM架构、超强力SoC芯片BM1684/BM1684X开发的AI边缘
    发表于 10-27 17:31 0次下载

    AI力模组TS-SG-SM7系列产品规格书

    腾视科技AI力模组TS-SG-SM7搭载了AI芯片BM1684X,支持多模态大模型,可集成于边缘计算盒、智能NVR、机器人、无人机等,
    发表于 10-27 17:15 0次下载

    Qwen3-VL 4B/8B全面适配,BM1684X成边缘最佳部署平台

    BM1684X上完成Qwen3-VL4B/8B模型的适配,推理速度13.7/7.2tokens/s,使其成为边缘部署多模态大
    的头像 发表于 10-16 18:00 1750次阅读
    Qwen3-VL 4B/8B全面适配,<b class='flag-5'>BM1684X</b>成边缘最佳<b class='flag-5'>部署</b><b class='flag-5'>平台</b>!

    DeepSeek模型如何在云服务器上部署

    随着大型语言模型(LLM)的应用日益普及,许多开发者和企业希望将像DeepSeek这样的优秀模型部署到自己的云服务器上,以实现私有化、定制
    的头像 发表于 10-13 16:52 572次阅读

    腾视科技大模型一体机解决方案:低成本私有化落地,重塑行业智能应用新格局

    当大模型进入 “深水区”,私有化与低成本已成为企业选型的核心考量。腾视科技大模型一体机解决方案,用技术创新打破 “安全与成本不可兼得” 的困境,让各行业都能轻松拥抱智能时代。以低成本、私有化
    的头像 发表于 08-07 11:06 1714次阅读
    腾视科技大<b class='flag-5'>模型</b>一体机解决方案:低成本<b class='flag-5'>私有化</b>落地,重塑行业智能应用新格局

    润和软件AIRUNS 3.0助力企业打造私有化AI模型

    ”)打造企业级全流程AI模型工艺平台——AIRUNS 3.0,深度适配国产软硬件,实现从数据接入到模型落地的高效闭环,助力企业加速AI工程
    的头像 发表于 06-28 17:03 1288次阅读

    AIBOX 产品矩阵:支持主流大模型私有化部署,满足个性 AI 应用需求

    AIBOX系列产品具备高性能、低功耗、环境适应性强等特点,力覆盖6-157TOPS,通过搭配多样深度学习算法,体积小巧,能够支持主流大模型私有
    的头像 发表于 06-25 16:32 1433次阅读
    AIBOX <b class='flag-5'>产品</b>矩阵:支持主流大<b class='flag-5'>模型</b>的<b class='flag-5'>私有化</b><b class='flag-5'>部署</b>,满足个性<b class='flag-5'>化</b> AI 应用需求

    企业部署AI大模型怎么做

    当下,AI大模型已成为驱动决策自动、服务智能产品创新的核心引擎。然而,企业面对动辄数百亿参数的大模型
    的头像 发表于 06-04 09:26 683次阅读

    阿普奇工控机私有化部署Deepseek:平衡性能、成本、应用三者的优选硬件方案

    的竞争格局,它不仅加速了生产模式的智能升级,其开源模式与低成本特性,使中小企业能以更低门槛接入AI能力, 推动行业从“经验驱动”向“数据智能驱动”转型 。 但对企业而言,私有化部署Deepseek更具备战略必要性: 其一 ,
    的头像 发表于 03-06 13:22 737次阅读
    阿普奇工控机<b class='flag-5'>私有化</b><b class='flag-5'>部署</b>Deepseek:平衡性能、成本、应用三者的优选硬件方案

    昇腾推理服务器+DeepSeek大模型 技术培训在图为科技成功举办

    与DeepSeek大模型的全面融合应用即将迈入实质性落地的新阶段。 昇腾加持DeepSeek大模型私有化部署 华为讲师李文童提到,DeepSeek大
    的头像 发表于 02-26 17:38 1060次阅读
    昇腾推理服务器+DeepSeek大<b class='flag-5'>模型</b> 技术培训在图为科技成功举办

    云轴科技ZStack智塔携手昇腾AI实现DeepSeek模型部署

    DeepSeek为人工智能AI产业带来一场革命,为企业级AI应用私有化部署场景(Private AI)注入强劲动力。作为企业级私有化AI Infra平台,云轴科技ZStack智塔携手昇
    的头像 发表于 02-18 09:59 1247次阅读
    云轴科技ZStack智塔携手昇腾AI<b class='flag-5'>实现</b>DeepSeek<b class='flag-5'>模型</b><b class='flag-5'>部署</b>

    京东云正式上线DeepSeek系列模型

    实际需求,在京东云官网上轻松实现一键部署。通过进入言犀AI开发计算平台的“AI资产市场”,开发者和企业可以便捷地选用DeepSeek系列模型,进行快速调用和应用。 为了满足不同场景下的
    的头像 发表于 02-06 14:25 800次阅读

    基于 Flexus 云服务器 X 实例的应用场景 - 私有化部署自己的笔记平台

    ,为其他人提供一些便利帮助。 一般记录自己笔记的方式有好多种,比如在开源的博客平台上发布,比如 CSDN,博客园,51CTO 博客、公众号等。另一种方式就是:自己部署一款私有化的笔记平台
    的头像 发表于 01-02 09:55 650次阅读
    基于 Flexus 云服务器 <b class='flag-5'>X</b> 实例的应用场景 - <b class='flag-5'>私有化</b><b class='flag-5'>部署</b>自己的笔记<b class='flag-5'>平台</b>

    AI模型部署边缘设备的奇妙之旅:目标检测模型

    并非易事,它涉及到从选择合适的算法架构到针对特定硬件平台进行优化等一系列复杂的工作。 接下来,我们将详细介绍如何在资源受限的边缘设备上成功部署目标检测模型,探索其背后的原理和技术,并讨论解决该领域内常见
    发表于 12-19 14:33