0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于北京迅为iTOP-RK3588大语言模型部署测试

迅为电子 来源:迅为电子 2024-04-07 16:01 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能AI)领域中的大模型(Large Model)逐渐成为研究的热点。大模型,顾名思义,是指拥有海量参数和高度复杂结构的深度学习模型。它的出现,不仅推动了AI技术的突破,更为各行各业带来了革命性的变化。

RK3588是瑞芯微推出的新一代旗舰级高端处理器,采用8nm工艺设计,搭载四核A76+四核A55的八核CPUArm高性能GPU,内置6T算力的NPU。能够高效地处理AI算法和模型,为大模型的运行提供了强大的硬件支持。

在北京迅为推出的搭载了RK3588处理器的iTOP-RK3588开发板上,使用RKLLM 工具套件支持在iTOP-RK3588平台上进行LLM(大型语言模型)模型的转换和部署。它与Hugging Face模型架构兼容(Hugging Face是广泛用于自然语言处理任务的模型架构。

目前,该系统支持以下模型:LLaMA、Qwen、Qwen2和Phi-2。支持量化技术,即使用w8a8(8位权重,8位激活)和w4a16(4位权重,16位激活)精度进行模型量化。这可以在目标平台上更高效地存储和计算模型,减小内存占用。

b85f52ba-f4b4-11ee-a297-92fbcf53809c.png

iTOP-RK3588开发板体验大模型

为了让用户更快速的体验RKLLM ,北京迅为已经对Linux内核源码中的NPU版本进行了升级,升级到了最新的0.9.6版本,具体如下所示:

b8777426-f4b4-11ee-a297-92fbcf53809c.jpg

默认以将RKLLM动态库集成在了Ubuntu和Debian系统中,用户可以直接拷贝转换完成的RKLLM大预言模型和推理程序进行测试。



审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20392

    浏览量

    255715
  • 人工智能
    +关注

    关注

    1821

    文章

    50547

    浏览量

    267925
  • GPU芯片
    +关注

    关注

    1

    文章

    308

    浏览量

    6583
  • RK3588
    +关注

    关注

    8

    文章

    606

    浏览量

    7745
  • 大模型
    +关注

    关注

    2

    文章

    3879

    浏览量

    5303

原文标题:更新 | 基于北京迅为iTOP-RK3588大语言模型部署测试

文章出处:【微信号:迅为电子,微信公众号:迅为电子】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    瑞芯微RK3588 RKNN模型推理环境部署与功能测试技巧(下)

    本文将介绍瑞芯微RK3588原厂RKNN端侧模型测试验证方法,而关于开发环境搭建可以查看先前文章。【测试环境说明】开发板系统:Ubuntu22.04开发环境:Ubuntu22.04虚
    的头像 发表于 05-07 11:31 258次阅读
    瑞芯微<b class='flag-5'>RK3588</b> RKNN<b class='flag-5'>模型</b>推理环境<b class='flag-5'>部署</b>与功能<b class='flag-5'>测试</b>技巧(下)

    瑞芯微RK3588 RKNN模型推理环境部署与功能测试技巧(上)

    触觉智能(RK方案商)分享瑞芯微RK3588RKNN端侧模型的开发环境搭建方法与测试方法。【测试环境说明】开发板系统:Ubuntu22.04
    的头像 发表于 04-21 10:37 1096次阅读
    瑞芯微<b class='flag-5'>RK3588</b> RKNN<b class='flag-5'>模型</b>推理环境<b class='flag-5'>部署</b>与功能<b class='flag-5'>测试</b>技巧(上)

    电子RK3568+RK3588开发板资料焕新升级!多维度优化助力开发者效率提升

    电子RK3568+RK3588开发板资料焕新升级!多维度优化助力开发者效率提升
    的头像 发表于 03-26 15:06 840次阅读
    <b class='flag-5'>迅</b><b class='flag-5'>为</b>电子<b class='flag-5'>RK3568+RK3588</b>开发板资料焕新升级!多维度优化助力开发者效率提升

    你的专属“数字员工”已到岗!RK3588系列开发板适配OpenClaw

    你的专属“数字员工”已到岗!RK3588系列开发板适配OpenClaw
    的头像 发表于 03-11 11:02 869次阅读
    你的专属“数字员工”已到岗!<b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>系列开发板适配OpenClaw

    你的专属“数字员工”已到岗!RK3588系列适配OpenClaw

    你的专属“数字员工”已到岗!RK3588系列适配OpenClaw
    的头像 发表于 02-27 15:33 915次阅读
    你的专属“数字员工”已到岗!<b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>系列适配OpenClaw

    【硬核搭档】RK3588成功适配飞牛FnNAS,你的私有云迎来性能猛兽!

    【硬核搭档】RK3588成功适配飞牛FnNAS,你的私有云迎来性能猛兽!
    的头像 发表于 02-25 15:43 1216次阅读
    【硬核搭档】<b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>成功适配飞牛FnNAS,你的私有云迎来性能猛兽!

    释放多屏潜能:RK3588开发板Android多屏同显开发完全指南

    释放多屏潜能:RK3588开发板Android多屏同显开发完全指南
    的头像 发表于 12-16 16:11 1222次阅读
    释放多屏潜能:<b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>开发板Android多屏同显开发完全指南

    【NPU实战】在RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南

    【NPU实战】在RK3588上玩转YOLOv8:目标检测与语义分割一站式部署指南
    的头像 发表于 12-12 14:30 6530次阅读
    【NPU实战】在<b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>上玩转YOLOv8:目标检测与语义分割一站式<b class='flag-5'>部署</b>指南

    RK3588开发板Android系统烧写及注意事项

    RK3588开发板Android系统烧写及注意事项
    的头像 发表于 12-03 15:17 7554次阅读
    <b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>开发板Android系统烧写及注意事项

    RK3588开发环境搭建“三步曲”,从零到一轻松上手!

    RK3588开发环境搭建“三步曲”,从零到一轻松上手!
    的头像 发表于 12-01 11:51 1477次阅读
    <b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>RK3588</b>开发环境搭建“三步曲”,从零到一轻松上手!

    iTOP-RK3568人工智能开发板mobilenet图像分类模型推理测试

    想快速验证MobileNet图像分类模型的实际运行效果?iTOP-RK3568人工智能开发板,让模型推理
    的头像 发表于 08-28 15:53 1645次阅读
    <b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>iTOP-RK</b>3568人工智能开发板mobilenet图像分类<b class='flag-5'>模型</b>推理<b class='flag-5'>测试</b>

    RK3588数据手册

    RK3588的资料
    发表于 08-01 16:08 59次下载

    北京itop-3588八核开发板瑞芯微NPU例程测试LPRNet车牌识别

    北京itop-3588八核开发板瑞芯微NPU例程测试LPRNet车牌识别
    的头像 发表于 07-23 14:14 1478次阅读
    <b class='flag-5'>北京</b><b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>itop-3588</b>八核开发板瑞芯微NPU例程<b class='flag-5'>测试</b>LPRNet车牌识别

    北京itop-3588开发板NPU例程测试deeplabv3 语义分割

    北京itop-3588开发板NPU例程测试deeplabv3 语义分割
    的头像 发表于 07-22 15:51 1220次阅读
    <b class='flag-5'>北京</b><b class='flag-5'>迅</b><b class='flag-5'>为</b><b class='flag-5'>itop-3588</b>开发板NPU例程<b class='flag-5'>测试</b>deeplabv3 语义分割

    RK3588开发板RKLLM-Toolkit 环境搭建安装 Miniconda

    Linux-aarch64 64-bit 两个版本的安装包进行下载,如下图所示: 为了方便,已经将两个安装包存放到了“iTOP-3588 开发板\\\\02_【iTOP-RK3588 开发板】 开发资料
    发表于 06-03 17:06