0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V 跑大模型(三):LLaMA中文扩展

澎峰科技PerfXLab 来源:澎峰科技PerfXLab 作者:澎峰科技PerfXLab 2023-07-17 17:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这是RISC-V跑大模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为LLaMA提供中文支持。

1.模型扩充

以下步骤在X86下进行:

1.1准备工作

安装最新版本的python和以下依赖库。

pip install protobuf==3.20.0 结构化数据存储格式
pip install transformers 把原版模型转换为HF格式
pip install sentencepiece 无监督的文本标记器和去标记器
pip install peft 使用LoRA的工具

1.2模型下载

下载LLaMA原版模型和中文扩充

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

中文扩充:

https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

下载后的目录如下:

wKgaomS1AoiAbJSYAACUfmvct_s083.pngwKgZomS1Ao6ACv0GAABF7DbXaIQ678.png

1.3合并模型

(1) 将LLaMA原版模型转换为Huggingface格式。这一步需要借助transformers提供的脚本convert_llama_weights_to_hf.py。

下载链接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

请执行以下命令:

python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir

命令解释:将原版LLaMA的tokenizer.model放在--input_dir指定的目录,其余文件放在${input_dir}/${model_size}下。执行以下命令后,--output_dir中将存放转换好的Huggingface版权重。

(2) 合并LoRA权重,生成Huggingface全量模型,这一步需要借助:merge_llama_with_chinese_lora.py。

下载链接:

https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py

执行命令:

python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir

命令解释:这一步的参数可以参照上一步。

2.移植模型

在完成前面的步骤后会得到一个path_to_output_dir的目录,目录内容如下:

wKgZomS1BGiAcPf6AAC6mGVvrpk862.png

将目录下的consolidate.00.path和params.json上传到RISC-V中的llama.cpp/models目录下,这一步可以借助scp来实现:scp “源文件路径” 账户@地址:目的路径。之后的步骤可以参考本系列的第二篇文章。链接如下:RISC-V 跑大模型(二):LLaMA零基础移植教程

最后的运行效果:

wKgZomS1BNiAJHVQAAIxHb8elDk082.png

3.结语

我们也为大家准备好已经扩展了中文的LLaMA供大家使用,只要扫描下面的二维码,进群即可获得下载地址。之后我们还会对LLaMA进行优化加速,敬请期待。

另外,RISC -V跑大模型系列文章计划分为四期:

1.RISC -V跑大模型(一)

2.RISC-V 跑大模型(二):LLaMA零基础移植教程

3.RISC-V跑大模型(三):LLaMA中文扩充(本篇)

4.更多性能优化策略。(计划)

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20148

    浏览量

    247113
  • RISC-V
    +关注

    关注

    48

    文章

    2792

    浏览量

    51898
  • 大模型
    +关注

    关注

    2

    文章

    3440

    浏览量

    4964
  • LLM
    LLM
    +关注

    关注

    1

    文章

    340

    浏览量

    1257
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探索RISC-V在机器人领域的潜力

    探索RISC-V在机器人领域的潜力 测评人:洄溯 测评时间: 2025年11月 测评对象: MUSE Pi Pro开发板(基于进迭时空K1系列高性能RISC-V CPU) 一、 开篇引言
    发表于 12-03 14:40

    【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地

    的 落地方案 : 1. 系统部署方案书 (System Proposal) 方案要点 部署工具 :使用官方提供的 spacemit-llama.cpp (v0.0.4) 二进制包。 模型策略 :采用
    发表于 11-27 14:43

    risc-v P扩展(一) P指令集简介

    解码、医学成像、计算机视觉、嵌入式控制、机器人技术、人机界面等。 P指令集扩展提高了RISC-V CPU IP产品的DSP算法处理能力。随着RISC-V P指令集扩展的增加,
    发表于 10-23 07:40

    RISC-V B扩展介绍及实现

    B扩展简介 RISCV B扩展指的是RISCV用于位运算加速的一个扩展指令集,目的是使用一条指令实现原本需要2-3条指令才能实现的位操作指令。具体包含内容如下: B扩展就是
    发表于 10-21 13:01

    RISC-V CPU 上 3 倍推理加速!V-SEEK:在 SOPHON SG2042 上加速 14B LLM

    关键词:V-SEEK、LLMInferenceOptimization、RISC-V、SOPHONSG2042、llama.cpp、NUMAOptimizationV-SEE
    的头像 发表于 08-05 14:01 1133次阅读
    <b class='flag-5'>RISC-V</b> CPU 上 3 倍推理加速!<b class='flag-5'>V</b>-SEEK:在 SOPHON SG2042 上加速 14B LLM

    RISC-V 的平台思维和生态思维

    Doorn 认为,RISC-V 扩展要拥抱 “平台思维” 和 “生态思维”。   在 7 月 17 日举办的第五届(2025)RISC-V 中国峰会主论坛上,Leendert van Doorn 谈到
    发表于 07-17 14:04 4086次阅读

    FPGA与RISC-V浅谈

    全球半导体产业竞争格局正在经历深刻变革,物联网、边缘计算等新兴技术的蓬勃发展,让RISC-V凭借其开源、精简以及模块化的灵活优势,日益成为业界焦点,也为全球半导体产业注入新的活力与挑战
    发表于 04-11 13:53 546次阅读
    FPGA与<b class='flag-5'>RISC-V</b>浅谈

    芯来科技亮相RISC-V Day Tokyo 2025

    RISC-V Day Tokyo 2025春季会议于日前在东京大学ITO国际研究中心顺利举行。The RISC-V Day Tokyo作为日本最大的RISC-V活动,汇集了众多优秀的RISC-
    的头像 发表于 03-03 14:07 1017次阅读

    关于RISC-V芯片的应用学习总结

    的核心优势在于其开源性、模块化、低功耗、高性能以及可扩展性。这些特性使得RISC-V芯片在物联网(IoT)、嵌入式系统、边缘计算以及高性能计算等领域具有独特竞争力。 在物联网领域,RISC-V芯片的低功耗
    发表于 01-29 08:38

    新的一年 RISC-V前景如何呢?

    1 月 7 日消息,RISC-V 领军企业 SiFive 成立中国分公司,中文名称定为“芯伍科技”。 1 月 14 日消息,专注传统与 AI 业务,Imagination 放弃 RISC-V CPU 开发。 新的一年,
    发表于 01-24 16:19

    RISC-V MCU技术

    嘿,咱来聊聊RISC-V MCU技术哈。 这RISC-V MCU技术呢,简单来说就是基于一个叫RISC-V的指令集架构做出的微控制器技术。RISC-V这个啊,2010年的时候,是加州大
    发表于 01-19 11:50

    risc-v芯片在电机领域的应用展望

    ,电机控制系统的需求将不断增长。RISC-V芯片凭借其灵活性和可扩展性,将能够很好地适应这些领域的变化,为电机控制提供更高效、更可靠的解决方案。 同时,RISC-V芯片在电机控制领域的创新也将不断推进
    发表于 12-28 17:20

    RISC-V芯片问题

    RISC-V高端芯片有哪些,目前生态怎样?
    发表于 12-27 16:41

    RISC-V架构及MRS开发环境回顾

    。其他的指令子集部分均为可选的模块,使得RISC-V具有了袖珍化、低能耗的特点。把代表扩展的字母附加到指令集名称之后,例如乘法(RV32M),单精度浮点(RV32F)和双精度浮点(RV32D),可扩展
    发表于 12-16 23:08

    RISC-V 与 ARM 架构的区别 RISC-V与机器学习的关系

    在现代计算机架构中,RISC-V和ARM是两种流行的处理器架构。它们各自具有独特的特点和优势,适用于不同的应用场景。 1. RISC-V架构 RISC-V(读作“risk-five”)是一种开源
    的头像 发表于 12-11 17:50 4346次阅读