0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

RISC-V 跑大模型(三):LLaMA中文扩展

澎峰科技PerfXLab 来源:澎峰科技PerfXLab 作者:澎峰科技PerfXLab 2023-07-17 17:15 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

这是RISC-V跑大模型系列的第三篇文章,前面我们为大家介绍了如何在RISC-V下运行LLaMA,本篇我们将会介绍如何为LLaMA提供中文支持。

1.模型扩充

以下步骤在X86下进行:

1.1准备工作

安装最新版本的python和以下依赖库。

pip install protobuf==3.20.0 结构化数据存储格式
pip install transformers 把原版模型转换为HF格式
pip install sentencepiece 无监督的文本标记器和去标记器
pip install peft 使用LoRA的工具

1.2模型下载

下载LLaMA原版模型和中文扩充

LLaMA原版模型:

https://ipfs.io/ipfs/Qmb9y5GCkTG7ZzbBWMu2BXwMkzyCKcUjtEKPpgdZ7GEFKm/

中文扩充:

https://huggingface.co/ziqingyang/chinese-alpaca-lora-7b

下载后的目录如下:

wKgaomS1AoiAbJSYAACUfmvct_s083.pngwKgZomS1Ao6ACv0GAABF7DbXaIQ678.png

1.3合并模型

(1) 将LLaMA原版模型转换为Huggingface格式。这一步需要借助transformers提供的脚本convert_llama_weights_to_hf.py。

下载链接:https://github.com/huggingface/transformers/blob/main/src/transformers/models/llama/convert_llama_weights_to_hf.py

请执行以下命令:

python convert_llama_weights_to_hf.py --input_dir path_to_original_llama_root_dir --model_size 7B --output_dir path_to_original_llama_hf_dir

命令解释:将原版LLaMA的tokenizer.model放在--input_dir指定的目录,其余文件放在${input_dir}/${model_size}下。执行以下命令后,--output_dir中将存放转换好的Huggingface版权重。

(2) 合并LoRA权重,生成Huggingface全量模型,这一步需要借助:merge_llama_with_chinese_lora.py。

下载链接:

https://github.com/ymcui/Chinese-LLaMA-Alpaca/blob/main/scripts/merge_llama_with_chinese_lora.py

执行命令:

python merge_llama_with_chinese_lora.py --base_model path_to_original_llama_hf_dir --lora_model chinese-alpaca-lora-7b --output_dir path_to_output_dir

命令解释:这一步的参数可以参照上一步。

2.移植模型

在完成前面的步骤后会得到一个path_to_output_dir的目录,目录内容如下:

wKgZomS1BGiAcPf6AAC6mGVvrpk862.png

将目录下的consolidate.00.path和params.json上传到RISC-V中的llama.cpp/models目录下,这一步可以借助scp来实现:scp “源文件路径” 账户@地址:目的路径。之后的步骤可以参考本系列的第二篇文章。链接如下:RISC-V 跑大模型(二):LLaMA零基础移植教程

最后的运行效果:

wKgZomS1BNiAJHVQAAIxHb8elDk082.png

3.结语

我们也为大家准备好已经扩展了中文的LLaMA供大家使用,只要扫描下面的二维码,进群即可获得下载地址。之后我们还会对LLaMA进行优化加速,敬请期待。

另外,RISC -V跑大模型系列文章计划分为四期:

1.RISC -V跑大模型(一)

2.RISC-V 跑大模型(二):LLaMA零基础移植教程

3.RISC-V跑大模型(三):LLaMA中文扩充(本篇)

4.更多性能优化策略。(计划)

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20339

    浏览量

    255355
  • RISC-V
    +关注

    关注

    49

    文章

    2954

    浏览量

    53605
  • 大模型
    +关注

    关注

    2

    文章

    3797

    浏览量

    5280
  • LLM
    LLM
    +关注

    关注

    1

    文章

    350

    浏览量

    1397
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    RT-Thread 邀您参与“开放・连接”2026玄铁 RISC-V 生态大会,携手共铸 RISC-V“芯”纪元

    上海世博桐森酒店盛大启幕。此次玄铁RISC-V生态大会将同步设置2场分论坛,与主论坛形成「1+2」的创新洞见矩阵,届时大会全天将全景呈现RISC-V在AI大模型时代
    的头像 发表于 03-22 10:05 635次阅读
    RT-Thread 邀您参与“开放・连接”2026玄铁 <b class='flag-5'>RISC-V</b> 生态大会,携手共铸 <b class='flag-5'>RISC-V</b>“芯”纪元

    Powered by XuanTie,Qwen Inside:阿里通义大模型携手玄铁 RISC-V开启“端侧智能”新纪元

    在 AI 迈向“端边云协同”的新时代,大模型的价值不仅在于云端的超强算力,更在于能否高效、低成本地部署到千行百业的终端设备中。近日,阿里通义大模型与达摩院旗下玄铁 RISC-V 宣布将基于开源架构
    的头像 发表于 01-12 11:49 419次阅读
    Powered by XuanTie,Qwen Inside:阿里通义大<b class='flag-5'>模型</b>携手玄铁 <b class='flag-5'>RISC-V</b>开启“端侧智能”新纪元

    新思科技ARC-V处理器驱动RISC-V市场无限机遇

    从 2010 年美国加州大学伯克利分校的教授与他的研究生团队耗时个月完成 RISC-V 指令集的开发工作,到 2015 年,RISC-V 在学术界声名鹊起,再到 2025 年成为主流架构之一
    的头像 发表于 12-24 17:17 1510次阅读
    新思科技ARC-<b class='flag-5'>V</b>处理器驱动<b class='flag-5'>RISC-V</b>市场无限机遇

    探索RISC-V在机器人领域的潜力

    探索RISC-V在机器人领域的潜力 测评人:洄溯 测评时间: 2025年11月 测评对象: MUSE Pi Pro开发板(基于进迭时空K1系列高性能RISC-V CPU) 一、 开篇引言
    发表于 12-03 14:40

    【CIE全国RISC-V创新应用大赛】基于 K1 AI CPU 的大模型部署落地

    的 落地方案 : 1. 系统部署方案书 (System Proposal) 方案要点 部署工具 :使用官方提供的 spacemit-llama.cpp (v0.0.4) 二进制包。 模型策略 :采用
    发表于 11-27 14:43

    为什么RISC-V是嵌入式应用的最佳选择

    最近RISC-V基金会在社交媒体上发文,文章说物联网和嵌入式系统正在迅速发展,需要更高的计算性能、更低的功耗和人工智能。RISC-V是为未来而建的,包括超高效的MCU到高性能应用处理器,RISC-V使开发人员能够设计以下解决方案
    的头像 发表于 11-07 10:09 1868次阅读

    risc-v P扩展(一) P指令集简介

    解码、医学成像、计算机视觉、嵌入式控制、机器人技术、人机界面等。 P指令集扩展提高了RISC-V CPU IP产品的DSP算法处理能力。随着RISC-V P指令集扩展的增加,
    发表于 10-23 07:40

    RISC-V B扩展介绍及实现

    B扩展简介 RISCV B扩展指的是RISCV用于位运算加速的一个扩展指令集,目的是使用一条指令实现原本需要2-3条指令才能实现的位操作指令。具体包含内容如下: B扩展就是
    发表于 10-21 13:01

    RISC-V M扩展介绍

    乘法和无符号乘法,以及不同的位宽。因此,在使用乘法指令时,需要根据需要选择适当的指令形式。 二、RISC-V乘法指令扩展代码 mul rd, rs1, rs2# 将rs1和rs2的乘积存储在rd
    发表于 10-21 06:50

    十万元奖金池!首届全国RISC-V高水平创新及应用大赛火热进行中

    是基于进迭时空8核 RISC-V CPU K1芯片的单板计算机、具有大容量DRAM和存储空间、丰富通用接口部件和扩展接口,为机器人、边缘计算、AIOT等场景设计。具有2TOPS算力,配套本地大模型和视觉
    发表于 09-25 13:56

    RISC-V CPU 上 3 倍推理加速!V-SEEK:在 SOPHON SG2042 上加速 14B LLM

    关键词:V-SEEK、LLMInferenceOptimization、RISC-V、SOPHONSG2042、llama.cpp、NUMAOptimizationV-SEE
    的头像 发表于 08-05 14:01 1515次阅读
    <b class='flag-5'>RISC-V</b> CPU 上 3 倍推理加速!<b class='flag-5'>V</b>-SEEK:在 SOPHON SG2042 上加速 14B LLM

    RISC-V 手册

    以下是关于RISC-V的详细介绍,结合其核心技术特点与当前发展现状:核心概念RISC-V(第五代精简指令集)是一种基于精简指令集(RISC)的开源指令集架构(ISA),由加州大学伯克利分校于2010
    发表于 07-28 16:27 11次下载

    2025新思科技RISC-V科技日活动圆满结束

    新思科技深度参与2025 RISC-V中国峰会并于2025年7月16日举办同期活动“新思科技RISC-V科技日”技术论坛,聚焦“从芯片到系统重构RISC-V创新”主题,议题覆盖当前最前沿的技术领域
    的头像 发表于 07-25 17:31 1633次阅读

    RISC-V 的平台思维和生态思维

    Doorn 认为,RISC-V 扩展要拥抱 “平台思维” 和 “生态思维”。   在 7 月 17 日举办的第五届(2025)RISC-V 中国峰会主论坛上,Leendert van Doorn 谈到
    发表于 07-17 14:04 4241次阅读

    RISC-V和ARM有何区别?

    在微处理器架构领域,ARM与RISC-V是两个备受关注的体系。ZLG致远电子在推出ARM核心版后,又推出了基于RISC-V的MR6450核心版,这引发了人们对这两种架构差异的深入探讨。ARM
    的头像 发表于 06-24 11:38 2295次阅读
    <b class='flag-5'>RISC-V</b>和ARM有何区别?