首页
技术

可编程逻辑

MEMS/传感技术

嵌入式技术

模拟技术

控制/MCU

处理器/DSP

存储技术

EMC/EMI设计

电源/新能源

测量仪表

制造/封装

RF/无线

接口/总线/驱动

EDA/IC设计

光电显示

连接器

PCB设计

LEDs

汽车电子

医疗电子

人工智能

可穿戴设备

军用/航空电子

工业控制

触控感测

智能电网

音视频及家电

通信网络

机器人

vr|ar|虚拟现实

安全设备/系统

移动通信

便携设备

物联网

区块链

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充电桩

氮化镓

BLDC

逆变器

5G

电机控制
资源

技术文库

新品速递

电路图

元器件知识

电子百科

最新技术文章

元器件搜索引擎
下载

在线工具

常用软件

电子书

datasheet
专栏

电子说

专栏
社区

论坛

问答

小组

技术专栏

社区之星

试用中心

HarmonyOS技术社区

2023电子工程师大会
研究院
活动

设计大赛

硬创大赛

社区活动

线下会议

在线研讨会

小测验
学院

直播

课程
视频
企业号
工具

datasheet查询

免费评测试用

技术子站

搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

基于 Flexus X 实例云服务器的评测 - 大模型对比评测

大家好，我是雄雄，欢迎关注微信公众号：雄雄的小课堂

@TOC

写在前面

华为云 828，领 8280 元上云礼券，买高性能服务器！！！

这不，手里就拿到了一台 4 核 12G，10M 的 Flexus X 实例云服务器，拿到后，就想着测测它的性能，看看有没有官网说的那么神奇！！！

官网的活动地址在这里，领 8280 元券：点我查看

服务器配置情况

下面，简单的给大家看看我手里的这台服务器的配置，做个铺垫，待会儿给大家上大招！！！

cpu 的情况

内存情况

硬盘情况

拿到服务器后，我不想再装环境上浪费时间，所以就安装了个宝塔，这个面板在服务器中，占不了多少内存，但是方便了装环境，不用执行装环境的命令，只需要在软件商店中，找到需要安装的软件，点击后面的安装即可。

评测之前环境准备

在正式评测之前，我们需要准备以下环境：

1.docker，不会安装的可以自行百度

2.ollama，这个也很简单，执行个命令就完事儿了

假使我们这两个环境现在在云服务器上都安装成功啦。

那么，现在我们开始正式评测！！！

华为云 Flexus X 实例大模型评测

下面，我们开始基于华为云的 Flexus X 实例云服务器评测一下大模型，因为我们现在还不知道这款服务器能跑多大的模型，所以我们就先从小模型开始跑。

先来个小模型，下面我们可以直接使用 ollama 开始跑模型，大家进入 ollama 的官网，点击右上角的 model 菜单：

然后就能看到下面所有 ollama 支持的大模型啦。

找到 qwen2，我们可以看到下面的 tag 里面分别有：0.5B，1.5B，7B，72B，这几种。

千问 0.5B 大模型

下面，我们先以最小的为例，试试看看：（注意，模型的质量我们暂且不管，我们只评测响应速度以及 CPU 和内存的占用情况）

占用情况以宝塔面板上的统计图为例，待会儿给大家截图。

执行下面的命令，开始跑 0.5B 的大模型：

ollama run qwen2:0.5b

运行情况如下：

占用情况如下：

结论：0.5B 的大模型，可以看到，这个速度快的惊人，没说的，继续测下个大模型。

千问 1.5B 大模型

这次我们测 1.5B 的大模型，比 0.5B 的多 1，看看这款 Flexus X 实例云服务器的表现怎么样。

同样，执行下面的命令：

ollama run qwen2:1.5b

这里需要等待半天，让下载。

下载过程中，我们可以看看宝塔上的内存和 CPU 的占比情况。

基本上毫无压力，继续等待！！！

等待的过程有点漫长.....

开测！！！

看看占用情况：

结论：比较完美，感觉和 0.5B 的区别不是很大，就是下载的时候慢了点，整体表现很棒。

gemma2 的 2b 大模型

0.5B 和 1.5B 的我们都测试过了，大家也可以从上图中看的出来，一点压力都没有，响应速度也很快，嗖嗖的就回答完毕了，质量也还行，而且最主要的是服务器的性能完全是过剩的，没跑满，所以，我们接着加大力度测试。

现在我们测测 gemma2 的 2b 大模型，运行如下命令：

ollama run gemma2:2b

又到了等待的过程中了，总是这么漫长~

在下载模型的过程中，我们可以看看占用情况：

一点问题都没有，几乎没有占多少，现在我们继续等待。

等待完毕，开始问个问题测试一下：

效果展示情况：

资源占用情况：

结论：通过效果图 gif 中可以看的出来，响应要比 1.5B 的稍微慢了点儿，但是这个速度还是可以接受，不过内存占用稍微偏高了，由原来的 27 增加到了 34，倒是也能接受，毕竟模型的大小由原来的 900 多 M 到现在的 1.4G 了。

千问 7B 大模型

现在，我们继续增大模型，看看表现效果怎么样。

这次我们测一下千问的 7B 大模型，这是 2B 的 3 倍多，看看这款 Flexus X 实例云服务器跑 7B 的模型是个什么情况。

同样，执行下面的命令：

ollama run qwen2:7b

继续等待：

7B 的模型，已经到了 4G 多了，期待他能有个很好的表现。

现在是：2024 年 9 月 6 日 00:02:43，我的 7B 大模型还在下载中，已经困的不行了....

再等等....

终于等它下载完啦，一共 4.4G，等的我都快做梦啦。切记，如果有大文件上下传的场景，买服务器的时候一定要选择个大带宽的，我的这个是 10M 的带宽，感觉遇到大文件了，还是有点不足。

下面我们开始进行评测，首先还是老规矩，先运行看看效果：

资源占用情况：

结论：大家可以看看效果图中，可以发现，很明显，相比起 2B 1.5B 的这种小模型来比，7B 的模型，在响应方面确实是稍微慢了点儿，但是也没有慢到一个字一个字的往出蹦，还是可以接受的。资源占用情况的话，CPU 占用上升到了 50.4% ，内存在原来的 34 增加到了 49。也没有跑满服务器。

总结

先放一张各个大小的模型之间的对比吧，从 0.5B，到 1.5B，再到 7B，以及 72B。

大家可以从上图中看的出来，模型越大，params 就越大，本文我们通过对 0.5b,1.5b,2b,7b 这几个模型进行评测对比，总体来说，比我预想的要好很多，我以为 7b 的会卡的很，结果表现的很棒，这么看来，跑 8B 以内的模型是没有问题的。

在往上的大模型，可能会吃力，不过 8B 以内，其实小微企业足矣！！！

审核编辑黄宇

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

云服务器

云服务器

+关注

关注
0

文章
840

浏览量
14747
大模型

大模型

+关注

关注
2

文章
3773

浏览量
5273

评论

精选推荐
更多

文章

资料

帖子

芯擎首发5nm“龍鹰二号”! 200TOPS算力+7B大模型，2027年Q1量产适配

章鹰观察
12小时前

2521 阅读

磁传感器技术的主要类别与工作原理

圣邦微电子
14小时前

730 阅读

瑞芯微(EASY EAI)RV1126B OTG切换成U盘模式

广州灵眸科技有限公司
15小时前

708 阅读

一场假期里，三个Pura瞬间

脑极体
1天前

1099 阅读

AI工作站本地养龙虾！英特尔双芯混合算力，告别云端Token焦虑

章鹰观察
1天前

7181 阅读

HA8322TL型电话机电路原理图

南风一号
355

10积分

604下载

EMSCAN在电子产品设计中的应用

zunshi
1.13 MB

免费

0下载

ADI iCoupler技术大揭秘：隔离式RS-485

guozhixi
621KB

1积分

32下载

Pigeon安全邮件网关

陈超
0.07 MB

免费

0下载

Threema Web Threema的Web客户端

笼中雀
23.94 MB

2积分

1下载

【RA-Eco-RA4M2开发板评测】+ 光照强度检测

jinglixixi
6天前

1777 阅读

【RA-Eco-RA4M2开发板评测】+ 导航键模块及其性能测试

jinglixixi
8天前

2070 阅读

《电子发烧友电子设计周报》聚焦硬科技领域核心价值 26年第7期：2026.3.30--2025.4.15

电子人steve
11天前

2794 阅读

从零开始学硬件 <3>demo源码1.OceanOS-CM0-B1解读

jf_28912132
13天前

3834 阅读

从零开始学硬件 <4>demo源码2.OceanOS-CM0-B2解读

jf_28912132
13天前

3758 阅读

推荐专栏
更多

企业产品

资料

方案
更多

电子发烧友

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

电子发烧友

关于我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

张迎辉：mikezhang@elecfans.com

关注我们的微信

下载发烧友APP

机器人发烧友

版权所有 © 长沙勒克斯教育咨询有限公司

湖南省长沙市开福区月湖街道匍园路20号聚恒科技园1栋2301-1房
电子发烧友 （电路图） 电信与信息服务业务经营许可证：湘B2-20260003 湘ICP备2023036445号-105-1