0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

比Colab更方便的GPU平台-GPUlab

工程师邓生 来源:易心Microbit编程 作者:易心Microbit编程 2022-09-08 16:24 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

GPUlab是一个提供付费GPU的平台,其接口源自JupyterLab(一种升级版的Jupyternotebook),因此可透过网页接口提供完整的Python IDE接口,除了基本的Notebook,也有terminal、console可用,因此使用起来比起Colab更为方便。

该产品是由一家位于美国加州的Deasil Works公司所提供,主要业务提供AI、Data science等方面的技术咨询。

计费方式

45890192-2f4d-11ed-ba43-dac502259ad0.png

目前提供三种plan,但主要在于购买周期的差异,硬件及执行环境完全相同。三种计费周期为日、周、月,信用卡付款,期限到自动扣款续约。

提供的GPU执行环境

比较值得关心的是GPU执行环境及配置:

1.GPU硬件:Tesla K80 x1,11MB

2.CUDA 10.02

3.Ubuntu 18.04

4.Tensorflow 2.3

5.PyTorch 1.8

6.无法sudo (无root权限)

7.可使用terminal或jupyternotebook来执行程序,或管理/安装移除相关套件。

8.Storage空间无论任何方案皆为25GB。

9.环境及档案可持久保持,不像Colab,Kaggle在超过时数后便自动清空。

Tesla K80其实是由两个K40核心所组成一片24GB的K80,在环境中看到的是两片各为12GB的GPU,由于其架构较老旧,速度在TF1.6测试下仅达GTX 1080一半(参考下图)。

45afaaae-2f4d-11ed-ba43-dac502259ad0.png

硬件规格与GTX 1080比较如下:

45d28678-2f4d-11ed-ba43-dac502259ad0.jpg

(https://www.reddit.com/r/deeplearning/comments/5mc7s6/performance_difference_between_nvidia_k80_and_gtx/)

K80已是八-九年前的产品,使用的framework为Kepler(GTX 1080为差了两代的Pascal,3080以后系列为差了五代的Ampere),从Nvidia的规划(https://zh.wikipedia.org/wiki/CUDA)来看,Kepler只支持到CUDA 10.2,不支持最新的CUDA11.0之后版本。但测试结果,安装了CUDA 11.0之后,还是能在GPUlab的K80 GPU执行训练,这部份请参考后续说明。

GPUlab的使用接口

注册账号,选择要购买的方案种类,使用信用卡缴费后,便会自动设定好环境马上便能使用。

45ed1fec-2f4d-11ed-ba43-dac502259ad0.png

GPUlab environment的界面

45fb55ee-2f4d-11ed-ba43-dac502259ad0.png

点选Notebook中的Python3,会于目前目录(可从左侧窗口的档案总管切换)新建一个notebook。

462c4348-2f4d-11ed-ba43-dac502259ad0.png

点选Console中的Bash,会进入一个可下方命令栏输入bash command的窗口。

464c6be6-2f4d-11ed-ba43-dac502259ad0.png

点选Others中的Terminal,出现一个类似putty接口的终端窗口。

466e82d0-2f4d-11ed-ba43-dac502259ad0.png

输入nvidia-smi

468a8c82-2f4d-11ed-ba43-dac502259ad0.png

输入ls -la /usr/local/cuda,发现CUDA版本是10.1

46b6f448-2f4d-11ed-ba43-dac502259ad0.png

升级CUDA为最新版的11.03

如果想要使用较新的Tensorflow 2.5,那么必须要升级CUDA到最新版本11.X才行,不过目前GPUlab仅支持10.3,官方解释要等到下一版(约在2021年七月底或八月左右)才有支持。如果打算自己安装升级,会发现GPUlab并没有开放sudo root权限,想要升级到11.X版似乎有些困难。

但其实,CUDA/CUDNN安装也可以用户模式来安装,不一定需要root权限。

下载CUDA 11.4

URL//developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=18.04&target_type=runfile_local

$ wgethttps://developer.download.nvidia.com/compute/cuda/11.4.0/local_installers/cuda_11.4.0_470.42.01_linux.run

安装CUDA 11.4

$ chmod755 cuda_11.4.0_470.42.01_linux.run

# ./cuda_11.4.0_470.42.01_linux.run

安装时取消Nvidia driver的安装,并修改安装路径到个人家目录下。(例如:/home/jovyan/cuda-11.4)

安装结束后,于相同路径下新增soft link cuda指向cuda-11.4。

加入path到.bash_profile

exportCUDA_HOME=/home/jovyan/cuda

使用pip升级tensorflwo-gpu及pytorch

pipinstall -U tensorflow-gpu torch torchvision torchaudio

将下方三行加到~/.bash_profile

exportLD_LIBRARY_PATH=/home/jovyan/cuda/lib64:/home/jovyan/cuda/extras/CUPTI/lib64/:${LD_LIBRARY_PATH}

exportLIBRARY_PATH=${LIBRARY_PATH}:/home/jovyan/cuda/lib64:/home/jovyan/extras/CUPTI/lib64:/home/jovyan/cuda/targets/x86_64-linux/lib

从NVidia下载解压CUDNN,并将档案复制到 ~/cuda相对应路径下。

测试

开启一个terminal,import tensorflow,确认可使用11.x版的CUDA。

46cb1dec-2f4d-11ed-ba43-dac502259ad0.png

Ps. 此方法仅对于terminal环境有效,在Jupyternotebook环境可在一开始就先执行:

!source ~/.bash_profile

46e6ebee-2f4d-11ed-ba43-dac502259ad0.png

之后,PyTorch便能使用到新版CUDA了,但Tensorflow还不行。

心得

优点:

1.以每月不到三百元的价格,能使用不限时数11GBRAM的GPU,且已预先装好所有可用的模块,感觉相当划算。

2.若您仅需Jupyter Notebook接口进行基本的模型测试及训练,GPUlab所提供的环境已足敷使用。

3.可同时从不同PC登入portal(看到相同执行画面),亦可同时执行数个程序,只要Disk space及GPU usage没有超过用量。

4.从GPUlab环境存取internet的速度快,例如,从Kaggle透过API下载dataset比在自己PC快相当多。

5.提供的Terminal接口与Notebook搭配使用相当方便。

缺点:

1.提供的K80 GPU速度不是很令人满意,以训练一个参数为600,612的Keras UNet模型来说,在最新GTX 3080 GPU每epochs约117 s,K80则需要383 s,两者差距了三倍之多。

2.提供的Disk space仅有25GB,一次无法放置太多数量的dataset。

3.无sudo的root权限,因此,无法自行控制或修改更多的环境配置。

4.预载的CUDA仅支持到10.3,虽可自行升级到CUDA11.X,但会占用到disk quota(约8G)。

5.环境未安装libopencv-dev套件,且也无法透过sudoapt-get install libopencv-dev 自行安装,这使得训练YOLO的Darknetframe在编译时若enableOpenCV,会产生error。




审核编辑:刘清

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5283

    浏览量

    136090
  • IDE接口
    +关注

    关注

    0

    文章

    14

    浏览量

    13731
  • python
    +关注

    关注

    58

    文章

    4888

    浏览量

    90320

原文标题:比Colab/Kaggle更方便的GPU平台-GPUlab

文章出处:【微信号:易心Microbit编程,微信公众号:易心Microbit编程】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将 GPU 连接到 VisionFive v2?
    发表于 03-13 06:38

    GPU 利用率<30%?这款开源智算云平台让算力不浪费 1%

    作为 AI 开发者,你是否早已受够这些困境:花数百万采购的 GPU 集群,利用率常年低于 30%,算力闲置如同烧钱;跨 CPU/GPU/NPU 异构资源调度难如登天,模型训练卡在资源分配环节;部署
    的头像 发表于 01-26 14:20 289次阅读

    中光Gemini 330系列双目3D相机完成NVIDIA Jetson Thor平台全面适配

    在CES 2026展会期间,奥中光发布专为机械臂腕部设计超小型双目3D相机Gemini 305 立即购买,并正式宣布其面向机器人的标志性产品Gemini 330系列相机已完成与先进算力平台
    的头像 发表于 01-12 10:22 514次阅读

    铸铁测试平台的优势有哪些

    于钢材,铸铁的热膨胀系数较低,且对车间环境的温度变化不敏感,因温度梯度引起的变形较小。2. 没法的耐用性与耐磨性表面硬度高:经过适当热处理的铸铁平台表面硬度高,能有效抵抗划伤和磨损。“越用越准
    发表于 01-07 13:29

    NVIDIA RTX PRO 5000 Blackwell GPU的深度评测

    需求进行了优化设计。无论是 CUDA 核心计算性能、实时渲染能力,还是 AI 推理效率,亦或显存带宽与容量的显著提升,均使得新一代 RTX PRO 5000 Blackwell GPU 能够轻松应对复杂、严苛的工作负载。
    的头像 发表于 01-06 09:51 4226次阅读
    NVIDIA RTX PRO 5000 Blackwell <b class='flag-5'>GPU</b>的深度评测

    在Python中借助NVIDIA CUDA Tile简化GPU编程

    NVIDIA CUDA 13.1 版本新增了基于 Tile 的GPU 编程模式。它是自 CUDA 发明以来 GPU 编程最核心的更新之一。借助 GPU tile kernels,可以用
    的头像 发表于 12-13 10:12 1452次阅读
    在Python中借助NVIDIA CUDA Tile简化<b class='flag-5'>GPU</b>编程

    汽车中的GPU是如何使用的?

    (HMI)的发展尤为迅猛。随着电子电气架构(EEA)的集中化,车辆对高性能计算能力的需求显著提升,GPU(图形处理单元)的灵活性、可扩展性以及高效并行计算能力,使其成为支持这些创新应用的核心组件
    的头像 发表于 12-03 14:45 9710次阅读
    汽车中的<b class='flag-5'>GPU</b>是如何使用的?

    中光3D相机矩阵接入NVIDIA Jetson Thor平台

    8月28日,奥中光宣布其Gemini 330系列3D深度相机正全面兼容NVIDIA Jetson Thor(物理AI 与机器人应用终极平台)。未来完成适配后,奥中光双目视觉相机可将传感器数据直接
    的头像 发表于 08-30 09:42 2810次阅读

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    是Imagination开发者社区中广受欢迎的图形API,因其提供了低开销、跨平台访问现代GPU的能力,帮助开发者在多种设备上最大化性能与效率。其对GPU操作的显式控制,以及对
    的头像 发表于 08-14 11:18 2481次阅读
    Imagination <b class='flag-5'>GPU</b> 全面支持 Vulkan 1.4 和 Android 16

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架构分析」阅读体验】+NVlink技术从应用到原理

    带来了总双向带宽160GB/s的通讯速率,远高于当时的PCIe接口(实际现在的PCIe5.0也还要快)。首代的NVlink主要是增强了GPUGPU的通信性能和GPU对系统内存的访问
    发表于 06-18 19:31

    Lavavision携手奥中光推出互动软件平台Motioncube

    Lavavision是一家来自波兰的交互式软件设计公司,推出了创新的互动软件平台Motioncube。该平台基于先进的交互技术,结合奥中光Astra系列和Gemini系列相机提供的深度图像数据,为孩子们带来耳目一新的沉浸式教育
    的头像 发表于 06-04 14:38 1171次阅读

    iTOP-3588S开发板四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。

    ,8GB内存,32GBEMMC。 四核心架构GPU内置GPU可以完全兼容0penGLES1.1、2.0和3.2。 内置NPU RK3588S内置NPU,支持INT4/INT8/INT16/FP16混合运算
    发表于 05-15 10:36