0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

gpu加速原理

工程师 来源:未知 作者:姚远香 2018-12-17 16:17 次阅读

GPU一推出就包含了比CPU更多的处理单元,更大的带宽,使得其在多媒体处理过程中能够发挥更大的效能。例如:当前最顶级的CPU只有4核或者6核,模拟出8个或者12个处理线程来进行运算,但是普通级别的GPU就包含了成百上千个处理单元,高端的甚至更多,这对于多媒体计算中大量的重复处理过程有着天生的优势。下图展示了CPU和GPU架构的对比。

硬件设计上来讲,CPU 由专为顺序串行处理而优化的几个核心组成。另一方面,GPU 则由数以千计的更小、更高效的核心组成,这些核心专为同时处理多任务而设计。

通过上图我们可以较为容易地理解串行运算和并行运算之间的区别。传统的串行编写软件具备以下几个特点:要运行在一个单一的具有单一中央处理器(CPU)的计算机上;一个问题分解成一系列离散的指令;指令必须一个接着一个执行;只有一条指令可以在任何时刻执行。而并行计算则改进了很多重要细节:要使用多个处理器运行;一个问题可以分解成可同时解决的离散指令;每个部分进一步细分为一系列指示;每个部分的问题可以同时在不同处理器上执行。

举个生活中的例子来说,你要点一份餐馆的外卖,CPU型餐馆用一辆大货车送货,每次可以拉很多外卖,但是送完一家才能到下一家送货,每个人收到外卖的时间必然很长;而GPU型餐馆用十辆小摩托车送货,每辆车送出去的不多,但是并行处理的效率高,点餐之后收货就会比大货车快很多。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10434

    浏览量

    206521
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4413

    浏览量

    126640
收藏 人收藏

    评论

    相关推荐

    什么是自动语音识别(ASR)?如何使用深度学习和GPU加速ASR

    ASR 是自然语言中一项颇具挑战性的任务,它由语音分割、声学建模和语言建模等一系列子任务组成,根据噪声和未分割的输入数据形成预测(标签序列)。
    发表于 02-28 15:01 570次阅读
    什么是自动语音识别(ASR)?如何使用深度学习和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>ASR

    利用GPU加速在Orange Pi 5上跑LLMs:人工智能爱好者High翻了!

    本期视频将会给人工智能爱好者们带来超级震撼!视频中,我们将深入了解利用GPU加速在OrangePi5上跑LLMs的精彩世界。最近知乎上的一篇文章《利用GPU加速,在OrangePi上跑
    的头像 发表于 01-22 15:29 528次阅读
    利用<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>在Orange Pi 5上跑LLMs:人工智能爱好者High翻了!

    GPU在深度学习中的应用与优势

    学习中究竟担当了什么样的角色?又有哪些优势呢?一、GPU加速深度学习训练并行处理GPU的核心理念在于并行处理。在深度学习训练过程中,需要处理大量的数据。GPU通过
    的头像 发表于 12-06 08:27 706次阅读
    <b class='flag-5'>GPU</b>在深度学习中的应用与优势

    177倍加速!NVIDIA最新开源 | GPU加速各种SDF建图!

    但最近,NVIDIA和ETHZ就联合提出了nvblox,是一个使用GPU加速SDF建图的库。计算速度非常快,相较CPU计算TSDF甚至快了177倍。更重要的是,因为所有数据都已经存储在GPU上,所以很容易和深度学习方案结合!
    的头像 发表于 11-09 16:46 543次阅读
    177倍<b class='flag-5'>加速</b>!NVIDIA最新开源 | <b class='flag-5'>GPU</b><b class='flag-5'>加速</b>各种SDF建图!

    NVIDIA 携手 NTT DOCOMO 推出全球首个 GPU 加速的 5G 网络

    高性能、软件定义的无线网络正在日本落地应用。 生成式 AI 席卷全球,成为全球企业热议的话题。在此趋势下,全球各地的电信公司也在探索如何通过 5G 和即将到来的 6G 网络,以更具成本效益的方式,将新的 AI 应用交付到边缘。 电信公司计划到 2025 年在全球部署超过 1700 万个 5G 微基站和信号塔。建设、管理并优化这些新的基础设施,同时保持交付的服务质量并最大限度地提升客户体验,已成为电信行业日后面临的巨大挑战。 9 月 27 日,NTT DOCOMO 宣布
    的头像 发表于 09-28 18:25 255次阅读
    NVIDIA 携手 NTT DOCOMO 推出全球首个 <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>的 5G 网络

    NVIDIA与NTT DOCOMO联手打造全球首个GPU加速5G网络,欧盟要求苹果开放生态

    大家好,欢迎收看河套IT WALK第113期。 NVIDIA与NTT DOCOMO合作推出了全球首个GPU加速的5G网络,这一突破性技术将改变我们对5G网络的认知和使用方式。欧盟对苹果提出了一个灵魂
    的头像 发表于 09-27 21:20 502次阅读
    NVIDIA与NTT DOCOMO联手打造全球首个<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>5G网络,欧盟要求苹果开放生态

    Oracle 云基础设施提供新的 NVIDIA GPU 加速计算实例

    生成式 AI 和大语言模型(LLM)不断推动突破性创新,训练和推理对算力的需求也随之急剧上升。 这些现代生成式 AI 应用需要全栈加速计算,首先要有能够快速、准确处理大量工作负载的先进基础设施
    的头像 发表于 09-25 20:40 283次阅读
    Oracle 云基础设施提供新的 NVIDIA <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>计算实例

    在线研讨会 | 9 月 19 日,利用 GPU 加速生成式 AI 图像内容生成

    生成式 AI 已经展示出其在艺术、设计、影视动画、互娱、建筑等领域加速内容创作的价值,可以简化耗时任务,让内容创作回归创意,并具有重塑无数行业的潜力。生成式 AI 模型的广泛应用,不仅提高了我们
    的头像 发表于 09-14 17:40 285次阅读
    在线研讨会 | 9 月 19 日,利用 <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>生成式 AI 图像内容生成

    基于NIVIDA RTX的GPU加速边缘AI服务器——AIR-500D

    随着边缘计算和人工智能对制造业、智慧城市、医疗和其他行业的不断深入,应用中对海量图像数据处理的需求持续激增。作为NVIDIA的精英合作伙伴,研华可提供基于英伟达最新的Jetson AGX Orin和RTX系列平台的边缘AI解决方案。这些性能出色的解决方案非常适合于包括机器人和视频分析在内的各种AI应用。研华的解决方案包括一个紧凑的人工智能系统和一个服务器级系统,可满足边缘推理和再训练的要求。
    的头像 发表于 08-17 13:31 219次阅读

    CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 GPU 加速

    全流程置于 GPU 上进行加速, 前后处理部分效率提升 16% - 38%。 客户简介 腾讯云音视频 PaaS 平台(以下简称腾讯视频云)专注技术产品,构建了行业中极速高清智能转码、超低时延快直播
    的头像 发表于 07-28 17:05 461次阅读
    CV-CUDA 助力腾讯云音视频 PaaS 平台实现视频增强 AI 全流程 <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b>

    支持的JSON数据选项介绍

    GPU 加速的 RAPID JSON 数据处理
    的头像 发表于 07-05 16:30 260次阅读

    如何使用NVIDIA DALI实现和使用GPU加速自动增强来训练

    为什么自动增强很重要
    的头像 发表于 07-05 16:30 2032次阅读
    如何使用NVIDIA DALI实现和使用<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>自动增强来训练

    使用 RAPIDS 进行更快的单细胞分析

    使用 RAPIDS-singlecell 进行 GPU 加速的单细胞 RNA 分析
    的头像 发表于 07-05 16:30 460次阅读
    使用 RAPIDS 进行更快的单细胞分析

    NVIDIA GPU 加速 WPS Office AI 服务,助力打造优质的用户体验

    案例介绍 金山办公与 NVIDIA 团队合作,通过 NVIDIA Tensor Core GPU、TensorRT 提升图像文档识别与理解的推理效率;借助 NVIDIA Triton 推理服务器
    的头像 发表于 06-29 21:35 390次阅读
    NVIDIA <b class='flag-5'>GPU</b> <b class='flag-5'>加速</b> WPS Office AI 服务,助力打造优质的用户体验

    HPC应用如何使用GPU加速计算

    CPU(中央处理器)和GPU(图形处理器)是两种不同的处理器类型,主要的区别在于它们的设计目标和应用场景。
    的头像 发表于 06-21 15:38 1690次阅读