0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

标签 > gpu

gpu

gpu

+关注28人关注

图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上图像运算工作的微处理器。

文章:4858 浏览:134541 帖子:301

gpu技术

总结FasterTransformer Encoder优化技巧

总结FasterTransformer Encoder优化技巧

FasterTransformer BERT 包含优化的 BERT 模型、高效的 FasterTransformer 和 INT8 量化推理。

2023-05-30 标签:编码器gpuCUDA 1.9k 0

从计算机图形学到人工智能

从计算机图形学到人工智能

GPU的硬件设计上引入了图形管线,使得各任务可以通过流水线进行并行处理。同时通过可编程的着色器,使得GPU硬件能够根据图形学算法更好的被使用。

2023-03-02 标签:gpu算法可编程 1.9k 0

Merlin HugeCTR 分级参数服务器简介

Merlin HugeCTR 分级参数服务器简介

  参数服务器是推荐系统的重要组成部分,但是目前的训练端参数服务器由于高延迟和同步问题无法有效解决推理部署中模型过大的瓶颈。

2022-03-31 标签:cpugpu服务器 1.9k 0

一文掌握AI大模型算力的核心要素

一文掌握AI大模型算力的核心要素

GPU和显卡的关系,就像是CPU和主板的关系。前者是显卡的心脏,后者是主板的心脏。有些小伙伴会把GPU和显卡当成一个东西,其实还有些差别的,显卡不仅包括...

2024-03-29 标签:cpugpuAI 1.9k 0

FP8在大模型训练中的应用

FP8在大模型训练中的应用

越来越多的技术团队开始使用 FP8 进行大模型训练,这主要因为 FP8 有很多技术优势。比如在新一代的 GPU 上,FP8 相对于 BF16 对矩阵乘算...

2025-01-23 标签:NVIDIAgpu大模型 1.9k 0

GPU/TPU集群网络组网间的连接方式

GPU/TPU集群网络组网间的连接方式

用于连接 GPU 服务器中的 8 个 GPU 的 NVLink 交换机也可以用于构建连接 GPU 服务器之间的交换网络。Nvidia 在 2022 年的...

2024-04-16 标签:以太网gpu服务器 1.9k 0

AIGC大模型对网络的五大核心需求解析

AI 应用计算量呈几何级数增长,算法模型向巨量化发展,人工智能模型参数在过去十年增长了十万倍,当前AI超大模型的参数目前已经达到了千亿~万亿的级别。

2024-03-29 标签:gpuAIGC大模型 1.9k 0

FPGA加速语言模型如何重塑生成式人工智能

FPGA加速语言模型如何重塑生成式人工智能

大语言模型的构建通常需要一个大规模的系统来执行该模型,这个模型会持续变大,在其发展到一定程度后,仅靠在CPU上的运行就不再具有成本、功耗或延迟的优势了。

2023-08-31 标签:fpga加速器gpu 1.9k 0

简单认识高级处理器

简单认识高级处理器

除了传统的处理器 (CPU、MPU/MCU、DSP 和 GPU),面向当代各种应用的高级处理器(Advanced Processors)层出不穷,例如加...

2023-12-07 标签:处理器dspamd 1.9k 0

集合通信与AI基础架构

集合通信与AI基础架构

人工智能集群的性能,尤其是机器学习训练集群,受到神经网络处理单元NPUs(即GPU或TPU)之间并行计算能力的显著影响。在我们称为纵向扩展scale-u...

2025-01-08 标签:通信gpuAI 1.9k 0

光器件的最新研究和发展趋势

光器件的最新研究和发展趋势

此次,我们将报道旨在实现光互连的光器件的最新研究和发展趋势。

2023-11-29 标签:gpu人工智能光器件 1.9k 0

一文解析AI驱动光模块变革

一文解析AI驱动光模块变革

传统的三层架构已不再适应日益增长的数据中心流量需求,叶脊架构的出现解决了这一问题。叶脊架构下,光模块数量可高达数十倍,以满足大规模AI集群对大带宽、低时...

2024-04-22 标签:gpu数据中心光通信 1.9k 0

高性能MCU解决方案可实现汽车驾驶舱里的智能世界

高性能MCU解决方案可实现汽车驾驶舱里的智能世界

随着车载信息系统的高度发展,HMI功能强且精度高的显示器的需求应运而生,汽车驾驶座正在向“综合驾驶舱”发展。瑞萨电子与车载信息系统的发展同步提供能实现更...

2017-02-23 标签:MCUGPU瑞萨电子 1.9k 0

NVIDIA CUDA深度神经网络库实现高性能GPU加速

NVIDIA CUDA 深度神经网络库(cuDNN)是一个 GPU 加速的深度神经网络基元库,能够以高度优化的方式实现标准例程(如前向和反向卷积、池化层...

2022-07-23 标签:神经网络gpu计算机视觉 1.9k 0

Faster Transformer v1.0源码详解

Faster Transformer v1.0源码详解

写在前面:本文将对 Nvidia BERT 推理解决方案 Faster Transformer 源码进行深度剖析,详细分析作者的优化意图,并对源码中的加...

2023-09-08 标签:NVIDIAgpu源码 1.9k 0

基于PyTorch AMD的解决方案

2.0经验的力量PyTorch AMD的解决方案

2023-09-04 标签:amdgpu代码 1.9k 0

使用推理服务器加速大型Transformer模型的推理

使用推理服务器加速大型Transformer模型的推理

这是讨论 NVIDIA FasterTransformer 库的两部分系列的第一部分,该库是用于对任意大小(多达数万亿个参数)的Transformer进...

2022-10-10 标签:gpu服务器深度学习 1.9k 0

浅谈GPU和CUDA技术

GPU和CPU之间的功能差异之所以存在,是因为它们的设计目标不同。虽然CPU被设计为尽可能快地执行一系列操作(称为线程),并且可以并行执行几十个线程,但...

2022-12-29 标签:处理器gpuCUDA 1.9k 0

Merlin HugeCTR HPS用于加速 NVIDIA GPU 上大规模嵌入的推理

如今,推荐系统被广泛用于个性化用户体验,并在电子商务、社交媒体和新闻源等各种环境中提高客户参与度。因此,以低延迟和高精度服务用户请求对于维持用户参与至关重要。

2022-09-08 标签:NVIDIAgpu服务器 1.9k 0

Google GPipe为代表的流水线并行范式

Google GPipe为代表的流水线并行范式

但在实际应用中,流水线并行并不特别流行,主要原因是模型能否均匀切割,影响了整体计算效率,这就需要算法工程师做手调。因此,今天我们来介绍一种应用最广泛,最...

2023-05-26 标签:Googlegpu模型 1.9k 0

相关标签

相关话题

换一批
  • 高云半导体
    高云半导体
    +关注
    广东高云半导体科技股份有限公司提供编程设计软件、IP核、参考设计、演示板等服务的完整FPGA芯片解决方案。
  • Zedboard
    Zedboard
    +关注
    ZedBoard是基于Xilinx Zynq™-7000扩展式处理平台(EPP)的低成本开发板。此板可以运行基于Linux,Android,Windows®或其他OS/ RTOS的设计。
  • I2S
    I2S
    +关注
    I2S总线, 又称 集成电路内置音频总线,是飞利浦公司为数字音频设备之间的音频数据传输而制定的一种总线标准,该总线专门用于音频设备之间的数据传输,广泛应用于各种多媒体系统。
  • SoC FPGA
    SoC FPGA
    +关注
  • 简单PLD
    简单PLD
    +关注
  • 逻辑芯片
    逻辑芯片
    +关注
    逻辑芯片又叫可编程逻辑器件,英文全称为:programmable logic device 即 PLD。PLD是做为一种通用集成电路产生的,他的逻辑功能按照用户对器件编程来确定。一般的PLD的集成度很高,足以满足设计一般的数字系统的需要。
  • UltraScale
    UltraScale
    +关注
  • 16nm
    16nm
    +关注
  • 三人表决器
    三人表决器
    +关注
  • Samtec
    Samtec
    +关注
    Samtec(申泰)公司是一家总部位于美国,致力于研发和生产高速数据通信连接器的供应商,Samtec连接器使用100%液晶聚合物以及纯磷青铜和铍铜制造,拥有军品级的技术参数,其产品包括各种通用标准的连接器以及通信线缆,并且为客户提供解决方案。
  • HLS
    HLS
    +关注
    HLS(HTTP Live Streaming)是Apple的动态码率自适应技术。主要用于PC和Apple终端的音视频服务。包括一个m3u(8)的索引文件,TS媒体分片文件和key加密串文件。
  • NCO
    NCO
    +关注
  • 信息娱乐系统
    信息娱乐系统
    +关注
  • 显示模块
    显示模块
    +关注
  • 京微雅格
    京微雅格
    +关注
      京微雅格(北京)科技有限公司致力于为系统制造商提供高集成度、高灵活性、高性价比的可编程逻辑器件、可重构微处理器及相关软件设计工具
  • 智能魔镜
    智能魔镜
    +关注
    随着物联网技术的发展,搭载这一技术的家电也越来越多的出现,今年十分火热的智能音箱就是物联网技术和人工智能结合的代表,智能魔镜这种基安防,终端,自动化,人工智能的物联网产品已经成为了不可阻挡的趋势,在未来,将更加全面、智能、便捷的走进越来越多人们的生活。
  • Cyclone V
    Cyclone V
    +关注
  • Digilent
    Digilent
    +关注
  • iCE40
    iCE40
    +关注
      为了满足市场需求,莱迪思发布了iCE40 Ultra™产品系列。据莱迪思总裁兼CEO Darin G. Billerbeck介绍,相比竞争对手的解决方案,iCE40 Ultra FPGA在提供5倍更多功能的同时减小了30%的尺寸。并且相比以前的器件,功耗降低高达75%。
  • 空中客车
    空中客车
    +关注
    空中客车公司(Airbus,又称空客、空中巴士),是欧洲一家飞机制造 、研发公司,1970年12月于法国成立。 空中客车公司的股份由欧洲宇航防务集团公司(EADS)100%持有。
  • 谐振变换器
    谐振变换器
    +关注
    谐振变换器主要包括三种基本的类型:串联谐振变换器(SRC)、并联谐振变换器(PRC)和串并联谐振变换器(SPRC)。谐振变换器由开关网络Ns、谐振槽路NT、整流电路NR、低通滤波器NF等部分组成。
  • 工业电机
    工业电机
    +关注
  • efpga
    efpga
    +关注
    eFPGA,全称为嵌入式FPGA(Embedded FPGA),顾名思义是将类似于FPGA的可编程逻辑阵列“嵌入”到ASIC或SoC中。
  • 图像信号处理器
    图像信号处理器
    +关注
  • UltraScale架构
    UltraScale架构
    +关注
  • 时钟驱动器
    时钟驱动器
    +关注
  • 数字预失真
    数字预失真
    +关注
  • TMS320C6416
    TMS320C6416
    +关注
  • BB-Black
    BB-Black
    +关注
  • 数字秒表
    数字秒表
    +关注

关注此标签的用户(28人)

jf_63731255 尤建华 自由者苍翼 jf_63410068 jf_25114358 苏铁_d83 lucks 趣味企鹅 随你尔雅 微微风999999 ernest2019 erBd

编辑推荐厂商产品技术软件/工具OS/语言教程专题

电机控制 DSP 氮化镓 功率放大器 ChatGPT 自动驾驶 TI 瑞萨电子
BLDC PLC 碳化硅 二极管 OpenAI 元宇宙 安森美 ADI
无刷电机 FOC IGBT 逆变器 文心一言 5G 英飞凌 罗姆
直流电机 PID MOSFET 传感器 人工智能 物联网 NXP 赛灵思
步进电机 SPWM 充电桩 IPM 机器视觉 无人机 三菱电机 ST
伺服电机 SVPWM 光伏发电 UPS AR 智能电网 国民技术 Microchip
瑞萨 沁恒股份 全志 国民技术 瑞芯微 兆易创新 芯海科技 Altium
德州仪器 Vishay Micron Skyworks AMS TAIYOYUDEN 纳芯微 HARTING
adi Cypress Littelfuse Avago FTDI Cirrus LogIC Intersil Qualcomm
st Murata Panasonic Altera Bourns 矽力杰 Samtec 扬兴科技
microchip TDK Rohm Silicon Labs 圣邦微电子 安费诺工业 ixys Isocom Compo
安森美 DIODES Nidec Intel EPSON 乐鑫 Realtek ERNI电子
TE Connectivity Toshiba OMRON Sensirion Broadcom Semtech 旺宏 英飞凌
Nexperia Lattice KEMET 顺络电子 霍尼韦尔 pulse ISSI NXP
Xilinx 广濑电机 金升阳 君耀电子 聚洵 Liteon 新洁能 Maxim
MPS 亿光 Exar 菲尼克斯 CUI WIZnet Molex Yageo
Samsung 风华高科 WINBOND 长晶科技 晶导微电子 上海贝岭 KOA Echelon
Coilcraft LRC trinamic
放大器 运算放大器 差动放大器 电流感应放大器 比较器 仪表放大器 可变增益放大器 隔离放大器
时钟 时钟振荡器 时钟发生器 时钟缓冲器 定时器 寄存器 实时时钟 PWM 调制器
视频放大器 功率放大器 频率转换器 扬声器放大器 音频转换器 音频开关 音频接口 音频编解码器
模数转换器 数模转换器 数字电位器 触摸屏控制器 AFE ADC DAC 电源管理
线性稳压器 LDO 开关稳压器 DC/DC 降压转换器 电源模块 MOSFET IGBT
振荡器 谐振器 滤波器 电容器 电感器 电阻器 二极管 晶体管
变送器 传感器 解析器 编码器 陀螺仪 加速计 温度传感器 压力传感器
电机驱动器 步进驱动器 TWS BLDC 无刷直流驱动器 湿度传感器 光学传感器 图像传感器
数字隔离器 ESD 保护 收发器 桥接器 多路复用器 氮化镓 PFC 数字电源
开关电源 步进电机 无线充电 LabVIEW EMC PLC OLED 单片机
5G m2m DSP MCU ASIC CPU ROM DRAM
NB-IoT LoRa Zigbee NFC 蓝牙 RFID Wi-Fi SIGFOX
Type-C USB 以太网 仿真器 RISC RAM 寄存器 GPU
语音识别 万用表 CPLD 耦合 电路仿真 电容滤波 保护电路 看门狗
CAN CSI DSI DVI Ethernet HDMI I2C RS-485
SDI nas DMA HomeKit 阈值电压 UART 机器学习 TensorFlow
Arduino BeagleBone 树莓派 STM32 MSP430 EFM32 ARM mbed EDA
示波器 LPC imx8 PSoC Altium Designer Allegro Mentor Pads
OrCAD Cadence AutoCAD 华秋DFM Keil MATLAB MPLAB Quartus
C++ Java Python JavaScript node.js RISC-V verilog Tensorflow
Android iOS linux RTOS FreeRTOS LiteOS RT-THread uCOS
DuerOS Brillo Windows11 HarmonyOS
林超文PCB设计:PADS教程,PADS视频教程 郑振宇老师:Altium Designer教程,Altium Designer视频教程
张飞实战电子视频教程 朱有鹏老师:海思HI3518e教程,HI3518e视频教程
李增老师:信号完整性教程,高速电路仿真教程 华为鸿蒙系统教程,HarmonyOS视频教程
赛盛:EMC设计教程,EMC视频教程 杜洋老师:STM32教程,STM32视频教程
唐佐林:c语言基础教程,c语言基础视频教程 张飞:BUCK电源教程,BUCK电源视频教程
正点原子:FPGA教程,FPGA视频教程 韦东山老师:嵌入式教程,嵌入式视频教程
张先凤老师:C语言基础视频教程 许孝刚老师:Modbus通讯视频教程
王振涛老师:NB-IoT开发视频教程 Mill老师:FPGA教程,Zynq视频教程
C语言视频教程 RK3566芯片资料合集
朱有鹏老师:U-Boot源码分析视频教程 开源硬件专题