0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

标签 > CUDA

CUDA

+关注0人关注

文章:95 视频:30 浏览:13434 帖子:16

cuda技术

一文详解GPU硬件与CUDA开发工具

一文详解GPU硬件与CUDA开发工具

CPU 和 GPU 的显著区别是:一个典型的 CPU 拥有少数几个快速的计算核心,而一个典型的 GPU 拥有几百到几千个不那么快速的计算核心。

2024-03-21 标签:gpuC语言编程语言 146 0

GPU CUDA 编程的基本原理是什么

GPU CUDA 编程的基本原理是什么

神经网络能加速的有很多,当然使用硬件加速是最可观的了,而目前除了专用的NPU(神经网络加速单元),就属于GPU对神经网络加速效果最好了

2024-03-05 标签:神经网络gpusram 208 0

LayerNorm/RMSNorm的重计算实现

LayerNorm/RMSNorm的重计算实现

我去实测了一下,单机8卡A100训练LLama7B,纯数据并行的情况下打开memory_efficient开关相比于不打开节省了大约2个G的显存,如果模...

2024-01-16 标签:NVIDIARMSpython 1027 0

铭瑄RTX 4070关键参数介绍

铭瑄RTX 4070关键参数介绍

铭瑄这款RTX 4070 MGG OC12G S0的设计和几位师兄如出一辙,搭载了Mega Freeze VC散热系统,正面三个10厘米风扇,均有11片...

2023-12-06 标签:华硕PWM散热器 377 0

英伟达三大AI法宝:CUDA、Nvlink、InfiniBand

英伟达三大AI法宝:CUDA、Nvlink、InfiniBand

以太网是一种广泛使用的网络协议,但其传输速率和延迟无法满足大型模型训练的需求。相比之下,端到端IB(InfiniBand)网络是一种高性能计算网络,能够...

2023-12-05 标签:cpu交换机AI 1420 0

OpenCV4.8 CUDA编程代码教程

OpenCV4.8 CUDA编程代码教程

OpenCV4支持通过GPU实现CUDA加速执行,实现对OpenCV图像处理程序的加速运行,当前支持加速的模块包括如下。

2023-12-05 标签:编程代码opencv 369 0

OpenCV4.8+CUDA+扩展模块支持编译指南

OpenCV4.8+CUDA+扩展模块支持编译指南

OpenCV4.8+CUDA+扩展模块支持编译指南

2023-11-30 标签:源码编译opencv 326 0

llama.cpp代码结构&调用流程分析

llama.cpp代码结构&调用流程分析

llama.cpp 的代码结构比较直观,如下所示,为整体代码结构中的比较核心的部分的代码结构

2023-11-07 标签:RMSCUDA 794 0

CUDA核心是什么?CUDA核心的工作原理

CUDA核心是什么?CUDA核心的工作原理

CUDA核心(Compute Unified Device Architecture Core)是NVIDIA图形处理器(GPU)上的计算单元,用于执行...

2023-09-27 标签:存储器NVIDIAgpu 4268 0

基于BEV的视觉3D目标检测器

基于BEV的视觉3D目标检测器

根据我们的实验分析,我们认为实现这一目标的关键在于提升检测器在 BEV 空间和 2D 空间的适应性。这种适应性是针对 query 而言的,即对于不同的 ...

2023-09-16 标签:检测器CUDANDS 419 0

查看更多>>

cuda资讯

英伟达AI霸主地位遭巨头联手挑战,CUDA垄断遭破局

据最新外媒报道,科技界的巨头们——高通、谷歌和英特尔等,已经联手向英伟达发起了一场挑战,意图打破其在CUDA平台上的垄断局面。

2024-03-28 标签:高通英特尔gpu 267 0

RTX 4070 SUPER首发评测

RTX 4070 SUPER首发评测

新一代的Ada Lovelace架构带来了令人咋舌的能效比,RTX 40系列显卡在性能相同的情况下,功耗只有上代一半甚至更低,只是价格并不是那么亲民。

2024-01-17 标签:NVIDIA流处理器CUDA 581 0

什么是CUDA?谁能打破CUDA的护城河?

什么是CUDA?谁能打破CUDA的护城河?

在最近的一场“AI Everywhere”发布会上,Intel的CEO Pat Gelsinger炮轰Nvidia的CUDA生态护城河并不深,而且已经成...

2023-12-28 标签:CUDAGPU芯片人工智能算法 606 0

GTX 16系列全线停产!

GTX 16系列全线停产!

GTX 1660 Ti、GTX 1660 SUPER、GTX 1660、GTX 1650 SUPER此前已经陆续停产退市,唯一剩下的就是GTX 1650...

2023-12-19 标签:HDMINVIDIAgpu 680 0

RTX 40 SUPER最终规格实锤!好像不用抽奖了

pcb号码为pg139-355、ad103-400 gpu核心,开放所有10240个cuda核心,与256位16gb gddr6x内存相结合,卡耗量为3...

2023-11-13 标签:NVIDIAgpuCUDA 388 0

海光信息:上半年实现归母净利润6.77亿元,同比增长42%

单季度海光信息23q2实现14.5亿元的销售额,同比下降7.16%。主要原因是上半年信用创造市场的需求比较萧条,再加上去年同期较高的期数效果。扣除23q...

2023-08-31 标签:CUDADCU海光信息 520 0

英伟达A100的算力是多少?

英伟达A100的算力是多少? 英伟达A100的算力为19.5 TFLOPS(浮点运算每秒19.5万亿次)。 V100 用 300W 功率提供了 7.8T...

2023-08-08 标签:晶体管CUDA英伟达 2.2万 0

英伟达A100和A40的对比

英伟达A100和A40的对比 A100是英伟达推出的一款强大的数据中心GPU,采用全新的Ampere架构。它拥有高达6,912个CUDA核心和40GB的...

2023-08-08 标签:gpu数据中心CUDA 1.2万 0

英伟达A100和H100的区别

英伟达A100和H100的区别 英伟达A100和H100是两种不同的产品。A100是英伟达在2020年推出的一款基于Ampere架构的数据中心GPU,主...

2023-08-07 标签:CUDA英伟达A100 2.3万 0

解析OneFlow Element-Wise算子实现方法

虽然这种写法非常简单明了,但却存在明显的性能问题。所以这篇文章将基于OneFlow开源的Element-Wise CUDA算子方案来解释如何写一个高性能...

2022-12-12 标签:代码CUDA 1094 0

查看更多>>

cuda数据手册

相关标签

相关话题

换一批
  • Arduino
    Arduino
    +关注
    Arduino是一款便捷灵活、方便上手的开源电子原型平台。包含硬件(各种型号的Arduino板)和软件(Arduino IDE)。
  • 28nm
    28nm
    +关注
    从背景上看,28nm诞生于2008年那场金融危机之后。受到金融海啸的影响,当时很多半导体企业都受到了影响。于是,在这之后的几年,包括AMD在内的很多半导体企都选择将制造业务剥离以降低运营资金压力,将更多的资源集中到相对投入到芯片设计当中
  • FinFET
    FinFET
    +关注
    FinFET全称叫鳍式场效应晶体管,是一种新的互补式金氧半导体晶体管。FinFET命名根据晶体管的形状与鱼鳍的相似性。这种设计可以改善电路控制并减少漏电流,缩短晶体管的闸长。
  • 20nm
    20nm
    +关注
  • TI公司
    TI公司
    +关注
    TI是富有远见的企业,我们是敢于开拓的创新者。作为一个业务运营覆盖 35 个国家的全球性半导体企业,员工是我们的立足之本。德州仪器(TI)的员工是我们深厚的企业文化的重要体现。无论是1958年第一位发明集成电路的TI员工,还是如今遍布全球负责设计、制造以及销售模拟与嵌入式处理芯片的30,000多名TI成员。 TI是一家全球性半导体设计与制造公司:业务覆盖超过35个国家、服务全球各地超过10万家客户、拥有85年的创新历史、超过10万种模拟集成电路、嵌入式处理器以及软件和工具。
  • 村田
    村田
    +关注
    村田公司是一家使用性能优异电子原料,设计、制造最先进的电子元器件及多功能高密度模块的企业。不仅是手机、家电,汽车相关的应用、能源管理系统、医疗保健器材等,都有村田公司的身影。
  • 罗姆
    罗姆
    +关注
    提供最新的罗姆公司产品,最活跃的罗姆工程师社区
  • 工业物联网
    工业物联网
    +关注
    一般情况,IIoT往往有更结构化的连接环境,因为与典型的IoT应用相比,IIoT 系统履行的职责更事关重大。响应时间往往是个问题,像健身跟踪那样的IoT应用通常可以先在本地存储数据,无线链路可用时再行处理。
  • 金升阳
    金升阳
    +关注
    广州金升阳科技有限公司,成立于1998年7月,是国内集生产、研发和销售为一体的规模最大、品种最全的工业模块电源的制造商之一。
  • Vicor
    Vicor
    +关注
    美国Vicor 是Vicor Corporation旗下品牌,致力于模块化电源技术创新,近年来专注于48V电源解决方案。Vicor带来了全新的配电架构、零电流开关 (ZCS) 及零电压开关 (ZVS) 电源转换拓扑。
  • MHL
    MHL
    +关注
  • 体感控制
    体感控制
    +关注
    体感控制,在于人们可以很直接地使用肢体动作,与周边的装置或环境互动,而无需使用任何复杂的控制设备,便可让人们身历其境地与内容做互动。 本章详细介绍了:体感控制技术,体温感应控制等内容。
  • Bourns
    Bourns
    +关注
  • 闪存技术
    闪存技术
    +关注
    闪存是一种长寿命的非易失性(在断电情况下仍能保持所存储的数据信息)的存储器,数据删除不是以单个的字节为单位而是以固定的区块为单位(注意:NOR Flash 为字节存储。),区块大小一般为256KB到20MB。
  • 模拟芯片
    模拟芯片
    +关注
  • 美满电子
    美满电子
    +关注
  • 碳化硅
    碳化硅
    +关注
    金刚砂又名碳化硅(SiC)是用石英砂、石油焦(或煤焦)、木屑(生产绿色碳化硅时需要加食盐)等原料通过电阻炉高温冶炼而成。碳化硅在大自然也存在罕见的矿物,莫桑石。
  • Zynq
    Zynq
    +关注
      赛灵思公司(Xilinx)推出的行业第一个可扩展处理平台Zynq系列。旨在为视频监视、汽车驾驶员辅助以及工厂自动化等高端嵌入式应用提供所需的处理与计算性能水平。
  • Kinetis
    Kinetis
    +关注
  • Cirrus LogIC
    Cirrus LogIC
    +关注
    Cirrus Logic 1984 年创立于硅谷,是音频和能源市场上高精度模拟和数字信号处理元件的主要供应商。Cirrus Logic 擅长于开发具备优秀功能集成和创新的复杂芯片设计。
  • 华星光电
    华星光电
    +关注
    深圳市华星光电技术有限公司(以下简称华星光电)是2009年11月16日成立的一家高新科技企业,公司注册资本183.4亿元,投资总额达443亿元,是深圳市建市以来单笔投资额最大的工业项目,也是深圳市政府重点推动的项目。
  • 栅极驱动器
    栅极驱动器
    +关注
      栅极驱动器是一个用于放大来自微控制器或其他来源的低电压或低电流的缓冲电路。在某些情况下,例如驱动用于数字信号传输的逻辑电平晶体管时,使用微控制器输出不会损害应用的效率、尺寸或热性能。在高功率应用中,微控制器输出通常不适合用于驱动功率较大的晶体管。
  • 研华
    研华
    +关注
  • 32位单片机
    32位单片机
    +关注
    ARM,其中ARM7,9,10是公开的32位处理器内核,很多公司都有基于ARM的单片机产品。目前国内应用最广泛的所三星和菲利普。
  • 骁龙
    骁龙
    +关注
    骁龙是Qualcomm Technologies(美国高通)旗下移动处理器和LTE调制解调器的品牌名称。
  • Cortex-A
    Cortex-A
    +关注
      Cortex-A 系列处理器是一系列处理器,支持ARM32或64位指令集,向后完全兼容早期的ARM处理器,包括从1995年发布的ARM7TDMI处理器到2002年发布的ARMll处理器系列。
  • Mobileye
    Mobileye
    +关注
    Mobileye在单目视觉高级驾驶辅助系统 (ADAS) 的开发方面走在世界前列,提供芯片搭载系统和计算机视觉算法运行 DAS 客户端功能,例如车道偏离警告 (LDW)、基于雷达视觉融合的车辆探测、前部碰撞警告 (FCW)、车距监测 (HMW)、行人探测、智能前灯控制 (IHC)、交通标志识别 (TSR)、仅视觉自适应巡航控制 (ACC) 等。
  • CC2541
    CC2541
    +关注
    CC2541 是一款针对低能耗以及私有 2.4GHz 应用的功率优化的真正片载系统 (SoC) 解决方案。
  • G3-PLC
    G3-PLC
    +关注
  • 超级本
    超级本
    +关注
    超极本Ultrabook是英特尔继UMPC、MID、上网本netbook、Consumer Ultra Low Voltage超轻薄笔记本之后,定义的全新品类笔记本产品,集成了平板电脑的应用特性与PC的性能,超极本是完整的电脑。

关注此标签的用户(0人)

编辑推荐厂商产品技术软件/工具OS/语言教程专题

电机控制 DSP 氮化镓 功率放大器 ChatGPT 自动驾驶 TI 瑞萨电子
BLDC PLC 碳化硅 二极管 OpenAI 元宇宙 安森美 ADI
无刷电机 FOC IGBT 逆变器 文心一言 5G 英飞凌 罗姆
直流电机 PID MOSFET 传感器 人工智能 物联网 NXP 赛灵思
步进电机 SPWM 充电桩 IPM 机器视觉 无人机 三菱电机 ST
伺服电机 SVPWM 光伏发电 UPS AR 智能电网 国民技术 Microchip
瑞萨 沁恒股份 全志 国民技术 瑞芯微 兆易创新 芯海科技 Altium
德州仪器 Vishay Micron Skyworks AMS TAIYOYUDEN 纳芯微 HARTING
adi Cypress Littelfuse Avago FTDI Cirrus LogIC Intersil Qualcomm
st Murata Panasonic Altera Bourns 矽力杰 Samtec 扬兴科技
microchip TDK Rohm Silicon Labs 圣邦微电子 安费诺工业 ixys Isocom Compo
安森美 DIODES Nidec Intel EPSON 乐鑫 Realtek ERNI电子
TE Connectivity Toshiba OMRON Sensirion Broadcom Semtech 旺宏 英飞凌
Nexperia Lattice KEMET 顺络电子 霍尼韦尔 pulse ISSI NXP
Xilinx 广濑电机 金升阳 君耀电子 聚洵 Liteon 新洁能 Maxim
MPS 亿光 Exar 菲尼克斯 CUI WIZnet Molex Yageo
Samsung 风华高科 WINBOND 长晶科技 晶导微电子 上海贝岭 KOA Echelon
Coilcraft LRC trinamic
放大器 运算放大器 差动放大器 电流感应放大器 比较器 仪表放大器 可变增益放大器 隔离放大器
时钟 时钟振荡器 时钟发生器 时钟缓冲器 定时器 寄存器 实时时钟 PWM 调制器
视频放大器 功率放大器 频率转换器 扬声器放大器 音频转换器 音频开关 音频接口 音频编解码器
模数转换器 数模转换器 数字电位器 触摸屏控制器 AFE ADC DAC 电源管理
线性稳压器 LDO 开关稳压器 DC/DC 降压转换器 电源模块 MOSFET IGBT
振荡器 谐振器 滤波器 电容器 电感器 电阻器 二极管 晶体管
变送器 传感器 解析器 编码器 陀螺仪 加速计 温度传感器 压力传感器
电机驱动器 步进驱动器 TWS BLDC 无刷直流驱动器 湿度传感器 光学传感器 图像传感器
数字隔离器 ESD 保护 收发器 桥接器 多路复用器 氮化镓 PFC 数字电源
开关电源 步进电机 无线充电 LabVIEW EMC PLC OLED 单片机
5G m2m DSP MCU ASIC CPU ROM DRAM
NB-IoT LoRa Zigbee NFC 蓝牙 RFID Wi-Fi SIGFOX
Type-C USB 以太网 仿真器 RISC RAM 寄存器 GPU
语音识别 万用表 CPLD 耦合 电路仿真 电容滤波 保护电路 看门狗
CAN CSI DSI DVI Ethernet HDMI I2C RS-485
SDI nas DMA HomeKit 阈值电压 UART 机器学习 TensorFlow
Arduino BeagleBone 树莓派 STM32 MSP430 EFM32 ARM mbed EDA
示波器 LPC imx8 PSoC Altium Designer Allegro Mentor Pads
OrCAD Cadence AutoCAD 华秋DFM Keil MATLAB MPLAB Quartus
C++ Java Python JavaScript node.js RISC-V verilog Tensorflow
Android iOS linux RTOS FreeRTOS LiteOS RT-THread uCOS
DuerOS Brillo Windows11 HarmonyOS
林超文PCB设计:PADS教程,PADS视频教程 郑振宇老师:Altium Designer教程,Altium Designer视频教程
张飞实战电子视频教程 朱有鹏老师:海思HI3518e教程,HI3518e视频教程
李增老师:信号完整性教程,高速电路仿真教程 华为鸿蒙系统教程,HarmonyOS视频教程
赛盛:EMC设计教程,EMC视频教程 杜洋老师:STM32教程,STM32视频教程
唐佐林:c语言基础教程,c语言基础视频教程 张飞:BUCK电源教程,BUCK电源视频教程
正点原子:FPGA教程,FPGA视频教程 韦东山老师:嵌入式教程,嵌入式视频教程
张先凤老师:C语言基础视频教程 许孝刚老师:Modbus通讯视频教程
王振涛老师:NB-IoT开发视频教程 Mill老师:FPGA教程,Zynq视频教程
C语言视频教程 RK3566芯片资料合集
朱有鹏老师:U-Boot源码分析视频教程 开源硬件专题