0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

优化简单的OpenCL内核:调整内核优化

英特尔 Altera视频 2018-11-07 06:17 次阅读

Robert Ioffe描述了一系列一致的优化,可以提高英特尔®上的OpenCL内核性能 Iris™图形或英特尔®Iris™Pro图形,使用英特尔®SDKfor OpenCL™应用程序2013。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 内核
    +关注

    关注

    3

    文章

    1309

    浏览量

    39844
  • intel
    +关注

    关注

    19

    文章

    3452

    浏览量

    184772
  • 应用程序
    +关注

    关注

    37

    文章

    3136

    浏览量

    56377
收藏 人收藏

    评论

    相关推荐

    嵌入式Linux启动时间优化的秘密之三-内核

    本文主要讲述嵌入式Linux启动时间优化的秘密之三-内核,我们继续上篇没有讲完的嵌入式Linux启动时间优化方法,本文主要会讲内核系统。想看上一篇的请查看本文结尾的链接。
    发表于 04-20 18:09 2306次阅读

    FPGA编译openCL内核文件出错

    ` 用openCL写了个机器学习算法,用a10gx的板子的BSP编译运行没问题,但是a10gx板子太贵了。 于是准备买DE10-Standard 来做研究,下了BSP在bashrc里改了文件后,编译
    发表于 04-18 17:30

    使用FPGA优化视频水印操作的OpenCL应用

    SDAccel为内核提供的最大AXI互联宽度一致。鉴于最大带宽为512位,该应用调整为每次处理20个像素(24位/像素×20像素=504位)。SDAccel完全支持矢量数据类型。因此就本应用而言,代码的矢量化
    发表于 06-19 07:27

    TI OpenCL应用指南

    TI OpenCL 用户指南3Optimization TipsOpenCL应用程序由主机应用程序和一组设备内核组成。主机代码和设备代码都有优化技术。存在跨越主机和设备之间的边界的一些技术。本节提供
    发表于 08-06 09:33

    Actel推出具有优化FFT内核的IP内核发生器

        Actel公司推出一种知道产权(IP)内核发生器CoreFFT,针对快速傅利叶变换内核进行了优化,适合该公司基于闪存和反熔丝的系列FPGA。 &nbs
    发表于 03-13 13:07 730次阅读

    Arduino开发的内核与程序优化方法

    原版 Arduino 技术内幕,详细介绍了Arduino开发的内核与程序优化方法,最大程度挖掘开发板的设计潜力
    发表于 05-02 10:55 6次下载

    PGI推出基于ARM内核的专用OpenCL开发框架

    意法半导体全资子公司、全球领先的独立的高性能计算技术编译器及开发工具供应商 Portland Group (PGI),发布 基于 ARM 内核的 ST-Ericsson NovaThor 移动平台
    发表于 09-14 15:26 3次下载
    PGI推出基于ARM<b class='flag-5'>内核</b>的专用<b class='flag-5'>OpenCL</b>开发框架

    Android内核简单分析

    本文档内容介绍了基于Android内核简单分析,供参考
    发表于 03-16 14:05 6次下载

    如何使用英特尔SDK for OpenCL调试工具调试OpenCL主机和内核代码

    了解如何使用英特尔®SDKfor OpenCL™调试工具来调试OpenCL™主机和内核代码
    的头像 发表于 11-08 06:33 5822次阅读

    英特尔上OpenCL内核性能的优化

    Robert Ioffe描述了一系列一致的优化,可以提高英特尔®上的OpenCL内核性能Iris™图形或英特尔®Iris™Pro图形,使用英特尔®SDKfor OpenCL™应用程序2
    的头像 发表于 11-07 06:16 2887次阅读

    OpenCL应用程序的主机代码和内核元素

    用于异构计算的OpenCL标准为实现OpenCL标准的所有计算设备定义了基本编程模型。 该视频介绍了OpenCL应用程序的主机代码和内核元素。 这些映射......
    的头像 发表于 11-30 06:17 1985次阅读

    如何使用SLX FPGA优化人脸检测数据中心的OpenCL AI内核

    本案例介绍了如何使用Silexica的SLX FPGA优化人脸检测数据中心的OpenCL AI内核。 引言 FPGA正越来越多地被用作数据中心的协处理器。这一转变背后的驱动力是利用FPGA的并行特性
    的头像 发表于 05-08 14:55 1745次阅读
    如何使用SLX FPGA<b class='flag-5'>优化</b>人脸检测数据中心的<b class='flag-5'>OpenCL</b> AI<b class='flag-5'>内核</b>?

    硬件电路如何设计调整内核供电

    DVFS 即动态电压频率调整,针对 SOC主频的不同,需要动态调整 SOC 的 Core Power。通过调整内核供电电压,实现SOC主频的调整
    的头像 发表于 09-19 17:01 435次阅读
    硬件电路如何设计<b class='flag-5'>调整</b><b class='flag-5'>内核</b>供电

    如何优化Linux内核UDP收包效率低

    真的很低,这是为什么?有没有办法去尝试着优化?而不是动不动就DPDK。 我们从最开始说起。 Linux内核作为一个通用操作系统内核,脱胎于UNIX那一套现代操作系统理论。 但一开始不知道怎么回事将网络协议栈的实现塞进了
    的头像 发表于 11-10 10:51 279次阅读
    如何<b class='flag-5'>优化</b>Linux<b class='flag-5'>内核</b>UDP收包效率低

    Linux内核slab性能优化的核心思想

    性能问题(在不同的场景下面),并给出了这些问题的优化方案,这个对我们实现高性能内存池算法,或以后遇到内存性能问题的时候,有一定的启发,值得我们学习。 Linux内核的slab来自一种很简单的思想,即事先准备好一些会频繁分配,释放
    的头像 发表于 11-13 11:45 327次阅读
    Linux<b class='flag-5'>内核</b>slab性能<b class='flag-5'>优化</b>的核心思想