谷歌近日为其Android上的TensorFlow框架开发了新的基于OpenCL的移动GPU推理引擎,与现有的OpenGL后端相比,新的推理引擎速度是前者的2倍。
OpenGL是一种渲染图形API,其应用已近30年之久,目前常用的GPU推理引擎均是以OpenGL开发。虽然在 OpenGL ES 3.1中新增了计算着色器Compute Shader,但TensorFlow团队表示,向后兼容的设计限制了GPU的运算能力。
而OpenCL从一开始就是为使用各种计算加速而设计的,因此更为适合移动GPU推理领域。这促使TensorFlow团队对基于OpenCL的移动推理引擎进行了考察,并最终决定采用该引擎。TFLite开发团队提到,与OpenGL相比,最佳化OpenCL后端要简单许多,因为OpenCL提供良好的分析功能,利用概要分析API,开发团队能够精确地量测核心调度效能。
值得一提的是,这一推理引擎具有完整的效能分析功,也就是说优化器会选择适合大小的神经网络工作组以提高GPU的效率。且原生支持FP16,即使在比较老旧的GPU硬件上,如2012年的Adreno 305也可完美发挥出GPU的效能。
责任编辑:pj
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
谷歌
+关注
关注
27文章
6259浏览量
111966 -
gpu
+关注
关注
28文章
5271浏览量
136062 -
硬件
+关注
关注
12文章
3631浏览量
69169
发布评论请先 登录
相关推荐
热点推荐
ASPICE 3.1 与 4.0 版本的核心差异:从软件专属到全系统覆盖(四)
行业应用中的核心痛点。
ASPICE 4.0 版本
ASPICE 4.0 版本彻底解决了这一问题, 正式新增 HWE 硬件工程过程组 ,包含 HWE.1 硬件需求分析、HWE.2 硬件设计、HWE.3
发表于 04-08 09:48
PowerVR:推动开源 Zink 与 OpenGL ES 支持的发展路径
://docs.mesa3d.org/drivers/zink.htmlZink解决了通过Vulkan运行OpenGL和OpenGLES应用的问题。它是一种转换层,不针对
深度解析ES8389/ES8390/音频芯片Linux驱动(Linux6.1内核)
在嵌入式音频开发中,顺芯( Everest ) ES8389/ES8390 是一款高集成度的音频 Codec 芯片,广泛应用于智能音箱、车载终端、便携设备等场景。本文
看点:谷歌Veo 3.1迎来重大更新硬刚Sora 2 12英寸硅片国产龙头西安奕材今日申购
给大家带来一些业界资讯: 谷歌Veo 3.1迎来重大更新硬刚Sora 2 据外媒报道,在10月16日,谷歌发布了AI视频生成模型Veo
Imagination GPU 驱动更新:新增多项 Vulkan 与 OpenCL 扩展支持
整理了本次更新的重点内容。Vulkan协作矩阵(CooperativeMatrix)支持为加速图形后处理、神经着色器、物理仿真以及GPU上的机器学习推理,DDK25
Bourns发布全新增量式微型编码器
Bourns 推出 PEC04 系列 4 mm 增量式微型编码器、PEC05 PEC05 系列 5 mm 增量式微型编码器,以及 PEC06 型号 6 mm 增量式微型编码器。Bourns 全
蔚来全新ES8掉头能有多敏捷
随着全新ES8媒体试驾及用户试驾的持续进行,有许多朋友表示:“全新ES8作为中国最大的纯电SUV,开起来却没有传统大车的笨重感”。这正是智能敏捷掉头功能的功劳,也是蔚来全栈自研能力的显
【M-K1HSE开发板免费体验】相关源码之阅读和分析1-使用XComponent + Vsync 实现自定义动画
NAPI 调用 C++ 层的功能。
src/main/cpp (C++ Native 后端层)
render: 渲染核心模块。负责所有与 OpenGL ES 相关的操作,如初始化EGL环境、编译着色器
发表于 09-03 16:05
全新蔚来ES8采用隆利科技Mini-LED背光技术
近日,蔚来全新ES8预售发布,该车型1.4米长SKYLine双24英寸数字天际线屏及21.4英寸娱乐吸顶屏均搭载了隆利科技的Mini-LED背光技术。
关于蔚来全新ES8的产品理念
还有不到一周,全新ES8就要和大家正式见面了。很多朋友都在给我发消息,询问关于这款重磅产品的更多信息。由衷地感谢大家的关心,我觉得也该好好和大家聊聊全新
全新原装福禄克FLUKE754过程校验仪
,可以输出、模拟和测量压力、温度和电信号。改进的全新图形屏幕、使用寿命更长的锂离子电池、USB 端口以及软件包中新增的附件定会博取您的衷爱。
对于记录功能,754 热工信号校验仪可自动执行校准程序并
发表于 07-24 10:45
谷歌在全新OpenGL ES 3.1中新增了计算着色器Compute Shader
评论