0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

AI时代进一部发展需要的新架构概述

电子工程师 2018-04-14 09:13 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

视觉应用与人工智能AI)正朝着精细化的方向发展,其背后的多种推动力中,最重要的两种是高端智能手机的先进功能以及ADAS(高级驾驶辅助系统)/自动驾驶技术。

智能手机的面部识别功能需要同时调用视觉与AI处理两种技术,而且技术难度不断增加。最难的部分在于非理想状态下的面部识别,如侧脸、戴帽子、部分脸被围巾遮盖等。为此,智能手机的摄像头变得越来越精细,采用多种传感器实现高动态范围图像(HDR)、双摄变焦、图像稳定等功能。

第二个推动力,即ADAS,它的设计需要满足两大需求。第一个是面向特定功能的性能要求,比如行人侦测、驾驶员注意力监控、道路偏离预警;第二个是降低功耗。大多数芯片都安装在空气流通较差的环境(没有风扇),甚至极端温度环境,如前挡风玻璃上后视镜的背面。

还有一些其他驱动因素,如虚拟现实、增强现实、机器人无人机、监控摄像头等技术的发展,它们的需求与上述场景大同小异。

上述功能、视觉和AI技术通常被集成到单独的摄像头管道,从降噪、视觉后处理等任务开始,再到图像分类和分割。有时候,AI需要先完成场景分类,然后再执行HDR或Bokeh焦外成像(模糊处理在日语里被称作 boke)等精细图像处理任务。

总体看来,目前有以下三种技术需求:

将视觉和AI处理集成在单一DSP

提升性能

极低功耗的限制

为了满足这三种技术需求,新一代Tensilica Vision处理器应运而生。

全新Tensilica Vision Q6简介

提高性能,我们考虑了下面几套可选方案:

增加SIMD宽度或VLIW槽的数量。但是这样会增加编程难度,因为很多闲散资源无法有效利用。简单地增加算力比有效地利用算力要简单。

多核。可以立马将可用处理能力提高一倍(或更多),但是需要两倍的本地内存,而且很难做到每个核计算负载的平衡

升频。显而易见的提高性能的方法,但代价是面积(成本)和功耗的增加

打造更高性能的新架构

AI时代进一部发展需要的新架构概述

Cadence决定采取第四种方案。全新Vision Q6 DSP是第五代产品,面向视觉和AI 应用量身打造,采用13级流水线,16nm工艺下可实现1.5GHz处理器频率。较上一代P5,相同版图面积条件下的频率提升达50%。峰值性能的效率提高1.25倍。采用标准图像处理内核时,性能提升可达2倍。

流水线构成如下:

指令前端(3级)

指令解码与分派(2级)

AR/标量整数管道(5标量寄存器/标量流水线)

矢量DSP(3级)

读取和写入会在指令解码一级完成后分别进行。同时,矢量执行和标量执行也分开进行,这样可以提高标量性能,并提供了增加标量cache的机会。该cache可以提高标量处理能力50%,而且存储器速度越慢,cache优势就越明显(与没有cache的情况相比)。

Q6的另一个新特色是添加了一个分支预测。流水线越深,这个功能就越重要,因为一旦错过就必须清空并重新填充流水线。

Q6与P6向上兼容,为P6写的任何代码都可以无需修改在Q6上运行。但是Q6有一些新指令无法在P6上运行。

AI时代进一部发展需要的新架构概述

凭借AXI4互联技术,Q6可以在多处理器环境中运行。用户不仅可以使用多个Q6 核,在VQ6的系统中增加VisionC5来分担AI的处理。

Q6编程

AI时代进一部发展需要的新架构概述

在芯片上设计一大堆高性能处理资源是很容易的,但程序员可能最终无法从高层软件开发中获得这些处理资源。AI采用多种框架,Q6可以实现以下功能:

安卓神经网络:在安卓平台(即非苹果智能机)上实现本地AI应用

TensorFlow、TensorFlow Lite、Caffe

定制层支持:用户可以在标准网络基础上自行添加特殊功能

支持多种标准神经网络(MobileNet、Inception、Resnet、VGG、Segnet、FCN、YOLO、RCNN、SSD等)

安卓神经网络(ANN)相对比较新,去年10月刚刚发布,到现在也就半年的时间。ANN提供的神经网络API可以让开发者无需关注具体AI处理是在应用处理器(通常是高端ARM处理器)还是在专有的AI DSP上执行。。Q6支持运行在安卓8.1系统(Oreo)的ANN,可实现实时的优化执行。右图显示的是ANN各组件的协作方式。作为专用处理器(也可称DSP,术语不同而已)的Q6位于流程的中心

AI时代进一部发展需要的新架构概述

上图中显示的是现有Tensilica AI工具链,也称为XNNC(Xtensa神经网络编译器)。该工具链需要一个神经网络描述符(在Caffe或Tensorflow框架下)将其编译成可以在Q6(或P6、C5)上运行的代码。它可以自动处理许多管理工作,如DMAtile管理。Tensilica AI处理技术采用8位定点权重,但经过几年的发展,32位浮点和8位定点也能实现同样的精度了(约0.5%量子化误差),其好处就是可以节省大量的功耗和面积。

对于HDR、语音身份认证、图像稳定等特殊算法,Cadence正与相关领域的合作伙伴展开广泛合作。我们还是Khronos公司OpenVX工作组的负责人,推动视觉处理分流标准的开发。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41173

    浏览量

    302626
  • adas
    +关注

    关注

    311

    文章

    2341

    浏览量

    212125

原文标题:新的AI时代需要新架构:Tensilica Vision Q6

文章出处:【微信号:gh_fca7f1c2678a,微信公众号:Cadence楷登】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Token烧了几十亿,代码还是团乱!AI原生开发该怎么管理?

    你与大模型聊天干活的记录,或许可用于做次新的“MBTI”性格测试。当驾驭工程的不少事儿都能交给 AI 工具去做,我们只需要“观测”与“控制”,迎接“人人都是技术管理者”的时代。以前,
    发表于 04-14 19:50

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    实例,从而保持高计算效率。 2、Q算法 Q项目将大模型功能与A*和Q-learning等复杂算法结合,进一步推动了AI领域的蓬勃发展,标志着向AGI方向迈出了重要的步。 可能达到的高
    发表于 09-18 15:31

    适应边缘AI全新时代的GPU架构

    电子发烧友网站提供《适应边缘AI全新时代的GPU架构.pdf》资料免费下载
    发表于 09-15 16:42 47次下载

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    连接定义了神经网络的拓扑结构。 不同神经网络的DNN: 、基于大模型的AI芯片 1、Transformer 模型与引擎 1.1 Transformer 模型概述 Transformer 模型的出现
    发表于 09-12 17:30

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片的需求和挑战

    当今社会,AI已经发展很迅速了,但是你了解AI发展历程吗?本章作者将为我们打开AI发展历程以
    发表于 09-12 16:07

    【「AI芯片:科技探索与AGI愿景」阅读体验】+内容总览

    章 具身智能芯片 第9章 从AI芯片到AGI芯片 图2 各章重点及逻辑框架 该书可供AI和芯片领域的各层次人群阅读,无论是学习者还是研究人员。 对于本人来说,读这本书不但是为了丰富这方面的知识,更主要的是为孩子读研选择个有前
    发表于 09-05 15:10

    招镶入式工程师1个,硬件工程师个,

    东莞市研生科技有限公司是家蓝牙方案公司,主营蓝牙方案的设计开发,产品包括蓝牙BLE/4G透传/AI智能体方案开发,因公司发展需要需对外招聘嵌入式软件开发工程师,对蓝牙音频/BLE以及智能IC读卡器有三年实操经验,能单独完成项目
    发表于 08-29 02:14

    AI 芯片浪潮下,职场晋升新契机?

    职场、渴望在专业领域更进一步的人来说,AI 芯片与职称评审之间,实则有着千丝万缕的联系,为职业晋升开辟了新的路径。 AI 芯片领域细分与职称对应 目前,AI 芯片从技术
    发表于 08-19 08:58

    数智化时代企业IT基础架构将何去何从

    随着AI迅猛发展,算力、存力、运力成了新战场,从拼资源到拼底座、拼架构,那怎样的基础架构能撑得起企业AI的全场景落地?
    的头像 发表于 08-06 11:20 1054次阅读

    AI的未来,属于那些既能写代码,又能焊电路的“双栖人才”

    ”,再聪明的模型也只能停留在实验室。典型的场景有:场景需要的“双栖能力”将YOLOv8署到边缘盒子算法裁剪 + NPU指令调优 + 电源与内存优化AI PC系统集成AI协处理器驱动
    发表于 07-30 16:15

    飞腾OPS电脑助力5G、AI时代智能教育发展新趋势

    随着科技的飞速发展,我们已经步入了5G、AI时代,在这样的背景下,我们的教育方式也需要与时俱进。
    的头像 发表于 06-27 17:07 687次阅读

    AI时代下光模块的发展前景

    CPO(共封装光学)的技术跃迁,光模块不仅是数据传输的“高速公路”,更是AI大模型训练与推理的“输血管道”。本文将深度解析AI时代下光模块产业的技术演进、市场需求与竞争格局,展望其未来发展
    的头像 发表于 06-25 16:04 2214次阅读

    Transformer架构概述

    由于Transformer模型的出现和快速发展,深度学习领域正在经历场翻天覆地的变化。这些突破性的架构不仅重新定义了自然语言处理(NLP)的标准,而且拓宽了视野,彻底改变了AI的许多
    的头像 发表于 06-10 14:24 1448次阅读
    Transformer<b class='flag-5'>架构</b><b class='flag-5'>概述</b>

    中软国际科创中心驱动AI产业未来发展

    当前,AI产业生态整体性跃升带来产业格局加速重塑,同时,培养适应产业发展需要的未来人才成为新课题。中软国际科创中心以服务模式创新与产业协同双轮驱动 AI 产业发展,打造智能
    的头像 发表于 05-20 15:57 1039次阅读

    AI时代企业需要怎样的数据存储

    随着 DeepSeek 等新代开源大模型的发布,AI 变得越来越智能,使用更少的资源就能够创造更高的应用价值,越来越多的企业都正在由内而外、由浅入深地部署各种 AI 应用。从更大的视角看,市场
    的头像 发表于 05-07 14:41 1397次阅读
    <b class='flag-5'>AI</b><b class='flag-5'>时代</b>企业<b class='flag-5'>需要</b>怎样的数据存储