0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

生态积累并非一蹴可几,高通选择稳健循序渐进

电子工程师 来源:lq 2019-01-29 13:56 次阅读

高通在夏威夷发表新一代移动平台骁龙855,以及衍生自骁龙855的计算平台骁龙8cx,其不论是规模之大,以及在架构上的革新的确令人惊艳,然而对高通而言,SoC技术本身只是一部份重点,背后的生态更值得一提。

作为本世代移动SoC的重点,AI特性是本次高通着重突出的要素之一,同时高通也对外展示了其AI软硬生态上的一些已经可落地的AI解决方案。

生态指的是支持特定技术所需要的软硬资源,以及围绕着相关技术所形成的利益圈,在资源的部分,包含了程序设计工具、开发软硬件、框架、甚至支持这个特定技术的人力资源,也就是技术/应用开发者本身也属于生态的一部份,而这也是之所以目前各大AI计算生态都要强调教育以及扩大开发者社群的根本原因。

生态积累并非一蹴可几,高通选择稳健循序渐进

然而生态需要积累,这个积累不仅仅只是针对开发环境的完备,更重要的是,为了让开发者能有更大的市场基础可以发挥,作为生态最基础的硬件本身也要具备足够的装机量,那么开发者所推出的应用才有更大的市场销售潜力,并形成利益的共同体,当开发者更有利可图,整个生态也才会更健康。

以AI生态为例,手机上的AI计算环境其实也才是这一两年的事情,业界厂商在2017年开始主打硬件化的手机AI计算环境,强调计算性能表现,然而真正在AI开发环境投入最早的,却是高通。而以AI设备的装机量而言,高通更远远超过其他所有方案厂商,包括自研芯片的手机厂。这也代表,以生态而言,高通其实拥有绝大的优势,且在不短的未来都将持续。

(来源:高通官网)

早在对手的NPU现身之前,高通就已经使用其GPUDSP的异构计算来建立AI计算生态。这种半软半硬的方式的好处在于,在整体AI计算生态成熟前,该架构可以很灵活地和各种新型态的计算框架、算法进行适配,若使用硬件NPU,可能就只能满足于最早设计目标的那几种算法,存在可能被淘汰的风险。

另外,由于高通已经坚持使用DSP/GPU的异构计算已经有数年之久,早从820系列开始,就已经支持这样的计算方式,目前其累积的装机量已经远远超出数亿支,单纯就数量而言,已经是全球最多。

业界最早投入开放AI开发环境,已累积大量资源

高通也非常强调开放的开发环境,也就是说,只要基于开放框架设计的应用,配合高通的计算环境,就能发挥出AI的计算好处。

对此,高通提供开发者一套骁龙神经处理 SDK,它可以支持 Android NN 环境。也同时支持了 Hexagon NN环境,如果开发者选择使用 Hexagon DSP 来做开发,HexagonNN 库就可以专门针对某一内核进行优化。所有这些功能为开发者带来极大的灵活性,并有助于他们实现性能最大化。这也说明,智能手机 AI 体验不能仅仅依靠一个特定的内核,更重要的是需要多种架构、多种工具所建构起来的完整体系。

早期高通手机方案的开发工具包都只针对其客户发放,而之后SNPE(骁龙神经处理)SDK针对第三方开发者的友善设计算是高通相当明智的策略转变,SNPESDK 在应用开发上的优势,以及在高通平台的基础渗透率极为庞大的状况下,成为手机 AI 的主导平台也不令人意外。

SNPE开发环境已经不再封闭,而是提供给广大的第三方 AI 应用开发者,SNPE 也理所当然的支持主流深度学习框架,包含TensorFlow、Caffe 等,而不久前才发表的TensorFlow Lite 及 Facebook 与微软合作推出的 ONNX 也同样在支持之列。在AI芯片市场上,更完备的开放式开发环境将为高通提供显著的竞争优势。

最新方案针对AI计算全面优化,达到超越对手的硬件级性能表现

而观察高通在骁龙峰会上发布的最新一代骁龙855,之所以仍不放弃异构计算方式,一方面是为了延续过去积累的计算生态优势,也就是说,针对过去旧款架构所开发的应用仍然能无痛的延续到最新平台;另一方面,通过支持骁龙855框架的自动计算单元适配,新加入的张量计算单元能够发挥其近似纯硬件NPU的算力效率,能让以通用框架开发的AI应用发挥更强大的效率表现,而若是针对高通硬件架构优化的应用,其效能提升更不在话下。

(来源:高通官网)

高通在Hexagon DSP加入的张量单元是现有AI硬件的补充,也就是说,异构计算在性能上还能得到极大的改善。根据帐面数据,DSP的性能是以前的4倍,并增加了Int16、Int8和混合指令格式,现在已经完成了对语音助手等常见用途的优化。另一方面,异构计算的另一个主角,也就是Adreno 640,则是增加了FP16和FP32指令,甚至CPU内核有PF32和Int8也是如此。

我们可以说,高通从CPU、DSP甚至GPU等核心设计,无一不是为AI打造优化。

高通公司表示,骁龙855所有计算单元的算力加总表现都超过7TOPS,它比上一代产品快3倍,与AI相关事件中最接近的竞争对手的性能提高2倍。随着张量单元的引入,以及DSP和CPU在数据计算格式的改善,这一切也都显得合理不过了。

以量取胜的绝对优势生态,开发者的支持才是市场决胜关键

高通所有的AI开发环境可回溯支持至两年前的骁龙820系列,骁龙820之后发布的骁龙600系列也加入了AI计算优化,若单纯以相关产品的销售量计算,高通已经在市场上洒出了超过竞争对手一定量级的产品。DT君认为,这种市场力量的呈现将会是决定未来AI计算生态胜负的重要关键。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高通
    +关注

    关注

    76

    文章

    7157

    浏览量

    187861
  • AI
    AI
    +关注

    关注

    87

    文章

    26413

    浏览量

    264021
  • 深度学习
    +关注

    关注

    73

    文章

    5236

    浏览量

    119893

原文标题:AI重在生态,高通骁龙结合软硬优势以海量终端碾压对手

文章出处:【微信号:deeptechchina,微信公众号:deeptechchina】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    电机控制中Iq与Id都是什么意思?

    如果想控制里面的转子转得漂亮,就需要有一套有效的控制外面的磁场的转动的方法,不能太快,也不能太慢,要根据里面的情况,循序渐进的转动外面的环,这就是电机控制方法。
    发表于 04-01 09:34 366次阅读
    电机控制中Iq与Id都是什么意思?

    基于C8051单片机的C语言的应用

      关于控制LED闪烁的程序,是希望编写程序时以循序渐进的方式,学得如何正确的推理,扩展思路,臻于细密与完整。其它大部分的程序,我也将不厌其烦的利用此渐进方式,来说明编写程序的技巧与思考方法。
    发表于 10-20 16:18 0次下载
    基于C8051单片机的C语言的应用

    Mali-G710性能计数器1.2参考指南

    本指南解释了Mali-G710 GPU的Arm Streamline评测模板中的马里性能计数器,该模板是Valhall架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-11 06:58

    Mali-G78性能计数器1.2参考指南

    本指南解释了Mali-G78 GPU的Arm Streamline评测模板中的马里性能计数器,该模板是Valhall架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-11 06:18

    Mali-G52性能计数器参考指南

    本指南解释了Mali-G52 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Bifrost架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 07:52

    Mali-G615性能计数器参考指南

    本指南解释了Mali-G615 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Valhall架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 07:48

    Mali-G710性能计数器参考指南

    本指南解释了Mali-G710 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Valhall架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 07:48

    Mali-T830性能计数器参考指南

    循序渐进的分析工作流。分析从高级工作负载分类开始,测量CPU、GPU和内存带宽使用情况。然后,对应用程序渲染工作负载的详细分析会审查应用程序对可用硬件资源的使用效率。 对于模板中的每个计数器,本指南将
    发表于 08-09 07:44

    Immortali-G715和Mali-G715性能计数器参考指南

    遵循循序渐进的分析工作流。分析从高级工作负载分类开始,测量CPU、GPU和内存带宽使用情况。然后,对应用程序渲染工作负载的详细分析会审查应用程序对可用硬件资源的使用效率。 对于模板中的每个计数器,本
    发表于 08-09 07:33

    Mali-G68性能计数器参考指南

    本指南解释了Mali-G68 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Valhall架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 07:11

    Mali-G620性能计数器参考指南

    本指南解释了Mali-G620 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Arm GPU Gen5架构系列的部分。 Streamline中的计数器模板遵循循序渐进
    发表于 08-09 07:08

    Mali-G76性能计数器参考指南

    本指南解释了Mali-G76 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Bifrost架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 07:03

    Mali-G57性能计数器参考指南

    本指南解释了Mali-G57 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Valhall架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 06:51

    Mali-T720性能计数器参考指南

    本指南解释了Mali-T720 GPU的Arm Streamline评测模板中的GPU性能计数器,该模板是Midgard架构系列的部分。 Streamline中的计数器模板遵循循序渐进的分析工作流
    发表于 08-09 06:30

    Immortali-G720和Mali-G720性能计数器参考指南

    中的计数器模板遵循循序渐进的分析工作流。分析从高级工作负载分类开始,测量CPU、GPU和内存带宽使用情况。然后,对应用程序渲染工作负载的详细分析会审查应用程序对可用硬件资源的使用效率。 对于模板中
    发表于 08-09 06:20