0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于FPGA的异构计算是趋势

SwM2_ChinaAET 来源:未知 作者:李倩 2018-04-25 09:17 次阅读

算起来,人工智能AI)概念已经提出60多年了,而最近两年,得益于智能终端的普及带来的数据爆发式增长,以及深度学习神经网络算法的发展,AI市场受到了空前的关注,但AI要得以快速普及,还缺少高算力的推动,需要提供更好的硬件加速条件。

2018年4月17日,业界领先的异构加速和业务卸载方案提供商杭州加速云信息技术有限公司在京举办了科技峰会及新产品发布会,隆重发布了四大创新产品(两个系列硬件加速产品(SC-OPS, SC-VPX)、两个IP库 (FDNN, FBLAS))及三大解决方案(深度学习解决方案、高性能计算及数字信号处理解决方案、边缘计算解决方案)。

抢先布局异构计算

杭州加速云信息技术有限公司创始人兼CEO邬刚是学习通信出身,最早跟随中国程控电话交换机之父邬江兴院士进入通信行业。两年之后,他加入了华为负责芯片设计。2007年开始创业,创办过3家公司,对CPU总线、多核处理器的发展有着清晰的理解。经过多年的积累和对未来市场的预估,2015年9月,邬刚先生创办了加速云。

杭州加速云信息技术有限公司创始人兼CEO 邬刚

加速云的解决方案可以广泛应用于深度学习、人工智能、金融、机器视觉等领域。目前已与阿里、腾讯、科大讯飞等多家企业开展深入合作。

“加速云是从技术上推导出来的一家公司,起源于2014年我们家迎来第一个小朋友,在陪产过程中形成的一个想法。” 邬刚先生提及创办加速云的心路历程,“在2014年,按照英特尔的发展,下一步一定是异构,我们当时认为异构,要么用GPU,要么用FPGA。英特尔在GPU上有一次失败尝试,加上GPU自身功耗太高等问题,FPGA会是异构计算的一个理想选择。”

事实上,在加速云诞生之初已经拥有强大的技术储备。基于FPGA来做异构计算是邬刚先生2014年4月就想出来的计划,直等到2014年10月英特尔在IDF大会上宣布x86+FPGA处理器,他认为这个机会点来了,11月份正式开始研究,到2015年4月,研发出了第一代原型机,2015年9月开始量产,加速云公司随之注册。

在深度学习中,做好算法只完成了1/3,在这个团队里面,既需要很强的实现算法的能力,还要有非常强的工程化能力,这种工程化的能力,包括接口和实现量产的能力。“我们知道做出一个东西很容易,但是做好还是挺难的。我们有一个非常小的板卡,迭代了四代,每一次迭代都要花百万人民币,因为硬件投入很大,每次迭代有可能只改了一点,我们发现未来可能存在的一些风险问题,就把它改掉,这是我们团队特别的地方。我们是一个工程化能力非常强的团队,整体技术行不行是我们最重要的考量。” 邬刚先生介绍。

基于FPGA的异构计算是趋势

目前处于AI大爆发时期,异构计算的选择主要在FPGA和GPU之间。尽管目前异构计算使用最多的是利用GPU来加速,FPGA作为一种高性能、低功耗的可编程芯片,在处理海量数据时,FPGA计算效率更高,优势更为突出,尤其在大量服务器部署时,隐形的运营成本会得到显著降低。

此外,低延迟、确定性延迟,也是FPGA天然的优势。

邬刚表示:“人工智能已经进入我们的生活,但是未来发展还存在瓶颈,需要硬件技术和算法方面的突破。异构计算是计算架构的未来趋势,而FPGA 是实现异构计算的完美选择。加速云创新的异构计算加速平台解决方案,具有高性能、高效率、低延时特性以及可编程性和远程可重构能力,非常适合云上的弹性业务的需求。我们希望能够通过我们的技术,帮助更多的企业实现深度学习,在大数据时代赢得先机。”

全球最高性能FPGA加速卡

SC-OPS是加速云推出的全球首张Intel Stratix 10 FPGA加速卡,采用Intel最新14nm工艺的Stratix10 GX2800 FPGA器件,单板支持12个200维双精度线性方程求解,运算时间为466us,为x86系统60~120倍性能;单卡可以实现4500帧/S以上图像分类(采用AlexNet卷积神经网络模型,int16)。

SC-OPS可以广泛应用于数据中心云计算、机器视觉、深度学习、高性能计算、仿真、金融等领域。

全球最高集成度VPX业务卡

SC-VPX是全球计算密度最高的VPX刀片加速平台,采用Intel Stratix 10 GX2800器件,兼容GX1650,构造业界先进、灵活、高效的信号处理和深度学习架构,主要定位高校研究所等单位的雷达、通信、深度学习相关领域的产品原型快速搭建和算法开发与应用。

6U整机可以支持92T/50T FLOPS单精度浮点处理能力,整机可以通过交换板互联构筑更大的系统;支持OpenCL、Verilog开发,支持高性能计算库。

RTL级深度学习加速库

深度学习加速库FDNN是国内首个支持通用卷积神经网络的FPGA加速库,基于RTL级代码,可以提供很高的性能和灵活配置特性。

参数可配置的深度学习基础库:卷积、池化、全连接、非线性函数;兼容CAFFE/TensorFlow模型数据;常见各种模型:VGG16, Lenet, YOLO, SSD, ResNet。

RTL级高性能数学加速库

高性能计算加速库FBLAS是业界更高性能的RTL级数学加速库。参数可配的OpenBlas库Level2/3:矩阵乘、矩阵分解、矩阵求逆,线性方程求解、微分方程求解,三角函数、非线性求解、超越函数,傅里叶变换。

FDNN是专门为深度学习设计的,FBLAS更多是偏向于数字信号处理和高性能计算。

三大解决方案

•深度学习加速解决方案-加速云推出一整套基于FPGA的深度学习加速方案,包括SC-OPM/SC-OPF/SC-OPS加速卡及FDNN加速库,满足客户对深度学习高性能、灵活性加速要求。为了方便客户使用高层语言开发,加速云提供基于FPGA完整的OpenCL异构开发环境,快速实现用户自定义的深度学习加速方案。同时加速云也提供快速深度神经网络定制加速服务。

•数字信号处理解决方案-针对雷达、通信等数字信号处理系统的要求,结合Intel最新14nm工艺的 Stratix10 FPGA系列,加速云提供了一套完整的硬件和软件相结合的解决方案,实现了高性能矩阵运算(矩阵乘、转置、求逆、QR分解)和超高速FFT(傅立叶变换)。为了方便客户使用高层语言开发,加速云提供基于FPGA完整的OpenCL异构开发环境,快速实现用户自定义的信号处理加速方案。

•边缘计算解决方案-加速云智能工控解决方案采用高性能Intel Arria10 GX660器件, 具有模块化设计,强实时特性和高性能的算法IP加速、完整的OpenCL异构开发环境,可以实现新一代高性能边缘计算网关,应用于各种工业环境。

加速云最核心的竞争力在于其IP方面,除了用于数字信号处理和高性能计算的数学库FBLAS,以及用于深度学习的FDNN库,还具有很多接口类的IP(高速通信接口视频接口)、协议类IP(压缩、解压缩、加解密),研发团队在FPGA方面有着十多年的经验,积累了很多相关的IP。

凭借自身在FPGA上的技术优势,加速云获得合作伙伴的大力支持,可以率先拿到英特尔第一批流片的内部测试芯片,对加速云保持技术领先非常重要。

北京站是加速云“加速新科技,驱动智未来” 科技峰会的首站,接下来加速云将在上海、成都、西安三大城市分享其最新成果。过去两年,加速云平均每年都有获得一次融资,据悉,第三轮融资正在达成。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • FPGA
    +关注

    关注

    1602

    文章

    21320

    浏览量

    593173
  • 人工智能
    +关注

    关注

    1776

    文章

    43845

    浏览量

    230596
  • 深度学习
    +关注

    关注

    73

    文章

    5237

    浏览量

    119907

原文标题:【市场观察】异构看好FPGA 加速云要为AI高算力加速

文章出处:【微信号:ChinaAET,微信公众号:电子技术应用ChinaAET】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    FPGA异构计算架构的深度对比研究

    FPGA本质是一种可编程的芯片。可以把硬件设计重复烧写在它的可编程存储器里,从而使FPGA芯片可以执行不同的硬件设计和功能。
    发表于 04-01 14:53 75次阅读
    <b class='flag-5'>FPGA</b><b class='flag-5'>异构计算</b>架构的深度对比研究

    高通NPU和异构计算提升生成式AI性能 

    异构计算的重要性不可忽视。根据生成式AI的独特需求和计算负担,需要配备不同的处理器,如专注于AI工作负载的定制设计的NPU、CPU和GPU。
    的头像 发表于 03-06 14:15 216次阅读

    科学计算与Julia技术研讨会 | 张先轶:从OpenBLAS到异构计算软件栈

    蓬勃发展,新兴科学计算语言不断涌现,Julia以其高性能、动态性成为其中的佼佼者。 12月9日上午1020 ,澎峰科技创始人 张先轶博士 将 在 主论坛:Julia与数字化和AI 上 作 “ 从OpenBLAS到异构计算软件栈” 主题演讲,期待与大家见面 ! 研讨会完整详
    的头像 发表于 11-30 19:35 404次阅读
    科学<b class='flag-5'>计算</b>与Julia技术研讨会 | 张先轶:从OpenBLAS到<b class='flag-5'>异构计算</b>软件栈

    什么是异构集成?什么是异构计算异构集成、异构计算的关系?

    异构集成主要指将多个不同工艺节点单独制造的芯片封装到一个封装内部,以增强功能性和提高性能。
    的头像 发表于 11-27 10:22 2935次阅读
    什么是<b class='flag-5'>异构</b>集成?什么是<b class='flag-5'>异构计算</b>?<b class='flag-5'>异构</b>集成、<b class='flag-5'>异构计算</b>的关系?

    国产FPGA简介

    、智能汽车、电子设备、电力与电源管理、人工智能。 目标市场:金融、电信、政务、汽车、工业互联、物联网等领域。 京微齐力 核心技术:AiPGA芯片(AI in FPGA)、异构计算HPA芯片
    发表于 11-20 16:20

    异构计算为什么会异军突起?基于FPGA异构计算讨论

    简单的介绍几个概念,同道中人可以忽略这一段。云计算取代传统IT基础设施已经基本成为业界共识和不可阻挡的趋势
    发表于 10-26 10:04 252次阅读
    <b class='flag-5'>异构计算</b>为什么会异军突起?基于<b class='flag-5'>FPGA</b>的<b class='flag-5'>异构计算</b>讨论

    异构时代:CPU与GPU的发展演变

    异构计算是指在一个系统中使用不同类型的处理器来执行不同的计算任务,以提高性能,效率和可靠性。随着摩尔定律的放缓,单一类型的处理器已经难以满足日益增长的运算需求。与此同时,不同类型的处理器具有各自
    的头像 发表于 10-24 10:17 559次阅读
    <b class='flag-5'>异构</b>时代:CPU与GPU的发展演变

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?

    请问模型推理只用到了kpu吗?可以cpu,kpu,fft异构计算吗?
    发表于 09-14 08:13

    SOLIDWORKS仿真计算是什么意思?

    SOLIDWORKS仿真计算是指利用SOLIDWORKS软件进行工程设计和分析时所使用的计算方法和技术。SOLIDWORKS是一款流行的三维计算机辅助设计(CAD)软件,它提供了丰富的工具和功能,使工程师能够创建和模拟各种产品和
    的头像 发表于 09-06 15:42 639次阅读
    SOLIDWORKS仿真<b class='flag-5'>计算是</b>什么意思?

    中科驭数受邀在招商银行金融科技论坛作异构计算主题分享 解码金融科技先进算力构建之路

    8月25日,2023招银浦江金融科技论坛正式召开。中科驭数高级副总裁张宇受邀在资管科技分论坛发表《金融行业先进异构算力底座构建之路》的主题演讲,与参会嘉宾分享了当前计算系统的发展趋势以及如何通过
    的头像 发表于 08-25 18:20 589次阅读
    中科驭数受邀在招商银行金融科技论坛作<b class='flag-5'>异构计算</b>主题分享 解码金融科技先进算力构建之路

    新一代计算架构超异构计算技术是什么 异构走向超异构案例分析

    异构计算架构是一种将不同类型和规模的硬件资源,包括CPU、GPU、FPGA等,进行异构集成的方法。它通过独特的软件和硬件协同设计,实现了计算资源的灵活调度和优化利用,从而大大提高了
    发表于 08-23 09:57 452次阅读
    新一代<b class='flag-5'>计算</b>架构超<b class='flag-5'>异构计算</b>技术是什么 <b class='flag-5'>异构</b>走向超<b class='flag-5'>异构</b>案例分析

    异构计算场景下构建可信执行环境

    异构计算场景下,如何构建可信执行环境呢?分布式机密计算是一种思路,将CPU上的技术应用到其他的XPU上是另一种思路,但最关键的问题是怎么用。该问题在AI安全上非常明显,AI模型都在GPU上,TEE想用
    发表于 08-15 17:35

    异构计算的初步创新

    更 高,x16带宽(双向)从64 GB/s提 升到了128 GB/s;目前规范制定已迭 代至6.0版本,带宽再翻倍。 异构计算的初步创新:在
    的头像 发表于 06-19 11:26 459次阅读
    <b class='flag-5'>异构计算</b>的初步创新

    PrimeSimSPICE:异构计算模型实现数量级性能突破

    随着对更高计算性能的需求不断增加,HPC 行业正朝着异构计算模型发展,其中 GPU 和 CPU 协同工作以执行通用计算任务。在这种异构计算模型中,GPU 充当 CPU 的加速器,以减轻
    的头像 发表于 05-24 16:53 589次阅读
    PrimeSimSPICE:<b class='flag-5'>异构计算</b>模型实现数量级性能突破

    构建面向异构算力的边缘计算云平台

    数据又消费数据,再慢慢到设备与设备之间的信息互联,万物互联的时代已然到来。 在万物互联时代,需要计算的数据越来越多,需求在不断的变化,异构计算能够充分发挥 CPU/GPU 在通用计算上的灵活性,及时响应数据处理需求,搭 配上
    发表于 05-18 17:15 0次下载
    构建面向<b class='flag-5'>异构</b>算力的边缘<b class='flag-5'>计算</b>云平台