0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英特尔收购Omnitek背后的逻辑

t1PS_TechSugar 来源:fqj 2019-05-15 15:11 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

四月中旬,英特尔宣布收购一家名为Omnitek的英国公司,旨在“增强FPGA在视频(video)和视觉(vision)领域的产品组合”。对于很多人来说,Omnitek并不是一个非常熟悉的名字。那么,究竟它为何受到了英特尔的青睐,以及这次收购背后的深层技术逻辑为何,就让老石在本文为大家深入分析。

Omnitek CEO与创始人

Omnitek是何方神圣

Omnitek并不是一个传统意义上的初创公司,它成立于1998年,总部位于英格兰南部的贝辛斯托克(Basingstoke),见下图。

贝辛斯托克这个小城是英国比较有名的经济和科技中心之一,巴宝莉(Burberry)就起源与此。这里集中了不少世界知名的大公司的总部或欧洲总部,其中包括很多半导体和科技公司,比如索尼、摩托罗拉、意法-爱立信等,华为的欧洲总部也曾经设在这个小城。

虽然Omnitek已经成立了超过20年,但员工总数只有四十人左右,也没有公开的融资记录。从这些方面来看,Omnitek只能算是一个中型、甚至小型的公司。

然而,在这20年中,Omnitek开发和积累了超过220个FPGA硬件IP、对应的软件系统、以及开发平台,见下图。

这些FPGA IP主要集中在视频和图像处理领域,包括使用FPGA进行超高清视频图像的旋转、形变、3D映射、编解码等等各类处理,见下图。

这些应用一直是FPGA的传统应用领域,特别是在诸如视频会议、投影、显示屏等场合。因此,就像在公布收购后的官方新闻稿中所说,这次收购将会极大的补强英特尔FPGA在视频和图像处理领域的IP资源。

然而,老石注意到,Omnitek在2018年底发布了一款自研的深度学习处理器(DPU)。与市面上任何基于FPGA的同类产品相比,Omnitek宣称这款DPU的性能有着50%的优势。同时,与GPU相比,这款DPU在给定的功耗或成本限制下也有着更加优异的性能。

在当前各类人工智能处理器xPU层出不穷的时候,Omnitek这个官宣大胆而自信。老石认为,这也是英特尔收购Omnitek背后的主要逻辑。

“地表最强”FPGA深度学习处理器

老石在之前的文章《FPGA在人工智能时代的独特优势》一文中讲过,使用FPGA对人工智能应用进行硬件加速主要有以下几个优点:

基于这些优点,Omnitek选择使用FPGA作为其深度学习处理器的主要实现平台,这与目前业界包括微软在内的很多公司不约而同,见下图。

事实上,与微软在“脑波项目”中使用的DPU相比,Omnitek的DPU在使用模型上也有着很多相似之处。这类DPU,也称为Soft DPU,最主要的特点就是提供一个基础的硬件架构,用来进行深度神经网络的计算加速;同时提供完整的软件编程接口和编译器,使得上层用户使用高层语言对神经网络进行配置。

这种架构的最主要优点,就是实现了软硬件的完全解耦,这也让使用者无需掌握任何硬件相关的专业知识,从而只需要专注于算法和模型本身的设计,并可以通过诸如Python、C/C++等高层语言对模型进行调整和配置。

与高层次综合(HLS)相比,这种基于FPGA的DPU设计方法无论在性能、开发敏捷性、编译时间等各个领域都有着明显优势。

Omnitek DPU的主要特点

与微软DPU相比,Omnitek的DPU又有着自己独有的特点。它的系统架构图如下所示。

英特尔收购Omnitek背后的逻辑

可以看到,用户可以使用TensorFlow、Caffe或者OpenVINO等主流机器学习框架构建的模型,或者是自己用高层语言编写的模型,通过DPU编译器生成特定的微代码(Microcode),这与微软DPU采用数据流图的方式不同。这些微代码将被用来配置FPGA上的DPU数据处理流水线,如下图所示。

英特尔收购Omnitek背后的逻辑

Omnitek DPU的另一个主要特点是可以通过编程,调整对不同DNN拓扑的支持效率。通常来讲,某种DNN硬件加速器往往是针对某种特定的DNN拓扑设计的。以谷歌的TPU为例,它对于阿尔法狗所使用的CNN模型(CNN0)有着很高的运行效率,高达78.2%,平均性能也可以达到86TOPS,见下图。然而对于另外的CNN模型,如GoogleNet(CNN1),谷歌TPU只能达到46.2%的运行效率,性能也骤降至14.1TOPS。

英特尔收购Omnitek背后的逻辑

由此可见,不同CNN模型对于单一硬件架构的实际性能有着很大影响。除CNN之外,诸如RNN和MLP等其他DNN拓扑有着和CNN明显不同的特点。除此之外,随着人工智能理论研究的不断推进,想必会不断涌现出其他更加新颖的网络拓扑结构。因此,如果使用相同的硬件架构对这些DNN拓扑“一视同仁”,则必然不会得到满意的性能。

英特尔收购Omnitek背后的逻辑

对于这种情况,也只有FPGA能够快速调整硬件结构,以适应不同的网络拓扑结构,这是ASIC或GPU都无法实现的。而这也是Omnitek DPU的另一个主要特点。

此外,Omnitek DPU还使用了“片上网络(NoC)”技术,将多个DPU进行互联和数据共享,如下图所示。NoC是目前在大型芯片上进行数据共享和高速传输的新型技术,在赛灵思最新的ACAP架构上,也使用了NoC技术,这在之前的文章《赛灵思下一代计算平台ACAP技术细节全揭秘》中有过深入解读,有兴趣的读者可以看看,在本文中就不再赘述。

英特尔收购Omnitek背后的逻辑

性能方面,Omnitek公布了在英特尔Arria10 GX1150 FPGA上实现的DPU性能数据,如下所示。

英特尔收购Omnitek背后的逻辑

单就上面的数字来看,特别是TOPS一栏,只能说差强人意。不过性能功耗比(GOPS/W)比较高,能够体现FPGA的低功耗优势。同时考虑到Arria10是一款基于20nm工艺的FPGA,因此可以预期当使用更先进的FPGA,如Stratix 10(14纳米)或Agelix(10纳米)时,上面的数字将无疑会有大幅提升。

事实上,Omnitek也有使用赛灵思16纳米UltraScale+ FPGA所取得的性能结果,比上面的数据有着明显提升,本文不再给出,有兴趣的读者欢迎在老石谈芯后台回复“DPU”查看。

结语

Omnitek作为一家做了20年的视频图像FPGA IP提供商,刚刚切入人工智能芯片领域,就依托技术积累开发出了地表最强的深度学习处理器,并随后被英特尔收购,这一系列操作实在让人眼花缭乱。

这次收购对于英特尔而言,不仅补强了其在视频和图像处理领域的FPGA IP组合,更是直接得到了Omnitek已经比较成熟的DPU软硬件方案。这无疑进一步扩展了英特尔在人工智能领域的产品布局和多样性。

Omnitek的官网上列出了很多公司的核心价值观,其中很有趣的一点,就是它允许员工有着灵活的工作时间,因为公司“理解对于所有员工来说,保持‘朝九晚五’的工作时间是很困难的”。这在996盛行的今天,无疑更加值得我们思考,工作和生活,哪个才是我们应该追求的福报。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英特尔
    +关注

    关注

    61

    文章

    10335

    浏览量

    181284

原文标题:【分析】英特尔收购Omnitek背后的逻辑

文章出处:【微信号:TechSugar,微信公众号:TechSugar】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    超越台积电?英特尔首个18A工艺芯片迈向大规模量产

    电子发烧友网报道(文/李弯弯)10月9日,英特尔公布了代号Panther Lake的新一代客户端处理器英特尔®酷睿™Ultra(第三代)的架构细节,这款产品预计于今年晚些时候出货。Panther
    的头像 发表于 10-11 08:14 9512次阅读
    超越台积电?<b class='flag-5'>英特尔</b>首个18A工艺芯片迈向大规模量产

    英特尔宣布新人事任命

    近日,英特尔宣布了一系列重要的领导层任命,涉及客户端计算业务和公司整体技术战略两大核心板块。这两项任命被视为英特尔在当前转型关键期的重要布局,释放出公司在客户端计算和前沿技术领域加速推进的明确信号。
    的头像 发表于 05-13 09:19 682次阅读

    苹果与英特尔正式达成代工协议,芯片供应链格局迎来重大调整

    经过一年多的密集磋商,苹果与英特尔近日正式达成代工合作协议。据业内多方消息,待英特尔18A-P工艺成熟上线后,英特尔或将为苹果代工CPU核心,而台积电继续负责GPU部分;另有观点认为,苹果可能先将上代手机芯片交由
    的头像 发表于 05-09 11:12 1215次阅读

    AI工作站本地养龙虾!英特尔双芯混合算力,告别云端Token焦虑

    4月23日,英特尔公司在北京举办新一代AI工作站平台发布会,英特尔中国区技术部总经理高宇宣布,面向AI工作站,英特尔推出两大重磅产品:英特尔® 至强600工作站处理器与
    的头像 发表于 04-26 16:27 1.1w次阅读
    AI工作站本地养龙虾!<b class='flag-5'>英特尔</b>双芯混合算力,告别云端Token焦虑

    锐宝智联入选英特尔首批尊享级合作伙伴

    近日,英特尔全球战略级生态计划---英特尔合作伙伴联盟完成里程碑式战略升级,原最高等级 “钛金级” 正式迭代为 “尊享级”,标志着英特尔生态合作体系迈入更高质量、更深度协同的新阶段。锐宝智联凭借十
    的头像 发表于 12-02 18:16 1694次阅读
    锐宝智联入选<b class='flag-5'>英特尔</b>首批尊享级合作伙伴

    吉方工控亮相2025英特尔技术创新与产业生态大会

    2025年11月19日至20日,由英特尔公司主办的年度重磅盛会——2025英特尔技术创新与产业生态大会(Intel Connection)暨英特尔行业解决方案大会(Edge Industry Summit)在重庆悦来国际会议中心
    的头像 发表于 11-24 16:57 820次阅读

    英特尔举办行业解决方案大会,共同打造机器人“芯”动脉

    11月19日,在2025英特尔行业解决方案大会上,英特尔展示了基于英特尔® 酷睿™ Ultra平台的最新边缘AI产品及解决方案,并预览了针对边缘侧的英特尔® 酷睿™ Ultra处理器(
    的头像 发表于 11-19 21:51 7228次阅读
    <b class='flag-5'>英特尔</b>举办行业解决方案大会,共同打造机器人“芯”动脉

    美国商务部推进收购英特尔10%股份 估值约达105亿美元

    据外媒报道;美国商务部正在积极推进收购英特尔10%股份。特朗普政府此前已经明确表示政府考虑将英特尔获批的联邦补贴转换为英特尔股权;联邦补贴就是此前的《芯片法案》拨款;估计为
    的头像 发表于 08-20 12:25 935次阅读

    美国政府将入股英特尔

    据彭博社报道称,特朗普政府正在与芯片制造商英特尔进行谈判,希望美国政府入股这家陷入困境的公司,随后该公司股价周四上涨 7% 。 英特尔是唯一一家有能力在美国本土生产最快芯片的美国公司,尽管包括台湾
    的头像 发表于 08-17 09:52 1334次阅读

    使用英特尔® NPU 插件C++运行应用程序时出现错误:“std::Runtime_error at memory location”怎么解决?

    使用OpenVINO™工具套件版本 2024.4.0 构建C++应用程序 使用英特尔® NPU 插件运行了 C++ 应用程序 遇到的错误: Microsoft C++ exception: std::runtime_error at memory location
    发表于 06-25 08:01

    英特尔锐炫Pro B系列,边缘AI的“智能引擎”

    2025年6月19日,上海—— 在MWC 25上海期间,英特尔展示了一幅由英特尔锐炫™ Pro B系列GPU所驱动的“实时响应、安全高效、成本可控”的边缘AI图景。 英特尔客户端计算事业部边缘计算
    的头像 发表于 06-20 17:32 1121次阅读
    <b class='flag-5'>英特尔</b>锐炫Pro B系列,边缘AI的“智能引擎”

    分析师:英特尔转型之路,机遇与挑战并存

    内容编译自投资分析师Oliver Rodzianko观点文章 作为一名长期关注英特尔发展的投资者,我对陈立武(Lip-Bu Tan)出任英特尔 CEO充满期待。陈立武的管理风格兼具魄力与战略眼光
    的头像 发表于 06-10 10:59 731次阅读
    分析师:<b class='flag-5'>英特尔</b>转型之路,机遇与挑战并存

    英特尔先进封装,新突破

    在半导体行业的激烈竞争中,先进封装技术已成为各大厂商角逐的关键领域。英特尔作为行业的重要参与者,近日在电子元件技术大会(ECTC)上披露了多项芯片封装技术突破,再次吸引了业界的目光。这些创新不仅展现
    的头像 发表于 06-04 17:29 1574次阅读

    直击Computex2025:英特尔重磅发布新一代GPU,图形和AI性能跃升3.4倍

    5月19日,在Computex 2025上,英特尔发布了最新全新图形处理器(GPU)和AI加速器产品系列。包括全新英特尔锐炫™ Pro B系列GPU——英特尔锐炫Pro B60和英特尔
    的头像 发表于 05-20 12:27 5765次阅读
    直击Computex2025:<b class='flag-5'>英特尔</b>重磅发布新一代GPU,图形和AI性能跃升3.4倍

    英特尔发布全新GPU,AI和工作站迎来新选择

    英特尔推出面向准专业用户和AI开发者的英特尔锐炫Pro GPU系列,发布英特尔® Gaudi 3 AI加速器机架级和PCIe部署方案   2025 年 5 月 19 日,北京 ——今日,在
    发表于 05-20 11:03 1951次阅读