0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Hailo首席技术官Avi Baum深度对话

电子行业新闻 来源:电子行业新闻 作者:电子行业新闻 2025-10-17 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


Hailo的首席技术官Avi Baum致力于引领公司的技术发展和产品创新。此前,他曾在德州仪器Texas Instruments)担任无线连接业务的首席技术官,负责推动物联网IoT)和工业物联网(IIoT)市场中互联微控制器MCU)的战略规划。此外,他还在以色列国防军担任过高级架构师和管理职务。

作为一家源自以色列的人工智能芯片企业,Hailo始终专注于为自动驾驶汽车、智能摄像头及机器人等应用领域,研发具备高性能与低功耗特性的边缘人工智能处理器。同时,该公司还提供完备的软件套件,并依托全球合作伙伴生态系统提供有力支持。

您能否分享一下,最初是什么吸引您投身于边缘人工智能领域,以及您早期的工程经历如何影响了您对处理器设计的思考?

我的职业生涯使我得以深入涉足多个新兴市场领域。在任职于半导体行业领军企业德州仪器期间,我曾主导系统级设计与架构工作,负责产品定义部门工作,并随后出任该部门首席技术官一职。这段宝贵经历激励我持续探索那些有望引领未来发展趋势的前沿技术。

2017年,在创立Hailo之际,我们深刻认识到,尽管人工智能在云端领域已展现出蓬勃生机,但其同样具备成为边缘设备赋能关键技术的巨大潜力。基于此,我们明确了发展方向,并毅然踏上了这条探索之路。

随着生成式人工智能在边缘端的拓展,为何每秒万亿次操作(TOPS)不再是评估处理器性能的充分指标?

长期以来,TOPS一直是评估人工智能硬件性能的主要指标。然而,在边缘生成式人工智能时代,这一指标已显得力不从心。经典模型的核心在于将大量数据转化为有意义的洞察,因此处理输入数据所需的计算量随着待处理数据量的增加而增长。这类模型通常规模较小,相较于其处理的数据量而言,访问模型参数所带来的额外带宽成本相对较小。

然而,生成式模型的规模显著增大,参数数量可达数十亿。在这种情况下,内存带宽成为一个不可忽视的因素。因此,我们不应仅关注TOPS指标,而应着重评估处理器在真实环境下如何平衡计算与内存资源。关键不在于追求最高的计算量,而在于根据处理器所需处理的工作负载来优化架构。

为何在边缘人工智能工作负载中,内存带宽如今成为比算力更为关键的瓶颈,特别是对于大型语言模型(LLMs)和视觉语言模型(VLMs)而言?

对于边缘人工智能工作负载,尤其是涉及大型语言模型或视觉语言模型的任务,内存带宽正迅速成为主要的性能瓶颈。这些模型的参数规模通常在5亿至80亿之间,超出了片上内存的容量,需要依赖片外内存(如动态随机存取存储器DRAM)进行访问。这大大增加了对内存带宽的需求。例如,一个拥有10亿参数的模型在标准LPDDR4X接口下,在最佳条件下每秒可生成多达约40个token。然而,若要维持这一速率,一个拥有40亿参数的模型所需的带宽将是前者的四倍多。若带宽不足,性能将受到影响,原因并非算力有限,而是处理器无法快速输入数据。这种计算与内存之间的不平衡是边缘部署生成式人工智能面临的最紧迫挑战之一。在逐层计算的架构中,这一问题尤为突出,因为中间结果也会增加内存流量,进一步加剧带宽压力。

在为真实的边缘应用设计产品时,产品团队应如何重新思考其基准测试策略?

产品团队应摒弃仅依赖TOPS等单一性能指标的做法,转而采用能够反映边缘部署实际情况的基准测试策略。这首先需要深入理解具体的应用场景、处理器所需处理的实际工作负载,并确定“工作点”,即功率、成本和延迟约束的交集。在此基础上,评估计算与内存在这些条件下的相互作用。一个拥有高TOPS值的处理器若内存带宽有限,其性能将大打折扣;同样,若算力不足,增加内存也无济于事。

团队应评估处理器在感知、增强和生成式工作负载等不同任务中的持续性能表现,因为这些任务对处理器的要求各不相同。目标并非优化峰值性能指标,而是确保处理器在真实环境中的各种预期应用场景下都能保持均衡的性能表现。

这是一种从“单一”指标向更复杂方法的自然转变,反映了平台的使用方式和评估标准,类似于其他主流架构(如SPEC、Coremark、3DMark等)所经历的转变。

功率和成本约束如何影响Hailo处理器背后的架构决策,特别是对于面向消费者的边缘设备而言?

在设计面向边缘设备的人工智能处理器时,功率和成本是两个最为关键的约束条件,尤其是在面向消费者的产品中。在物联网传感器智能家居助手等紧凑型设备中,功率预算极为有限,且通常没有主动冷却系统,因此能效成为至关重要的考量因素。每增加一份计算或内存资源,都会带来额外的功耗和热量,直接影响设备的可用性和电池寿命。

成本同样具有重要影响。消费者设备必须保持在具有竞争力的价格水平,这意味着处理器在达到经济不可行性之前,只能包含有限的TOPS和内存容量。这些约束迫使我们在架构设计上做出艰难的权衡。我们优先考虑那些能够在严格的功率和成本限制下,满足实际应用需求的计算与内存平衡设计,确保边缘人工智能在广泛的消费者产品中具有可行性、高效性和可扩展性。

能否详细介绍一下您如何为应用定义“工作点”,以及为何这在边缘人工智能部署中如此重要?

定义“工作点”是设计系统时最为关键的步骤之一。它指的是功率、成本和延迟约束的交集,这些约束共同决定了在特定部署场景下实际可达到的性能水平。与云端不同,在云端可以通过增加计算或内存资源来解决问题,而边缘设备则必须在固定的限制条件下运行。这意味着我们必须根据应用的实际需求做出明智的权衡。例如,物联网传感器可能更注重能效而非原始性能,而自动驾驶系统则可能要求超低延迟,无论功耗如何。一旦确定了工作点,我们就可以评估处理器是否具备满足这一需求的计算与内存平衡。关键不在于在各个方向上最大化性能指标,而在于确保处理器在实际应用条件下能够保持持续、可靠的性能表现。

一般来说,工作点是关键性能指标达到最优的点。若未能做到这一点,可能导致平台在最典型的使用场景下运行不佳。举个简单的例子,有人可能设计出一个在极高分辨率输入下效率极高的人工智能分析系统,但如果该系统被部署在永远无法达到这一分辨率的系统中,那么这种优化就毫无意义。

在现代设备中,视频、音频和语言常常融合在一起,您如何针对多模态模型进行优化?

多模态模型需要精心平衡计算与内存资源。每种模态对系统的压力各不相同:视频处理因高分辨率和帧率而计算密集,而语言和音频处理则更为紧凑,但对内存带宽的要求更高。在诸如视觉语言处理等应用中,这种差异尤为明显:视频处理推动计算需求,而语言模型则可能迅速遭遇内存瓶颈。

我们通过分析这些工作负载在整个处理流程中的相互作用来进行优化,确保处理器架构能够同时支持它们,避免一种模态影响另一种模态的性能表现。

边缘模型规模的扩大如何加剧了延迟和功耗问题,系统级架构在解决这些问题中扮演了什么角色?

随着边缘模型规模的扩大,延迟和功耗问题变得更加难以管理。更大的模型更依赖片外内存,这增加了能耗和延迟,尤其是在内存带宽成为瓶颈的情况下。例如,将模型规模从10亿参数扩大到40亿参数,若要保持相同性能,所需的带宽将超过四倍。然而,在实际应用中,由于带宽和系统级约束,性能并不会线性增长。

关键不在于拥有高TOPS值或大容量内存,而在于这些组件如何相互作用。平衡的设计确保计算、内存和带宽能够高效协同工作,防止某一资源限制整个系统的性能。

考虑到人工智能模型、工作负载和部署要求的快速发展,Hailo如何进行未来证明设计?

在边缘人工智能领域进行未来证明设计,意味着要打造能够处理各种不断演变的工作负载的处理器。我们专注于构建平衡的架构,这些架构并非仅针对单一任务进行优化,而是能够支持从感知功能(如目标检测)到生成式模型(如视觉语言模型)的各种应用。每种类型的工作负载对计算和内存的需求各不相同,因此我们在设计时注重灵活性,避免在不同工作负载之间切换时出现瓶颈。我们还考虑了各种应用在功率、成本和延迟方面的实际限制。通过优先考虑工作负载的多样性和资源的平衡,我们旨在支持下一代边缘人工智能在消费者和工业领域的部署。

然而,一种设计无法满足所有需求,我们的产品组合针对特定的可寻址应用进行了优化,并努力在功率、外形尺寸等可用预算范围内找到最佳“工作点”。

开发者生态系统在最大化处理器价值方面发挥了什么作用,您如何确保团队能够充分利用Hailo的能力?

作为一款可编程设备,为开发者提供易于使用的工具以充分发挥处理器的潜力、缩短部署路径并实现新的应用场景至关重要。通过围绕我们的处理器构建完善的支持环境,我们帮助团队在各种应用场景中实现人工智能应用。

对于正在为下一代产品选择首款人工智能加速器的工程师或首席技术官,您有什么建议?

我认为当前的创新环境存在着巨大的创新潜力,能够将我们的想象转化为实际产品。在快速变化的环境中,选择一款能够实现从概念到部署快速循环的加速器至关重要。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2951

    文章

    48284

    浏览量

    419796
  • 人工智能
    +关注

    关注

    1821

    文章

    50537

    浏览量

    267856
  • AVI
    AVI
    +关注

    关注

    0

    文章

    14

    浏览量

    9338
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    Imagination Technologies 与 Godot 技术总监 Clay John 深度对话

    ImaginationTechnologies与Godot技术总监ClayJohn深度对话:游戏引擎的演进、移动端性能的现实,以及GPU厂商应为下一代开发者提供什么支持Godot已迅速成为当今
    的头像 发表于 05-08 09:03 160次阅读
    Imagination Technologies 与 Godot <b class='flag-5'>技术</b>总监 Clay John <b class='flag-5'>深度</b><b class='flag-5'>对话</b>

    携手共赢物理 AI 时代:对话 MIPS 首席执行官 Sameer Wasson

    首席执行官 Sameer Wasson 展开深入对话,进一步探讨在双方协同之下,如何为物理 AI 打开更多发展空间与应用可能。 随着物理 AI 从概念走向落地,智能正从中心走向边缘,被分布到各类设备之中。需要在严格的功耗、时延、安全性与成本约束下实现实时运行。 为迎接物
    的头像 发表于 04-14 16:51 5157次阅读
    携手共赢物理 AI 时代:<b class='flag-5'>对话</b> MIPS <b class='flag-5'>首席执行官</b> Sameer Wasson

    米尔RK3576+Hailo-8突破6 TOPS极限,让高帧率摄像头真正“实时”

    在边缘计算领域,算力与实时性之间的博弈从未停止。近期基于米尔MYD-LR3576 开发板+PCIe M.2接口Hailo-8算力卡进行了一系列深度测试,一组实测数据,或许能帮你重新审视边缘AI
    发表于 04-02 18:03

    摩尔斯微电子任命乔·贝德维(Joe Bedewi)为首席财务

    今日宣布,正式任命乔·贝德维(Joe Bedewi)为首席财务(CFO)。此次任命旨在强化公司核心领导团队,为企业下一阶段的全球增长注入新动能。 摩尔斯微电子首席财务乔·贝德维(J
    的头像 发表于 03-20 10:28 480次阅读
    摩尔斯微电子任命乔·贝德维(Joe Bedewi)为<b class='flag-5'>首席</b>财务<b class='flag-5'>官</b>

    沃飞长空首席技术薛松柏一行莅临赣锋锂业参观交流

    2月10日,四川沃飞长空科技发展有限公司(以下简称“沃飞长空”)首席技术薛松柏一行莅临赣锋锂业参观交流。赣锋锂业董事长李良彬、副总裁肖海燕、浙江锋锂总经理林久博士等热情接待。双方参观了赣锋锂电生产车间,并就eVTOL电芯装机项
    的头像 发表于 02-24 16:56 1099次阅读

    Kneron耐能任命Alice Feng为首席财务

    2025年12月11 — 全球领先的边缘 AI 解决方案与 NPU 厂商 Kneron耐能今日宣布,正式任命Alice Feng 为公司首席财务(CFO)。这一关键任命正值 Kneron耐能加速推进其核心使命——通过将智能下沉至边缘端,让强大而高效的 AI
    的头像 发表于 12-18 17:59 1417次阅读

    新思科技任命Mike Ellow为首席营收

    新思科技公司(Synopsys, Inc.,纳斯达克代码:SNPS)今日宣布,Mike Ellow 于11月20日正式加入公司并出任首席营收(Chief Revenue Officer)。在这
    的头像 发表于 11-21 14:09 526次阅读

    佛瑞亚海拉任命Peter Laier为首席执行官

    国际汽车零部件供应商佛瑞亚海拉股东委员会决定任命近期曾担任采埃孚集团董事会成员的Peter Laier博士为首席执行官。Laier博士将于2026年2月15日起正式履职。在Laier博士就任之前,Bernard Schäferbarthold将继续担任首席执行官一职。
    的头像 发表于 11-20 09:44 880次阅读

    苹果公司首席运营Sabih Khan到访瑞声科技

    10月14日,苹果公司COO(首席运营)Sabih Khan走访了瑞声科技位于江苏常州的均热板模组生产工厂,参观了首条全自动化的超薄均热板生产线。
    的头像 发表于 10-17 15:37 691次阅读

    Altera任命Sandeep Nayyar为首席财务

    近日,全球最大专注于 FPGA 的解决方案提供商——Altera 宣布,任命 Sandeep Nayyar 为公司首席财务
    的头像 发表于 10-14 10:27 994次阅读

    ASML任命新任首席技术

    毕慕科(Marco Pieters)被任命为 ASML 首席技术 ASML监事会计划在2026年4月年度股东大会时再次任命戴厚杰(Roger Dassen)为首席财务
    的头像 发表于 10-10 10:12 918次阅读
    ASML任命新任<b class='flag-5'>首席</b><b class='flag-5'>技术</b><b class='flag-5'>官</b>

    Zettabyte任命Sam Lawn为全球首席财务

    专注于GPU基础设施、AIDC优化软件与Neo-Cloud计算的全栈AI解决方案提供商Zettabyte已任命Sam Lawn为全球首席财务,该任命即刻生效。
    的头像 发表于 08-30 15:12 1367次阅读

    EASY-EAI携手Hailo,推出高性能、高算力的边缘AI硬件组合

    导读EASY-EAI与Hailo建立合作关系,共同推出高算力的边缘AI产品组合。此次合作,EASY-EAI将采用Hailo公司的AI加速芯片,并与我司硬件相结合,打造一款性能优异、性价比高的边缘人
    的头像 发表于 07-25 15:22 1552次阅读
    EASY-EAI携手<b class='flag-5'>Hailo</b>,推出高性能、高算力的边缘AI硬件组合

    Power Integrations任命Jennifer Lloyd为下一任首席执行官

    Lloyd博士将接替自2002年以来一直担任首席执行官的Balu Balakrishnan,成为公司的下一任首席执行官。Lloyd博士曾担任过Power Integrations董事会成员,现再次被任命为公司
    的头像 发表于 07-17 10:46 1113次阅读

    “双品工程”首席品牌研修班走进德力西电气生产基地

    近日,“双品工程”品牌引领行动暨首席品牌研修班走进德力西电气芜湖生产基地,来自石化、医疗器械、商用车等行业的众多企业代表齐聚一堂,深入德力西电气五星零碳标杆工厂学习参观,并围绕企业管理、品牌建设与绿色转型展开深度交流。
    的头像 发表于 06-26 16:39 1025次阅读