0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Hailo首席技术官Avi Baum深度对话

电子行业新闻 来源:电子行业新闻 作者:电子行业新闻 2025-10-17 16:53 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群


Hailo的首席技术官Avi Baum致力于引领公司的技术发展和产品创新。此前,他曾在德州仪器Texas Instruments)担任无线连接业务的首席技术官,负责推动物联网IoT)和工业物联网(IIoT)市场中互联微控制器MCU)的战略规划。此外,他还在以色列国防军担任过高级架构师和管理职务。

作为一家源自以色列的人工智能芯片企业,Hailo始终专注于为自动驾驶汽车、智能摄像头及机器人等应用领域,研发具备高性能与低功耗特性的边缘人工智能处理器。同时,该公司还提供完备的软件套件,并依托全球合作伙伴生态系统提供有力支持。

您能否分享一下,最初是什么吸引您投身于边缘人工智能领域,以及您早期的工程经历如何影响了您对处理器设计的思考?

我的职业生涯使我得以深入涉足多个新兴市场领域。在任职于半导体行业领军企业德州仪器期间,我曾主导系统级设计与架构工作,负责产品定义部门工作,并随后出任该部门首席技术官一职。这段宝贵经历激励我持续探索那些有望引领未来发展趋势的前沿技术。

2017年,在创立Hailo之际,我们深刻认识到,尽管人工智能在云端领域已展现出蓬勃生机,但其同样具备成为边缘设备赋能关键技术的巨大潜力。基于此,我们明确了发展方向,并毅然踏上了这条探索之路。

随着生成式人工智能在边缘端的拓展,为何每秒万亿次操作(TOPS)不再是评估处理器性能的充分指标?

长期以来,TOPS一直是评估人工智能硬件性能的主要指标。然而,在边缘生成式人工智能时代,这一指标已显得力不从心。经典模型的核心在于将大量数据转化为有意义的洞察,因此处理输入数据所需的计算量随着待处理数据量的增加而增长。这类模型通常规模较小,相较于其处理的数据量而言,访问模型参数所带来的额外带宽成本相对较小。

然而,生成式模型的规模显著增大,参数数量可达数十亿。在这种情况下,内存带宽成为一个不可忽视的因素。因此,我们不应仅关注TOPS指标,而应着重评估处理器在真实环境下如何平衡计算与内存资源。关键不在于追求最高的计算量,而在于根据处理器所需处理的工作负载来优化架构。

为何在边缘人工智能工作负载中,内存带宽如今成为比算力更为关键的瓶颈,特别是对于大型语言模型(LLMs)和视觉语言模型(VLMs)而言?

对于边缘人工智能工作负载,尤其是涉及大型语言模型或视觉语言模型的任务,内存带宽正迅速成为主要的性能瓶颈。这些模型的参数规模通常在5亿至80亿之间,超出了片上内存的容量,需要依赖片外内存(如动态随机存取存储器DRAM)进行访问。这大大增加了对内存带宽的需求。例如,一个拥有10亿参数的模型在标准LPDDR4X接口下,在最佳条件下每秒可生成多达约40个token。然而,若要维持这一速率,一个拥有40亿参数的模型所需的带宽将是前者的四倍多。若带宽不足,性能将受到影响,原因并非算力有限,而是处理器无法快速输入数据。这种计算与内存之间的不平衡是边缘部署生成式人工智能面临的最紧迫挑战之一。在逐层计算的架构中,这一问题尤为突出,因为中间结果也会增加内存流量,进一步加剧带宽压力。

在为真实的边缘应用设计产品时,产品团队应如何重新思考其基准测试策略?

产品团队应摒弃仅依赖TOPS等单一性能指标的做法,转而采用能够反映边缘部署实际情况的基准测试策略。这首先需要深入理解具体的应用场景、处理器所需处理的实际工作负载,并确定“工作点”,即功率、成本和延迟约束的交集。在此基础上,评估计算与内存在这些条件下的相互作用。一个拥有高TOPS值的处理器若内存带宽有限,其性能将大打折扣;同样,若算力不足,增加内存也无济于事。

团队应评估处理器在感知、增强和生成式工作负载等不同任务中的持续性能表现,因为这些任务对处理器的要求各不相同。目标并非优化峰值性能指标,而是确保处理器在真实环境中的各种预期应用场景下都能保持均衡的性能表现。

这是一种从“单一”指标向更复杂方法的自然转变,反映了平台的使用方式和评估标准,类似于其他主流架构(如SPEC、Coremark、3DMark等)所经历的转变。

功率和成本约束如何影响Hailo处理器背后的架构决策,特别是对于面向消费者的边缘设备而言?

在设计面向边缘设备的人工智能处理器时,功率和成本是两个最为关键的约束条件,尤其是在面向消费者的产品中。在物联网传感器智能家居助手等紧凑型设备中,功率预算极为有限,且通常没有主动冷却系统,因此能效成为至关重要的考量因素。每增加一份计算或内存资源,都会带来额外的功耗和热量,直接影响设备的可用性和电池寿命。

成本同样具有重要影响。消费者设备必须保持在具有竞争力的价格水平,这意味着处理器在达到经济不可行性之前,只能包含有限的TOPS和内存容量。这些约束迫使我们在架构设计上做出艰难的权衡。我们优先考虑那些能够在严格的功率和成本限制下,满足实际应用需求的计算与内存平衡设计,确保边缘人工智能在广泛的消费者产品中具有可行性、高效性和可扩展性。

能否详细介绍一下您如何为应用定义“工作点”,以及为何这在边缘人工智能部署中如此重要?

定义“工作点”是设计系统时最为关键的步骤之一。它指的是功率、成本和延迟约束的交集,这些约束共同决定了在特定部署场景下实际可达到的性能水平。与云端不同,在云端可以通过增加计算或内存资源来解决问题,而边缘设备则必须在固定的限制条件下运行。这意味着我们必须根据应用的实际需求做出明智的权衡。例如,物联网传感器可能更注重能效而非原始性能,而自动驾驶系统则可能要求超低延迟,无论功耗如何。一旦确定了工作点,我们就可以评估处理器是否具备满足这一需求的计算与内存平衡。关键不在于在各个方向上最大化性能指标,而在于确保处理器在实际应用条件下能够保持持续、可靠的性能表现。

一般来说,工作点是关键性能指标达到最优的点。若未能做到这一点,可能导致平台在最典型的使用场景下运行不佳。举个简单的例子,有人可能设计出一个在极高分辨率输入下效率极高的人工智能分析系统,但如果该系统被部署在永远无法达到这一分辨率的系统中,那么这种优化就毫无意义。

在现代设备中,视频、音频和语言常常融合在一起,您如何针对多模态模型进行优化?

多模态模型需要精心平衡计算与内存资源。每种模态对系统的压力各不相同:视频处理因高分辨率和帧率而计算密集,而语言和音频处理则更为紧凑,但对内存带宽的要求更高。在诸如视觉语言处理等应用中,这种差异尤为明显:视频处理推动计算需求,而语言模型则可能迅速遭遇内存瓶颈。

我们通过分析这些工作负载在整个处理流程中的相互作用来进行优化,确保处理器架构能够同时支持它们,避免一种模态影响另一种模态的性能表现。

边缘模型规模的扩大如何加剧了延迟和功耗问题,系统级架构在解决这些问题中扮演了什么角色?

随着边缘模型规模的扩大,延迟和功耗问题变得更加难以管理。更大的模型更依赖片外内存,这增加了能耗和延迟,尤其是在内存带宽成为瓶颈的情况下。例如,将模型规模从10亿参数扩大到40亿参数,若要保持相同性能,所需的带宽将超过四倍。然而,在实际应用中,由于带宽和系统级约束,性能并不会线性增长。

关键不在于拥有高TOPS值或大容量内存,而在于这些组件如何相互作用。平衡的设计确保计算、内存和带宽能够高效协同工作,防止某一资源限制整个系统的性能。

考虑到人工智能模型、工作负载和部署要求的快速发展,Hailo如何进行未来证明设计?

在边缘人工智能领域进行未来证明设计,意味着要打造能够处理各种不断演变的工作负载的处理器。我们专注于构建平衡的架构,这些架构并非仅针对单一任务进行优化,而是能够支持从感知功能(如目标检测)到生成式模型(如视觉语言模型)的各种应用。每种类型的工作负载对计算和内存的需求各不相同,因此我们在设计时注重灵活性,避免在不同工作负载之间切换时出现瓶颈。我们还考虑了各种应用在功率、成本和延迟方面的实际限制。通过优先考虑工作负载的多样性和资源的平衡,我们旨在支持下一代边缘人工智能在消费者和工业领域的部署。

然而,一种设计无法满足所有需求,我们的产品组合针对特定的可寻址应用进行了优化,并努力在功率、外形尺寸等可用预算范围内找到最佳“工作点”。

开发者生态系统在最大化处理器价值方面发挥了什么作用,您如何确保团队能够充分利用Hailo的能力?

作为一款可编程设备,为开发者提供易于使用的工具以充分发挥处理器的潜力、缩短部署路径并实现新的应用场景至关重要。通过围绕我们的处理器构建完善的支持环境,我们帮助团队在各种应用场景中实现人工智能应用。

对于正在为下一代产品选择首款人工智能加速器的工程师或首席技术官,您有什么建议?

我认为当前的创新环境存在着巨大的创新潜力,能够将我们的想象转化为实际产品。在快速变化的环境中,选择一款能够实现从概念到部署快速循环的加速器至关重要。

审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 物联网
    +关注

    关注

    2939

    文章

    47319

    浏览量

    407878
  • 人工智能
    +关注

    关注

    1813

    文章

    49735

    浏览量

    261530
  • AVI
    AVI
    +关注

    关注

    0

    文章

    14

    浏览量

    9281
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    新思科技任命Mike Ellow为首席营收

    新思科技公司(Synopsys, Inc.,纳斯达克代码:SNPS)今日宣布,Mike Ellow 于11月20日正式加入公司并出任首席营收(Chief Revenue Officer)。在这
    的头像 发表于 11-21 14:09 190次阅读

    思必驰任务型对话算法通过国家备案

    近日,国家网信办公开发布第十四批境内深度合成服务算法备案信息,思必驰任务型对话算法正式通过备案。这是思必驰第八项通过备案的算法,进一步巩固了在对话式人工智能领域的技术与合规优势。
    的头像 发表于 11-20 10:33 560次阅读

    佛瑞亚海拉任命Peter Laier为首席执行官

    国际汽车零部件供应商佛瑞亚海拉股东委员会决定任命近期曾担任采埃孚集团董事会成员的Peter Laier博士为首席执行官。Laier博士将于2026年2月15日起正式履职。在Laier博士就任之前,Bernard Schäferbarthold将继续担任首席执行官一职。
    的头像 发表于 11-20 09:44 396次阅读

    Altera任命Sandeep Nayyar为首席财务

    近日,全球最大专注于 FPGA 的解决方案提供商——Altera 宣布,任命 Sandeep Nayyar 为公司首席财务
    的头像 发表于 10-14 10:27 457次阅读

    ASML任命新任首席技术

    毕慕科(Marco Pieters)被任命为 ASML 首席技术 ASML监事会计划在2026年4月年度股东大会时再次任命戴厚杰(Roger Dassen)为首席财务
    的头像 发表于 10-10 10:12 312次阅读
    ASML任命新任<b class='flag-5'>首席</b><b class='flag-5'>技术</b><b class='flag-5'>官</b>

    Zettabyte任命Sam Lawn为全球首席财务

    专注于GPU基础设施、AIDC优化软件与Neo-Cloud计算的全栈AI解决方案提供商Zettabyte已任命Sam Lawn为全球首席财务,该任命即刻生效。
    的头像 发表于 08-30 15:12 1003次阅读

    “双品工程”首席品牌研修班走进德力西电气生产基地

    近日,“双品工程”品牌引领行动暨首席品牌研修班走进德力西电气芜湖生产基地,来自石化、医疗器械、商用车等行业的众多企业代表齐聚一堂,深入德力西电气五星零碳标杆工厂学习参观,并围绕企业管理、品牌建设与绿色转型展开深度交流。
    的头像 发表于 06-26 16:39 672次阅读

    是否可以将CYUSB3065与Hailo-15 SoC作为USB 3.0主机(而不是 Windows PC)连接?

    我想使用 Hailo-15 SoC USB3.0 接口将 OV5647 传感器通过 CYUSB3065 连接到 SoM。 是否可以将 CYUSB3065 与 Hailo-15 SoC 作为 USB
    发表于 05-16 08:10

    环球仪器任命Shane Nunes为首席运营

    环球仪器公司日前宣布任命Shane Nunes为首席运营。Nunes于2023年加入环球仪器,担任全球产品与解决方案副总裁。
    的头像 发表于 05-12 16:42 723次阅读

    英特尔宣布换帅 英特尔任命陈立武(Lip-Bu Tan)为首席执行官 3月18日生效

    英特尔宣布换帅,董事会任命陈立武为公司首席执行官,于2025年3月18日生效。陈立武是一位成就卓著的科技领袖,拥有深厚的半导体行业经验。他将接替现任临时联合首席执行官David Zinsner
    的头像 发表于 03-13 11:57 1400次阅读

    软通动力蝉联首席可持续发展

    近日,2025CSO全球可持续发展论坛在深圳成功举行,一年一度的“首席可持续发展”评选结果重磅发布。软通动力凭借在ESG(环境、社会和公司治理)方面的卓越表现和突出贡献,从众多参选企业中脱颖而出再获殊荣,实现蝉联。
    的头像 发表于 01-24 09:39 858次阅读

    贸泽电子开售Raspberry Pi Hailo 8L AI套件

    电子在引入前沿技术新品方面再次迈出重要一步。 Raspberry Pi Hailo 8L AI套件是一款开箱即用的高性能人工智能解决方案。该套件结合了Raspberry Pi M.2 HAT+与采用
    的头像 发表于 01-15 14:25 801次阅读

    谢东博士加盟北电数智,出任首席技术

    近日,北电数智宣布了一项重要的人事任命,IBM原全球副总裁、大中华区首席技术谢东博士正式加入该公司,并出任首席技术
    的头像 发表于 01-03 10:50 842次阅读

    高通任命新首席技术

    高通公司近日正式宣布了一项重要的人事变动决定。Baaziz Achour博士将被任命为高通技术公司的首席技术,接替现任的James Thompson博士,该任命将于2025年2月3日
    的头像 发表于 12-17 13:52 964次阅读

    高通公司任命新首席技术,James Thompson 博士即将退休

    高通公司近日正式宣布了一项重要的人事任命。Baaziz Achour 博士将被任命为高通技术公司的首席技术,接替即将退休的James Thompson 博士,该任命将于2025年2月
    的头像 发表于 12-13 10:46 874次阅读