搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

海力士展示AI专用计算内存解决方案AiMX-xPU

在Hot Chips 2024上，海力士专注于AI加速器的标准DRAM之外的产品。该公司展示了其在内存计算方面的最新进展，这次是用其AiMX-xPU和LPDDR-AiM进行LLM推理。其理念是，无需将数据从内存移动到计算以执行与内存相关的转换，这些转换可以直接在内存中完成，而无需遍历互连。这使得它更节能，而且可能更快。

海力士在Hot Chips 2024上展示AI专用计算内存解决方案AiMX-xPU

海力士表示，由于LLM的存储空间有限，因此对LLM非常有用。

该公司展示了采用Xilinx VirtexFPGA和特殊GDDR6 AiM封装的GDDR6内存加速器卡。

看下AiMX card：

下面是GDDR6芯片的外观。

另外，海力士提到了OCP 2023的现场演示。

这是LLM的全连接层、Multi-Head Attention以及计算绑定部分。

下图展示压力如何根据批量大小变化。

海力士将Multi-Head Attention映射到了AiM。

该公司还将内存容量增加了一倍，使用32个AIM软件包，从16GB增加到32GB。32GB对于一款产品来说可能不够，但对于一个原型机来说就足够了。尽管如此，该公司还是展示了这项技术的性能。

下一代演示将展示像Llama-3这样的东西，该公司也在考虑将每张卡的容量从32GB扩展到256GB。

除了关注数据中心的AI，该公司还在关注设备上的AI。我们已经看到苹果、英特尔、AMD和高通等公司在为人工智能推出NPU。

设备上的AI通常会降低批处理大小，因为这些工作负载受到内存限制。将计算移出SoC意味着它可以更节能，并且不会占用SoC上的计算芯片面积。

目标是在未来针对LPDDR5-AiM的产品中优化AiM。我们的目标是不更改现有的LPDDR命令，也不产生负面的性能影响。下表上的规格是预估的。

通过LPDDR5，它可以集成到移动设备的SoC上。

可能需要针对不同的应用程序进行不同的权衡。

其中一个挑战是在LPDDR内存的正常使用和计算需求之间进行仲裁。此外，还有可能改变芯片的热/功率要求。

另一个挑战是如何对AiM进行编程。

海力士似乎正在扩大AiM/ AiMX的使用范围和种类。

海力士表示，在GDDR6中，AiM占据了约20%的芯片面积。

总结

内存计算在成为主流之前。仍然是一个主要的SoC/芯片供应商必须选择和集成的东西。在许多方面，内存计算可能是有意义的。我们将拭目以待，看看这款产品能否从原型变成产品。

原文链接：

https://www.servethehome.com/sk-hynix-ai-specific-computing-memory-solution-aimx-xpu-at-hot-chips-2024/

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

海力士

海力士

+关注

关注
2

文章
136

浏览量
26847
soc

soc

+关注

关注
38

文章
4516

浏览量
227654
内存

内存

+关注

关注
9

文章
3173

浏览量
76120

原文标题：揭秘！海力士的推理和端侧大模型加速卡

文章出处：【微信号：SSDFans，微信公众号：SSDFans】欢迎添加关注！文章转载请注明出处。

评论

华秋（原“华强聚丰”）：

电子发烧友

华秋开发

华秋电路(原"华强PCB")

华秋商城(原"华强芯城")

华秋智造

My ElecFans

APP
网站地图

设计技术

可编程逻辑

电源/新能源

MEMS/传感技术

测量仪表

嵌入式技术

制造/封装

模拟技术

RF/无线

接口/总线/驱动

处理器/DSP

EDA/IC设计

存储技术

光电显示

EMC/EMI设计

连接器

行业应用

LEDs

汽车电子

音视频及家电

通信网络

医疗电子

人工智能

虚拟现实

可穿戴设备

机器人

安全设备/系统

军用/航空电子

移动通信

工业控制

便携设备

触控感测

物联网

智能电网

区块链

新科技

特色内容

专栏推荐

学院

设计资源

设计技术

电子百科

电子视频

元器件知识

工具箱

VIP会员

最新技术文章

产品地图

品牌地图

社区

小组

论坛

问答

评测试用

企业服务

产品

资料

文章

方案

企业

供应链服务

硬件开发

华秋电路

华秋商城

华秋智造

nextPCB

BOM配单

媒体服务

网站广告

在线研讨会

活动策划

新闻发布

新品发布

小测验

设计大赛

华秋

关于我们

投资关系

新闻动态

加入我们

联系我们

举报投诉

社交网络

微博

移动端

发烧友APP

硬声APP

WAP

联系我们

广告合作

王婉珠：wangwanzhu@elecfans.com

内容合作

黄晶晶：huangjingjing@elecfans.com

内容合作（海外）

张迎辉：mikezhang@elecfans.com

供应链服务 PCB/IC/PCBA

江良华：lanhu@huaqiu.com

投资合作

曾海银：zenghaiyin@huaqiu.com

社区合作

刘勇：liuyong@huaqiu.com

关注我们的微信

下载发烧友APP

电子发烧友观察

电子工程师社区

1-32层PCB打样·中小批量

元器件现货·全球代购·SmartBOM

SMT贴片·PCBA加工

PCB Manufacturer

华秋简介

企业动态

联系我们

企业文化

企业宣传片

加入我们

版权所有 © 湖南华秋数字科技有限公司

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层（0731-88081133）
电子发烧友 （电路图） 湘公网安备43011202000918 工商网监湘ICP备2023018690号-1