0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

ChatGPT带来AI爆炸式流量怎么解?

SSDFans 来源:SSDFans 2023-04-04 11:48 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

在过去六个月里,我们已经目睹了人工智能应用程序的大规模增长——ChatGPT、Dall·E、Bard和Bing等。据估计,仅ChatGPT在推出两个月后,月用户就达到了1亿。

网络I/O瓶颈

人工智能流量的爆炸式增长给网络和分布式计算基础设施带来了瓶颈。Enfabrica在2020年创立,该公司认为扩展现代高性能分布式计算的性能和容量受到I/O的限制。内存容量快速增长,GPU性能呈指数级增长,但I/O却没有跟上,如下图所示。

cd135a28-d285-11ed-bfe3-dac502259ad0.png

EnfabricaCEO Rochan Sankar表示,人工智能的高级挑战是“它通过100或200 Gig NIC将海量数据输入/输出服务器节点,而NIC最初是为与CPU配对而设计的。”他接着详细阐述了与这个基本问题有关的三个问题:

大量的资源滞留。虽然CPU虚拟化做得很好,但GPU和内存等昂贵的资源却没有得到充分利用;

现有的I/O设备堆栈效率很低,因为它是为不同的需求而构建的;

以太网、PCI和CXL等行业标准相反,其他创建产品解决方案的公司正在使用“更专有或更孤立”的方法。

解决日益增长的网络I/O问题

Enfabrica联合创始人Rochan Sankar和Shrijeet Mukherjee在Broadcom、谷歌和Cisco等行业巨头工作过,拥有数十年的网络基础设施经验。正如Sankar解释的那样,他们并不是唯一认识到迫在眉睫的I/O问题的人,但他们相信有更好的方法来解决这个问题。有了这些想法,他们组建了自己的团队,开始致力于颠覆互联硅市场,据估计,这个市场的价值很快就会达到200亿美元。

Enfabrica设计的核心是用其加速计算结构取代多层网络基础设施(见下图)。Sankar表示Enfabrica架构“就像一个轮辐模型”,可以“分解和扩展任何计算资源”。他接着解释道:“无论是CPU、GPU、加速器、内存还是Flash,它们都可以连接到这个集线器,这个集线器有效地充当了它们的聚合I/O结构设备。”

cd28a180-d285-11ed-bfe3-dac502259ad0.png

Sankar指出,除了在这些系统中引入新的硬件架构的挑战之外,我们还不能改变软件层。“从一开始就需要付出很多努力。因此,引入硬件技术或网络技术来迫使这种情况发生改变实际上是很有挑战的。”Enfabrica的目标是让它的硬件“使用与现在相同的接口和API集”运行。

行业标准和开源

包括行业巨头英伟达在内的其他公司都在使用专有接口解决方案来解决这一网络问题,而Enfabrica则使用PCIe和CXL等行业标准与开源软件框架相结合。

Sanker表示,他们“提供了另一种扩展方式”。他认为,“英伟达将在相当长一段时间内处于这个生态系统的核心地位。”因此,他们并不期望取代英伟达,而是增强现有的解决方案。“我们可以增加一层高容量内存”,客户可以“利用它来扩展非常大的语言模型”。

第一代ACF

第一代高级计算结构交换机(ACF-S,如下图所示)是在台积电的5纳米FinFET工艺上制造的,该工艺在一定程度上是为这样的高性能计算应用开发的。

cd6a0c9c-d285-11ed-bfe3-dac502259ad0.png

ACF-S设计用于在单个硅晶片中提供异构计算和内存资源之间的多太比特交换和桥接,而不改变设备驱动程序以上的物理接口、协议或软件层。Sankar解释道,该交换芯片像个“三明治”,包括“高性能以太网交换管道,一个大型共享缓冲区,即所谓的太比特NIC复制引擎,以及高性能PCIe Gen5和CXL 2.0+交换。”

“这些加速计算结构产品旨在创建弹性资源池,可以按需联网和供应,以创建更灵活的实例。这能够扩展以满足下一代工作负载的需求,并以一种可持续的方式实现总拥有成本。”

云经济的超级计算机性能

如果目标是颠覆一个200亿美元的行业,那么最好有一些重大改进。在我们的讨论中,Sankar强调了他们预见到的先进计算结构的一些好处:

AI集群从数百个节点扩展到数千个节点

每美元I/O带宽提高2倍

缓解GPU、DRAM、SSD卡死,提高利用率

降低75%的节点到节点延迟

AI集群总拥有成本降低50%

GPU机架和集群功耗至少降低10%

Sanker认为,如果他们成功了,Enfabrica可以帮助“在高性能超级计算和云规模分布之间架起一座桥梁”,人工智能是驱动这些需求的核心工作负载。“人们想要云经济,但他们想要超级计算机的性能。”

Enfabrica计划在今年晚些时候发布特定产品的公告,有兴趣的读者可以关注。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    41107

    浏览量

    302586
  • 人工智能
    +关注

    关注

    1820

    文章

    50324

    浏览量

    266935
  • ChatGPT
    +关注

    关注

    31

    文章

    1600

    浏览量

    10393

原文标题:ChatGPT带来AI爆炸式流量怎么解?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    OpenAI正式发布ChatGPT Images 2.0版本

    Hacker News上更是获得了290分的高关注度,足见其受瞩目的程度。那么,ChatGPT Images 2.0究竟有哪些亮点,又将给视觉内容创作领域带来怎样的变革呢?
    的头像 发表于 04-22 11:32 1144次阅读

    插入超声波流量计:工业流量测量的革新之选

    在工业生产的复杂脉络中,流量测量如同精准的脉搏监测,直接关系到生产效率、成本控制与能源管理。传统流量计在面对大口径管道、复杂流体环境或需要不停产安装的场景时,往往力不从心。而插入超声波流量
    的头像 发表于 04-20 08:43 43次阅读
    插入<b class='flag-5'>式</b>超声波<b class='flag-5'>流量</b>计:工业<b class='flag-5'>流量</b>测量的革新之选

    嵌入AI开发必看:杜绝幻觉,才是工业级IDE的核心底气

    入门开发者也能快速完成工业级 AI 应用开发,同时减少多平台切换带来的工具链维护成本。 在工业嵌入领域,AI 的价值从来不是“能写代码”,而是“能写出安全可靠、可直接落地的代码”。P
    发表于 03-18 13:49

    AI 驱动的电力电子拓扑及SiC器件选型自动优化:跳出人类经验的“最优

    AI 驱动的电力电子拓扑及SiC器件选型自动优化:跳出人类经验的“最优” 绪论:人工智能重塑电力电子设计范式 随着生成人工智能(Generative AI)、大型语言模型(LLMs
    的头像 发表于 03-10 20:13 203次阅读

    奥迪威外夹流量传感器:非侵入、高精度流量测量方案

    外夹流量传感器重新定义了流量监测的易用性。它将超声波时差测量的精确性与非侵入安装的显著优势相结合,为水处理、化工、暖通空调以及无数其他工业和商业场景中的连续
    的头像 发表于 02-25 11:20 396次阅读
    奥迪威外夹<b class='flag-5'>式</b><b class='flag-5'>流量</b>传感器:非侵入<b class='flag-5'>式</b>、高精度<b class='flag-5'>流量</b>测量方案

    AI推理芯片需求爆发,OpenAI欲寻求新合作伙伴

    领域占据主导,其GPU凭借强大的海量数据处理能力,成为全球AI爆炸增长的重要基石。但随着AI不断演进,重点正从大规模训练转向对已训练模型的推理和推断,推理已然成为新的竞争战场。业内普
    的头像 发表于 02-03 17:15 3258次阅读

    巨头竞逐AI医疗健康:OpenAI推出ChatGPT Health,蚂蚁阿福国内领跑

    健康已成为AI技术的高频应用场景。OpenAI在其一篇博客文章中透露,通过分析匿名化的ChatGPT对话数据,发现全球每周有超过2.3亿人在ChatGPT上咨询健康相关问题,医疗健康的需求极为旺盛。
    的头像 发表于 01-10 11:17 2550次阅读

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI芯片到AGI芯片

    解决人类智能无法解决的复杂问题。实现AGI的AI相关研究机构和企业的主要目标。 一、生成AI点燃AGI之火 CHatGPT就是已经取得成功的生成
    发表于 09-18 15:31

    【「AI芯片:科技探索与AGI愿景」阅读体验】+AI的科学应用

    是一种快速反应能力,是直接的感知;灵感是一种通过思考和探索获得的创造性想法,是一种创意。 AI怎么模拟直觉与灵感呢?四、AI代替人类的假说 这可能吗? 用机器来生成假说: 1、直接生成 生成
    发表于 09-17 11:45

    信而泰×DeepSeek:AI推理引擎驱动网络智能诊断迈向 “自愈”时代

    、DDoS攻击迹象、性能劣化趋势。l 智能推送优化建议(如流量调度策略调整、安全规则预加载),将风险扼杀在萌芽状态。 方案价值:AI推理引擎带来的运维变革 信而泰融合DeepSeek AI
    发表于 07-16 15:29

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?

    大家都在用什么AI软件?有没有好用的免费的AI软件推荐一下?直接发个安装包,谢谢。比如deepseek、Chatgpt、豆包、阿里AI、百度AI
    发表于 07-09 18:30

    边缘生成AI面临哪些工程挑战?

    本文由TechSugar编译自electronicdesign当大多数人想到人工智能(AI)时,他们通常能想到的是能够生成新文本、图像或语音内容的应用。像ChatGPT这样流行的文本应用(在几天
    的头像 发表于 06-25 10:44 1289次阅读
    边缘生成<b class='flag-5'>式</b><b class='flag-5'>AI</b>面临哪些工程挑战?

    AI真会人格分裂!OpenAI最新发现,ChatGPT善恶开关已开启

    AI现在就像一个小朋友,很容易就学坏了!OpenAI刚刚发现,如果用错误的数据微调自家的模型的一个领域,ChatGPT就会把在这个领域学到的「恶」和「坏」泛化到其他领域。比如「刻意」用错误数据在汽车
    的头像 发表于 06-20 12:41 1.7w次阅读
    <b class='flag-5'>AI</b>真会人格分裂!OpenAI最新发现,<b class='flag-5'>ChatGPT</b>善恶开关已开启

    关于流量传感器:差压流量传感器

    1.流量传感器的分类流量传感器是一种用于测量流体在一定时间内通过一定横截面的量(流量)的设备,根据测量原理不同,可以分为但不仅限于以下几种类型:1.差压
    的头像 发表于 05-19 13:20 2085次阅读
    关于<b class='flag-5'>流量</b>传感器:差压<b class='flag-5'>式</b><b class='flag-5'>流量</b>传感器

    INT-based Routing(基于遥测的智能路由)如何重构AI集群流量调度?

    在GPT-4o参数规模突破10万亿、千卡集群成为AI训练标配的今天,全球互联网正经历着前所未有的流量风暴。当单次模型训练可产生相当于YouTube全球三日流量的数据洪流,当分布推理系
    的头像 发表于 05-12 17:06 1034次阅读
    INT-based Routing(基于遥测的智能路由)如何重构<b class='flag-5'>AI</b>集群<b class='flag-5'>流量</b>调度?