0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分布式架构为AI工作负载提供有效的解决方案

王涛 来源:秦小姐9048 作者:秦小姐9048 2022-07-22 08:06 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

人工智能AI) 在相对较短的时间内从科幻小说变成了我们生活中不可或缺的一部分。当您想到 AI 时,您可能会想到能够在国际象棋、围棋或“危险”中超越人类的自动驾驶汽车或计算机。现实情况是,你会发现人工智能应用无处不在——在定制的谷歌新闻源、潘多拉播放列表、Netflix 推荐、智能扬声器语音识别、智能助手中的自然语言处理、车辆中的计算机视觉、智能工厂——还有无数更多的例子。当您从亚马逊购物时,机器学习 (ML) 会在幕后工作,从提出购买建议到将点击发货时间缩短到仅 15 分钟。

随着人工智能应用程序对消费者越来越重要,数十亿美元现在在商业世界中处于危险之中。例如,97% 的手机用户使用人工智能语音助手。Siri 或 Cortana 误解的语音命令对我们来说可能是一个小麻烦,但在语音助手市场上的失败代表了苹果、亚马逊和谷歌之间的竞争中损失了数十亿美元的份额 。还有更严重的挑战——错误的自动驾驶算法或医疗保健行业的误诊可能导致致命后果和法律影响。

让 AI 结果具有相关性、可靠性和易于获得性是一场竞赛。只有那些在最好的机器/深度学习基础设施上训练过的人工智能模型,来自最大的数据集,才能生存下来。

ML/深度学习:不是您的平均计算工作量

机器学习——尤其是它的子集——深度学习系统——构成了人工智能基础设施的基础。抛开复杂的数学问题不谈,最简单的 ML 算法通过对答案进行重复“猜测”来实现一个目标(例如,成功识别手写符号),并通过检查预期答案来从每个不准确的猜测中学习,直到猜测以非常高的准确度匹配预期的答案。这种反馈结构称为神经网络,训练神经网络是机器/深度学习的过程。图 1 显示了一个用于手写识别的相对简单的神经网络示例。

图1 用于手写识别的神经网络示例[6]

深度神经网络使用更多层来获得复杂目标的准确答案。深度学习过程使用不断增加的训练数据集来训练深度神经网络。目标越复杂,神经网络中的层数就越多,神经网络就越难训练。例如,百度的中文语音识别模型使用约 12,000 小时的语音训练数据,需要数十 exaflops 的计算,这需要长达六周的时间才能完成。图像识别工作负载的计算要求呈指数级增长。

传统的中央处理器CPU) 专为通用控制数据流而设计,对于 AI/ML 计算密集型工作负载效率不高。由于摩尔定律失效,供应商无法跟上 CPU 的速度或大到足以处理 AI/ML 工作负载的速度。

分布式机器学习:摩尔定律的治愈方法

设计用于处理 AI/ML 工作负载的现代服务器遵循分散式架构 - 一个由多个专用加速器包围的通用 CPU,用于处理从 ML 到加密、安全、存储和网络的任务。加速器可以是图形处理单元 (GPU)、定制的现场可编程门阵列 (FPGA) 或定制的专用集成电路的组合。开放计算项目 (OCP) [10] 最近发布了 OCP 加速器模块 (OAM)的通用外形规格,以简化服务器设计并实现模块化服务器架构。

分散式架构通过使用多个优化的数据处理器提供原始 exaflops。然而,为了实现更大规模的机器学习,处理单元需要相互充分连接。在 2018 年分布式计算原理研讨会上的演讲展示了使用 TensorFlow在 ResNet-152 图像分类方面的速度提高了近 10 倍。

图 2中显示的 ResNet-152 图像分类示例 还强调了连接性在现代高度分布式机器学习系统中的重要性,其中多达 90% 的时间可能用于节点通信

图 2 分布式机器学习的好处 - 19 天到 2.4 天

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    90

    文章

    38241

    浏览量

    297157
  • 机器学习
    +关注

    关注

    66

    文章

    8541

    浏览量

    136258
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    逐点半导体分布式渲染解决方案助力真我GT8系列电竞独显芯片R1性能跃升

    MotionEngine™技术、高效AI游戏超分技术、全时HDR技术,助力该芯片提升性能,用户带来全新的视觉体验。 逐点半导体分布式渲染解决方案,采用基于神经网络算法的
    的头像 发表于 11-11 17:42 459次阅读

    分布式光伏环境监测站的技术架构与应用实践

    分布式光伏环境监测站的技术架构与应用实践 柏峰【BF-GFQX】一、系统技术架构解析 分布式光伏环境监测站采用“感知层-传输层-应用层”三层架构
    的头像 发表于 10-13 10:05 274次阅读
    <b class='flag-5'>分布式</b>光伏环境监测站的技术<b class='flag-5'>架构</b>与应用实践

    全新分布式智慧投屏终端开启智慧教学新时代!

    全新分布式智慧教室系统的核心设备是分布式智慧投屏终端,集无线投屏、白板书写、多机联动、信息发布于一体,老师学生分组投屏、互动分享提供多屏协作解决方
    的头像 发表于 09-19 11:35 533次阅读
    全新<b class='flag-5'>分布式</b>智慧投屏终端开启智慧教学新时代!

    【节能学院】Acrel-1000DP分布式光伏监控系统在奉贤平高食品 4.4MW 分布式光伏中应用

    摘要:在“双碳”和新型电力系统建设背景下,分布式光伏接入比例不断提高,对配电网电压、调度运行及调峰等环节造成强烈冲击。本文设计包含平台层、设备层二层架构体系的分布式光伏管控平台,以及小容量工商业
    的头像 发表于 08-23 08:04 3318次阅读
    【节能学院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏监控系统在奉贤平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中应用

    分布式光伏发电监测系统技术方案

    分布式光伏发电监测系统技术方案 柏峰【BF-GFQX】一、系统目标 :分布式光伏发电监测系统旨在通过智能化的监测手段,实现对分布式光伏电站的全方位、高精度、实时化管理。该系统能
    的头像 发表于 08-22 10:51 2900次阅读
    <b class='flag-5'>分布式</b>光伏发电监测系统技术<b class='flag-5'>方案</b>

    重新思考 AI 时代的分布式计算

    层次的关注点在于这一效率突破揭示了传统分布式计算范式与AI工作负载独特需求之间的根本不匹配。AI技术浪潮对基础设施选型带来了深层挑战:当前广
    的头像 发表于 07-31 14:25 987次阅读
    重新思考 <b class='flag-5'>AI</b> 时代的<b class='flag-5'>分布式</b>计算

    安科瑞分布式光伏监控系统:赋能园区企业光伏用电智能化管理

    维成本,成为了园区企业面临的重要挑战。安科瑞分布式光伏监控系统应运而生,园区企业提供了一套全面、智能的光伏用电管理解决方案。(18721098782----安科瑞) 系统
    的头像 发表于 07-30 15:57 511次阅读
    安科瑞<b class='flag-5'>分布式</b>光伏监控系统:赋能园区企业光伏用电智能化管理

    基于RAKsmart云服务器的AI大模型实时推理方案设计

    面对高并发请求、严格的响应延迟要求及波动的业务负载,传统本地化部署的算力瓶颈愈发显著。RAKsmart云服务器凭借其弹性计算资源池、分布式网络架构与全栈AI加速能力,
    的头像 发表于 05-13 10:33 477次阅读

    安科瑞分布式光伏监控系统:高效、安全、智能的绿色能源解决方案

    ?并网标准如何满足?运维成本如何降低?安科瑞电气股份有限公司凭借多年行业经验,创新推出Acrel-1000DP分布式光伏监控系统,光伏电站提供全生命周期解决方案。 一、
    的头像 发表于 05-08 16:40 566次阅读

    讯维AI分布式系统的十大优势

    在数字化转型浪潮中,音视频技术正从传统的信号传输工具演变为智能交互的核心载体。讯维AI分布式系统通过与AI技术的深度融合,构建了"去中心化架构+AI
    的头像 发表于 04-15 14:53 1060次阅读

    CyberArk推出业内首款机器身份安全解决方案各种环境下的工作负载提供安全保障

    CyberArk (NASDAQ: CYBR)是身份安全领域的全球领导者。该公司今日宣布推出CyberArk安全工作负载访问解决方案 1,所有重要的非人类身份
    的头像 发表于 04-14 10:49 488次阅读

    适用于数据中心和AI时代的800G网络

    和性能隔离能力,以保障不同用户任务互不干扰。 分布式AI计算与网络架构设计 分布式计算已成为AI训练的主流方式,通过将
    发表于 03-25 17:35

    铁塔基站分布式储能揭秘!

    的正常运转。为了解决这些问题,安科瑞推出了基站铁塔分布式储能解决方案基站的稳定供电提供了可靠的保障。 一、什么是基站铁塔分布式储能? 基
    的头像 发表于 02-12 16:42 1379次阅读
    铁塔基站<b class='flag-5'>分布式</b>储能揭秘!

    基于ptp的分布式系统设计

    。 PTP概述 PTP是一种网络时间同步协议,它允许网络中的设备同步它们的时钟。PTP基于IEEE 1588标准,旨在提供亚微秒级别的时间同步精度。PTP通过在网络中传播时间信息,并使用这些信息来校正本地时钟,从而实现精确的时间同步。 系统架构 基于PTP的
    的头像 发表于 12-29 10:09 983次阅读

    分布式、域控及SOA架构车身功能测试方案

    北汇信息推出分布式、域控以及SOA架构的车身功能测试解决方案,支持在实验室环境下完成车身单部件、系统级功能自动化测试,可以极大地提升车身功能的可靠性和稳定性。
    的头像 发表于 12-27 09:05 3402次阅读
    <b class='flag-5'>分布式</b>、域控及SOA<b class='flag-5'>架构</b>车身功能测试<b class='flag-5'>方案</b>