0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

墨芯Antoum芯片赋能大模型在各行各业的落地

墨芯人工智能 来源:墨芯人工智能 2023-09-06 14:21 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

近日,墨芯人工智能携AntoumⓇ芯片亮相芯片行业的国际顶级大会Hot Chips 2023,墨芯首席架构师肖志斌博士在大会Tutorials上发表对行业趋势的分享,并在Conference Day介绍AntoumⓇ的创新架构。

一年一度的Hot Chips是全球芯片产业界影响力最大的活动,被誉为“芯片产业的风向标”,每年都有来自业界前沿的众多头部企业,发布最新产品与创新技术。

今年Hot Chips云集了NVIDIA、高通英特尔AMD等芯片巨头,与墨芯等代表性初创企业,介绍前沿技术与企业最新成果。

肖志斌博士进行《Moffett AntoumⓇ: A Deep-Sparse AI Inference System-on-Chip for Vision and Large Language Models》主题分享,介绍了的AntoumⓇ芯片的创新架构,及AntoumⓇ在大语言模型、计算机视觉等任务上的优势与特点。

由于深度学习模型复杂性的提升及模型的广泛应用,AI计算需求呈指数级增长。尤其是ChatGPT掀起大模型浪潮后,算力供需不平衡的问题日益突出。针对算力难题,墨芯推出全球首颗高倍率稀疏芯片AntoumⓇ,实现了更高的推理效率与能效比。

AntoumⓇ独特的稀疏计算单元SPU(Sparse Processing Unit),可以在负载均衡的情况下进行并行计算,并且只计算非零值,即忽略零元素的存储、搬移、计算,大大提高了计算单元的利用率,进而减少功耗与延时,同时增加吞吐率。SPU载有Deep Sparse Tensor Core(深度稀疏张量核心),实现稀疏神经网络的高模型精度和高硬件利用效率。

0b1eeca6-4c66-11ee-a25d-92fbcf53809c.png

除了利用稀疏处理单元(SPU)支持深度稀疏性之外,AntoumⓇ还采用了特定领域架构,将各种特殊功能加速器以及内部设计的矢量处理单元与可扩展的片上网络连接起来。

AntoumⓇ共有 32 个 SPU,支持 BF16 和 INT8 数据精度,密集吞吐量为 14.7 TFLOPS 和 29.5 TOPS,在 32 倍稀疏性条件下可实现相当于 471.8 TFLOPS 和 943.6 TOPS 的性能。

此外,AntoumⓇ芯片还具有多个亮点:

存储器层次结构包含总计 82 MB 的片上 SRAM,由 SPU、VPU 和特殊功能加速器共享。

特殊功能加速器包括激活功能、TOPK、Transpose、嵌入式查找以及图像预处理和后处理功能。

高带宽环形互连连接四个 NNCore 子系统,支持模型并行化和张量并行化。

专用硬件视频编解码引擎和 JPEG 解码引擎。四个视频解码器引擎和一个视频编码引擎可处理多通道视频流(高达 4K),并可轻松将可扩展的深度学习集成到视频处理中。集成的 8 个硬件 JPEG 解码器可载 CPU 密集型 JPEG 解码任务,并能以超过 2000 FPS 的速度解码 1080p JPEG 图像。

PCIe Gen3 x 16 和 20 GB LPDDR4x 内存,理论峰值内存带宽高达 84 GB/s,功耗仅为 70 W。

在软件方面,AntoumⓇ由墨芯 SparseRT 软件开发环境支持,为加速开发提供了一个完整的、可扩展的平台,并增强了稀疏计算的能力。现有的机器学习(ML)框架,如 TensorFlow、PyTorch、ONNX 和 MXNet,都能得到SparseRT 全面高效的支持。独特的 SparseOPT 模型压缩工具可为AI模型提供4倍到32倍的稀疏压缩。这样就可以轻松集成到现有的模型交付中,释放大模型的潜力。

AntoumⓇ芯片的优异性能,已在连续两届权威测评MLPerf中得到验证。同时,基于AntoumⓇ的墨芯第一代AI计算卡产品已实现量产,并已在互联网、生命科学、智慧交通等领域落地,产业化接连取得重要进展。墨芯将持续为客户带来高效的大模型算力方案,赋能大模型在各行各业的落地。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    462

    文章

    53539

    浏览量

    459167
  • 软件开发
    +关注

    关注

    0

    文章

    673

    浏览量

    29864
  • 墨芯
    +关注

    关注

    0

    文章

    17

    浏览量

    1239
  • 大模型
    +关注

    关注

    2

    文章

    3442

    浏览量

    4969

原文标题:墨芯携Antoum芯片 亮相行业国际顶会Hot Chips 2023

文章出处:【微信号:墨芯人工智能,微信公众号:墨芯人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    炸裂!为什么各行各业都纷纷拥抱物联网 + 智能?有人硬核方案让降本增效爽到飞起!

    工业 4.0 浪潮席卷下,“物联网”“智能化” 早已不是小众概念,而是渗透钢铁、汽车、食品、环保等全行业的 “生存刚需”。而这背后,“有人智能”的 “云-边-管-端”一站式方案,正成为各行各业
    的头像 发表于 11-27 17:28 71次阅读

    科技ATS3089C芯片形意智能AR99全息智能眼镜

    AI与可穿戴技术深度融合的当下,炬科技再添落地新成果。其高性能穿戴芯片平台ATS3089C已成功
    的头像 发表于 11-18 16:59 1159次阅读

    微荣登“2025高工具身智能年度力量榜”,合众恒跃板卡解锁AI价值

    芯片-板卡-场景”的深度协同,共同构筑产业升级。目前,瑞微旗舰芯片RK3588广泛应用于丰富的机器人形态,并在各行各业落地商用,包括人形
    的头像 发表于 11-18 11:32 5934次阅读
    瑞<b class='flag-5'>芯</b>微荣登“2025高工具身智能年度力量榜”,合众恒跃板卡解锁AI<b class='flag-5'>芯</b>价值

    人工智能与陕西省国资算力中心达成战略合作

    新质生产力浪潮推动下,深耕稀疏计算的国内AI芯片企业人工智能(以下简称“”)近日与陕西
    的头像 发表于 10-15 16:17 261次阅读

    人工智能亮相2025外滩大会

    9月10日至13日,人工智能在2025外滩大会盛大亮相,成为"数据与计算展区"备受瞩目的焦点之一。作为深耕稀疏计算的AI芯片企业,
    的头像 发表于 09-11 14:04 592次阅读

    盾时代以AI战略全线产品智能化升级

    ChatGPT掀起的智能革命席卷全球,DeepSeek等大模型持续刷新性能边界,人工智能从实验走向产业深处,成为重塑经济格局、重构安全范式的核心力量。从国家战略到企业实践,从技术突破到场景落地,智能化浪潮以前所未有的速度推动着社会变革。
    的头像 发表于 07-14 15:47 1362次阅读

    人工智能入选中国战略性新兴产业典型案例

    近日,人工智能科技(深圳)有限公司(以下简称"人工智能"或“”)入选国家发改委《中国
    的头像 发表于 06-13 14:53 1597次阅读

    宇视科技梧桐大模型交通治理

    迭代已实现多场景任务覆盖。近期推出的“梧桐”大模型事件检测和交通抓拍系列产品,将AI能力深度落地于交通治理场景,算法精度、成像质量和分析性能等方面实现显著提升,
    的头像 发表于 05-16 17:23 802次阅读

    UV胶应用广泛,涉及各行各业,那么电子UV胶水会腐蚀电子元器件吗?

    UV胶应用广泛,涉及各行各业,那么电子UV胶水会腐蚀电子元器件吗?UV(紫外线)胶水是一种特殊的胶水,它在受到紫外线照射后迅速固化。电子UV胶水通常用于电子组件的固定、封装和保护,以及电子设备的制造
    的头像 发表于 05-06 11:18 906次阅读
    UV胶应用广泛,涉及<b class='flag-5'>各行各业</b>,那么电子UV胶水会腐蚀电子元器件吗?

    DeepSeek大模型如何推动“AI+物流”融合创新

    人工智能技术的迭代浪潮中,大模型(Large Language Models, LLM)正从文本生成、图像创作走向垂直行业。2025年新年,国产 AI 大
    的头像 发表于 02-28 16:36 1041次阅读

    AI时代码垛机器人应用于各行各业

     AI技术日新月异的今天,码垛机器人作为自动化生产线的关键设备,正以其獨特的技术优势,应用于各行各业,推动着传统制造业向智能化、效高化转型。码垛机器人,这一集成了机械、电子、计算机、传感器
    的头像 发表于 02-23 10:42 618次阅读
    AI时代码垛机器人应用于<b class='flag-5'>各行各业</b>

    DeepSeek模型成功部署,物通博联在 AI 工业上持续探索、不断前行

    近期,DeepSeek(深度求索)AI大模型全球引发广泛关注,其强大的自然语言处理和多模态分析能力,为各行各业带来了全新的智能化想象空间。 DeepSeek选择开源模型,允许开发者自
    的头像 发表于 02-12 11:15 1101次阅读

    Kneron AI实现部署DeepSeek-R1大模型

    人工智能的快速发展浪潮中,Kneron 始终紧跟最前沿的技术,并不断优化自身的 AI 方案,以更强大的能力和更优的性价比各行各业
    的头像 发表于 02-10 11:03 995次阅读

    NVIDIA RAPIDS cuDF如何AI加速数据科学

    随着 AI 正帮助各行各业推动创新和提高效率,基于海量的高质量数据来训练各种模型是充分发挥 AI 应用潜力的必经之路,正因如此,数据科学家们面临着日益增长的工作负载需求,迫切需求寻找高效趁手的工具以应对挑战。
    的头像 发表于 01-24 09:26 1048次阅读

    中兴通讯助力各行各业数字化转型

    数字经济浪潮汹涌澎湃,重塑着世界经济格局与社会发展脉络。国内数字化转型蓬勃开展,从城市到乡村,从沿海到内陆,数字化触角深入华夏每一寸土地,渗透进各行各业的肌理之中,成为推动社会经济高质量发展的关键力量。
    的头像 发表于 01-23 17:06 1031次阅读