0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

墨芯Antoum芯片赋能大模型在各行各业的落地

墨芯人工智能 来源:墨芯人工智能 2023-09-06 14:21 次阅读

近日,墨芯人工智能携AntoumⓇ芯片亮相芯片行业的国际顶级大会Hot Chips 2023,墨芯首席架构师肖志斌博士在大会Tutorials上发表对行业趋势的分享,并在Conference Day介绍AntoumⓇ的创新架构。

一年一度的Hot Chips是全球芯片产业界影响力最大的活动,被誉为“芯片产业的风向标”,每年都有来自业界前沿的众多头部企业,发布最新产品与创新技术。

今年Hot Chips云集了NVIDIA、高通英特尔AMD等芯片巨头,与墨芯等代表性初创企业,介绍前沿技术与企业最新成果。

肖志斌博士进行《Moffett AntoumⓇ: A Deep-Sparse AI Inference System-on-Chip for Vision and Large Language Models》主题分享,介绍了的AntoumⓇ芯片的创新架构,及AntoumⓇ在大语言模型、计算机视觉等任务上的优势与特点。

由于深度学习模型复杂性的提升及模型的广泛应用,AI计算需求呈指数级增长。尤其是ChatGPT掀起大模型浪潮后,算力供需不平衡的问题日益突出。针对算力难题,墨芯推出全球首颗高倍率稀疏芯片AntoumⓇ,实现了更高的推理效率与能效比。

AntoumⓇ独特的稀疏计算单元SPU(Sparse Processing Unit),可以在负载均衡的情况下进行并行计算,并且只计算非零值,即忽略零元素的存储、搬移、计算,大大提高了计算单元的利用率,进而减少功耗与延时,同时增加吞吐率。SPU载有Deep Sparse Tensor Core(深度稀疏张量核心),实现稀疏神经网络的高模型精度和高硬件利用效率。

0b1eeca6-4c66-11ee-a25d-92fbcf53809c.png

除了利用稀疏处理单元(SPU)支持深度稀疏性之外,AntoumⓇ还采用了特定领域架构,将各种特殊功能加速器以及内部设计的矢量处理单元与可扩展的片上网络连接起来。

AntoumⓇ共有 32 个 SPU,支持 BF16 和 INT8 数据精度,密集吞吐量为 14.7 TFLOPS 和 29.5 TOPS,在 32 倍稀疏性条件下可实现相当于 471.8 TFLOPS 和 943.6 TOPS 的性能。

此外,AntoumⓇ芯片还具有多个亮点:

存储器层次结构包含总计 82 MB 的片上 SRAM,由 SPU、VPU 和特殊功能加速器共享。

特殊功能加速器包括激活功能、TOPK、Transpose、嵌入式查找以及图像预处理和后处理功能。

高带宽环形互连连接四个 NNCore 子系统,支持模型并行化和张量并行化。

专用硬件视频编解码引擎和 JPEG 解码引擎。四个视频解码器引擎和一个视频编码引擎可处理多通道视频流(高达 4K),并可轻松将可扩展的深度学习集成到视频处理中。集成的 8 个硬件 JPEG 解码器可载 CPU 密集型 JPEG 解码任务,并能以超过 2000 FPS 的速度解码 1080p JPEG 图像。

PCIe Gen3 x 16 和 20 GB LPDDR4x 内存,理论峰值内存带宽高达 84 GB/s,功耗仅为 70 W。

在软件方面,AntoumⓇ由墨芯 SparseRT 软件开发环境支持,为加速开发提供了一个完整的、可扩展的平台,并增强了稀疏计算的能力。现有的机器学习(ML)框架,如 TensorFlow、PyTorch、ONNX 和 MXNet,都能得到SparseRT 全面高效的支持。独特的 SparseOPT 模型压缩工具可为AI模型提供4倍到32倍的稀疏压缩。这样就可以轻松集成到现有的模型交付中,释放大模型的潜力。

AntoumⓇ芯片的优异性能,已在连续两届权威测评MLPerf中得到验证。同时,基于AntoumⓇ的墨芯第一代AI计算卡产品已实现量产,并已在互联网、生命科学、智慧交通等领域落地,产业化接连取得重要进展。墨芯将持续为客户带来高效的大模型算力方案,赋能大模型在各行各业的落地。

审核编辑:彭菁

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 芯片
    +关注

    关注

    447

    文章

    47804

    浏览量

    409172
  • 软件开发
    +关注

    关注

    0

    文章

    556

    浏览量

    27179
  • 墨芯
    +关注

    关注

    0

    文章

    5

    浏览量

    1035
  • 大模型
    +关注

    关注

    2

    文章

    1532

    浏览量

    1130

原文标题:墨芯携Antoum芯片 亮相行业国际顶会Hot Chips 2023

文章出处:【微信号:墨芯人工智能,微信公众号:墨芯人工智能】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    国产六核CPU,三屏异显,新一代商显

    当今时代,以数字化、网络化、智能化为特征的第四次工业革命正在进行,伴随着国内汽车新能源的普及,加速了国产高安全芯片的快速发展,D9360是驰推出的一款六核CPU的高度集成、低功耗化、高安全性芯片
    发表于 12-22 18:07

    车载语音发展现状及未来发展趋势

    ChatGPT 的爆火,让其背后依赖的大模型技术快速从AI领域向各行各业延伸。2023年,大模型在汽车领域快速发展,多个车企在智能座舱、智能驾驶等场景探索大模型
    的头像 发表于 12-21 14:12 1134次阅读
    车载语音发展现状及未来发展趋势

    满足企业大模型落地五大需求:百度智能云升级“云智一体”战略

    面向企业客户启动文心大模型4.0 API调用服务测试申请,服务超过17000家客户,在各行各业的近500个场景中进行大模型应用落地探索……自今年3月面世以来,百度智能云千帆大
    的头像 发表于 10-22 10:38 734次阅读

    全志的芯片为什么能覆盖到各行各业?专访全志集团副总裁胡东明

    本文转载自 公众号:电子工程专辑 作者:张玄 前不久的Tech-G上海国际消费电子展上,我们注意到全志科技展示了自家芯片各行各业的应用,包括智慧生活、智慧汽车、智慧工业、智慧视觉等等。其实全志这家
    的头像 发表于 10-20 01:35 686次阅读
    全志的<b class='flag-5'>芯片</b>为什么能覆盖到<b class='flag-5'>各行各业</b>?专访全志集团副总裁胡东明

    英码科技精彩亮相火爆的IOTE 2023,多面AIoT产业发展!

    英码科技展位上,现场的伙伴们集中了解到了基于多家国产主流平台算力产品的特点和对应的落地案例,同时深入了解英码科技项目
    发表于 09-25 10:03

    格灵深瞳致力于利用先进技术提供创新的解决方案和产品赋能各行各业

    杯·OFweek2023人工智能行业领航企业奖”。   作为一家专注于人工智能领域的公司,格灵深瞳致力于利用先进技术提供创新的解决方案和产品,赋能各行各业。凭借过硬的技术能力和长期的商业化经验,格灵深瞳已成功在智慧金融、城市管理、商
    的头像 发表于 09-08 14:12 325次阅读

    智能外呼机器人广泛应用于各行各业

    机器人AI
    jf_86111705
    发布于 :2023年09月04日 16:04:01

    华为宣布全面建设盘古大模型全域协同生态

    华为云盘古大模型主题论坛上,华为云EI服务产品部部长尤鹏宣布了建设盘古大模型全域协同生态的计划。他表示,华为云将与各行各业的客户和伙伴共同合作,共享盘古大模型带来的行业AI新机遇。
    的头像 发表于 08-31 11:45 980次阅读

    华为云盘古大模型主题论坛在北京召开

    华为云以盘古大模型先进架构为核心,结合昇腾AI云服务提供的强大算力,致力于构建多样化的行业解决方案,使每个行业、每个企业、每个人都能充分利用盘古大模型的优势。同时,华为云宣布将建设盘古大模型全域协同生态,与
    的头像 发表于 08-31 11:39 786次阅读

    2 嵌入式物联网各行各业中的应用 - 第2节 #硬声创作季

    fpga程序代码模组NB-IoT
    充八万
    发布于 :2023年08月30日 19:13:58

    2 嵌入式物联网各行各业中的应用 - 第1节 #硬声创作季

    fpga程序代码模组NB-IoT
    充八万
    发布于 :2023年08月30日 19:13:08

    发展大模型,是否解决算力问题就够了?

    随着大模型概念火热,算力成为各行各业关注的热门话题。英伟达显卡被抢爆,媒体关注“大模型时代到来,算力够不够”,行业想要解决AIGC时代的算力瓶颈问题。然而,发展大模型,是否解决算力问题
    的头像 发表于 08-21 16:03 685次阅读

    白海科技与百川智能顺势而为、携手共进,助力领域大模型应用快速落地

    (2023年08月08日,中国北京讯)近日,AI基础软件服务商白海科技与国内领先的AGI服务企业百川智能宣布达成战略合作协议。这次合作旨在加速大语言模型各行各业的应用,并为客户提供智能高效
    的头像 发表于 08-08 14:23 756次阅读

    生成式ai会带来怎样的改变?生成式AI引领各行各业迈向高效新时代

    2022 年 11 月 22 日是一个历史性时刻,给各行各业带来了震撼和影响。 那一天,OpenAI 发布了有史以来最先进的 AI 聊天机器人 ChatGPT,这引发了对生成式 AI 应用的需求
    的头像 发表于 08-04 10:14 1365次阅读
    生成式ai会带来怎样的改变?生成式AI引领<b class='flag-5'>各行各业</b>迈向高效新时代

    蚂蚁集团正研发贞仪大模型

    蚂蚁集团正研发贞仪大模型 生成式人工智能给各行各业带来新的增长机会,很多科技企业都在研发大模型;甚至OpenAI也正在考虑创建一个应用程序商店,OpenAI构建平台供客户向企业出售定制的AI
    的头像 发表于 06-21 17:16 985次阅读