0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大模型时代,国产GPU面临哪些挑战

Carol Li 来源:电子发烧友 作者:李弯弯 2024-04-03 01:08 次阅读

电子发烧友网报道(文/李弯弯)随着人工智能技术的快速发展,对GPU计算能力的需求也越来越高。国内企业也正在不断提升GPU性能,以满足日益增长的应用需求。然而,相较于国际巨头,国内GPU仍然存在差距,国产GPU在不断成长的过程中也存在诸多挑战。

在大模型训练上存在差距

大语言模型是基于深度学习的技术。这些模型通过在海量文本数据上的训练,学习语言的语法、语境和语义等多层次的信息,用于理解和生成自然语言文本。大语言模型是自然语言处理(NLP)领域中的一个重要分支,应用于文本生成、分类、情感分析等多种任务。

深度学习是现代机器学习领域的一种强大的算法,它可以在图像识别、语音识别、自然语言处理、游戏AI等各种应用领域取得惊人的成果。然而,深度学习对计算几硬件的要求非常高,通常需要使用GPU进行大规模训练。在使用GPU进行深度学习时,一个常见的问题就是选择单精度还是双精度。

浮点数是一种用于表示实数的数值格式,它包括符号位、指数位和尾数位三部分。通过这三部分,浮点数可以表示非常大或非常小的数,同时保持一定的精度。

单精度和双精度是指浮点数在计算机中的存储方式和精度。单精度通常使用32位(4字节)来存储一个浮点数,而双精度则使用64位(8字节)来存储。由于双精度使用了更多的位数,因此它可以表示更大范围的数值,并具有更高的精度。

大模型训练需要处理高颗粒度的信息,因此对于用于大模型训练的GPU芯片处理信息的精细度和算力速度要求更高,现阶段,国产GPU在支持大模型训练的能力方面相对来说还较差。

不同于多媒体和图形处理的单精度浮点计算(FP32)计算需求,双精度浮点计算能力FP64是进行高算力计算的硬性指标。英伟达的A100同时具备上述两类能力,而国内大多GPU只能处理单精度浮点计算。

从目前的信息来看,海光信息的协处理器DCU)能够支持FP64双精度浮点运算,海光DCU属于GPGPU 的一种,采用“类CUDA”通用并行计算架构。据该公司介绍,其DCU产品能够完整支持大模型训练。不过相比于英伟达的A100性能只有其60%。

另外,景嘉微表示面向AI 训练、AI推理、科学计算等应用领域研发成功的景宏系列,支持INT8、FP16、FP32、FP64等混合精度运算,该产品在大模型的训练上或许也可以期待一下。

在软件和生态方面存在差距

除上述情况以外,国产GPU在软件和生态方面与全球领先品牌相比,也存在一定的差距。软件工具链的完善度方面,全球领先的GPU厂商已经构建了完整的软件工具链,包括编译器、调试器、性能分析工具等,可以方便地支持开发人员进行GPU程序的开发、调试和优化。而国产GPU在这方面还需要进一步完善,以满足用户的多样化需求。

生态系统的成熟度方面,全球GPU市场已经形成了较为成熟的生态系统,涵盖了各种应用领域和场景。然而,国产GPU在生态系统建设方面尚处于起步阶段,缺乏足够的应用支持和市场认可。这导致国产GPU在市场上的竞争力相对较弱,难以与全球领先品牌抗衡。

近些年可以明显的看到,国产PGU企业也正在这些方面不断努力。在软件支持方面,国产GPU企业正在积极与主流操作系统、开发环境以及图形处理软件等进行适配,确保用户能够流畅地使用各种应用软件。同时,一些企业还在推动GPU在人工智能、云计算等新兴领域的应用,为国产GPU生态注入新的活力。

在驱动程序优化方面,国产GPU企业也在加大投入力度,不断提升驱动程序的性能和稳定性。通过优化驱动程序,可以充分发挥GPU的性能优势,提升整体计算效率。

此外,国产GPU企业还在积极探索与各种应用场景的深度融合。例如,在游戏、图形设计、视频渲染等领域,国产GPU正在与相关企业合作,共同推动相关应用的发展。这种深度融合不仅有助于提升国产GPU的市场竞争力,也有助于推动整个产业的进步。

写在最后

近些年国产GPU正在蓬勃发展,不过相较于国际巨头,仍然存在较大差距。近年来,大模型快速发展,国产GPU在大模型训练方面的不足也凸显出来。不过也可以看到,目前国产GPU企业都在积极朝大模型方向布局,包括训练和推理。另外软件和生态建设也在加速推进。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    27

    文章

    4426

    浏览量

    126754
  • 大模型
    +关注

    关注

    2

    文章

    1555

    浏览量

    1150
收藏 人收藏

    评论

    相关推荐

    模型时代国产AI芯片最新进展!算力集群化是必然趋势

    、算力提供商也针对大模型展示了相应的方案。   大模型时代国产AI 芯片进展如何?   在这次大会上,瀚博半导体、燧原科技、登临科技、天数智芯等纷纷展示了针对大
    的头像 发表于 07-11 09:05 1422次阅读
    大<b class='flag-5'>模型</b><b class='flag-5'>时代</b>,<b class='flag-5'>国产</b>AI芯片最新进展!算力集群化是必然趋势

    国产GPU在AI大模型领域的应用案例一览

    电子发烧友网报道(文/李弯弯)近一年多时间,随着大模型的发展,GPU在AI领域的重要性再次凸显。虽然相比英伟达等国际大厂,国产GPU起步较晚、声势较小。不过近几年,国内不少
    的头像 发表于 04-01 09:28 2475次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>GPU</b>在AI大<b class='flag-5'>模型</b>领域的应用案例一览

    盘点国产GPU在支持大模型应用方面的进展

    电子发烧友网报道(文/李弯弯)目前谈到GPU,大家首先想到的应该就是英伟达了。近一年多时间来,随着大模型的发展,英伟达GPU的强大实力可谓无人不知。而相比之下,国产
    的头像 发表于 03-29 00:27 3111次阅读
    盘点<b class='flag-5'>国产</b><b class='flag-5'>GPU</b>在支持大<b class='flag-5'>模型</b>应用方面的进展

    FPGA在深度学习应用中或将取代GPU

    现场可编程门阵列 (FPGA) 解决了 GPU 在运行深度学习模型面临的许多问题 在过去的十年里,人工智能的再一次兴起使显卡行业受益匪浅。英伟达 (Nvidia) 和 AMD 等公司的股价也大幅
    发表于 03-21 15:19

    国产光耦2024:发展机遇与挑战全面解析

    随着科技的不断进步,国产光耦在2024年正面临着前所未有的机遇与挑战。本文将深入分析国产光耦行业的发展现状,揭示其在技术创新、市场需求等方面的机遇和
    的头像 发表于 02-18 14:13 348次阅读
    <b class='flag-5'>国产</b>光耦2024:发展机遇与<b class='flag-5'>挑战</b>全面解析

    揭秘GPU: 高端GPU架构设计的挑战

    在计算领域,GPU(图形处理单元)一直是性能飞跃的代表。众所周知,高端GPU的设计充满了挑战GPU的架构创新,为软件承接大模型训练和推理场
    的头像 发表于 12-21 08:28 432次阅读
    揭秘<b class='flag-5'>GPU</b>: 高端<b class='flag-5'>GPU</b>架构设计的<b class='flag-5'>挑战</b>

    模型数据集:构建、挑战与未来趋势

    随着深度学习技术的快速发展,大型预训练模型如GPT-4、BERT等在各个领域取得了显著的成功。这些大模型背后的关键之一是庞大的数据集,为模型提供了丰富的知识和信息。本文将探讨大模型数据
    的头像 发表于 12-06 15:28 640次阅读

    #GPU显卡 #中国制造  中国GPU面临至暗时刻吗?

    半导体元器件gpu
    深圳市浮思特科技有限公司
    发布于 :2023年11月07日 14:43:15

    国产GPU打造强大算力底座,天数智芯助力大模型创新发展

    由工业和信息化部、国家发展和改革委员会、河北省人民政府共同主办的2023中国国际数字经济博览会在石家庄成功举办。天数智芯副总裁郭为受邀参加人工智能驱动产业数字化创新发展论坛并发表了题为《国产GPU
    的头像 发表于 09-07 17:15 648次阅读
    <b class='flag-5'>国产</b><b class='flag-5'>GPU</b>打造强大算力底座,天数智芯助力大<b class='flag-5'>模型</b>创新发展

    训练大语言模型带来的硬件挑战

    生成式AI和大语言模型(LLM)正在以难以置信的方式吸引全世界的目光,本文简要介绍了大语言模型,训练这些模型带来的硬件挑战,以及GPU和网络
    的头像 发表于 09-01 17:14 1130次阅读
    训练大语言<b class='flag-5'>模型</b>带来的硬件<b class='flag-5'>挑战</b>

    沐曦基于曦云C500发布国产首台GPU千亿参数大模型训推一体机

    首台GPU千亿参数大模型训推一体机由数字宁夏倡议发起技术攻关,基于沐曦最新发布的曦云C500旗舰GPU芯片提供的算力支持、智谱华章的AI大模型以及优刻得灵活的算力部署方案,共同打造国内
    的头像 发表于 08-21 14:41 2948次阅读

    GPU上OpenVINO基准测试的推断模型的默认参数与CPU上的参数不同是为什么?

    在 CPU 和 GPU 上推断出具有 OpenVINO™ 基准的相同模型: benchmark_app.exe -m model.xml -d CPU benchmark_app.exe -m
    发表于 08-15 06:43

    华为发布大模型时代AI存储新品

    7月14日,华为发布大模型时代AI存储新品, 为基础模型训练、行业模型训练,细分场景模型训练推理提供存储最优解,释放AI新动能。 企业在开发
    的头像 发表于 07-14 15:20 547次阅读
    华为发布大<b class='flag-5'>模型</b><b class='flag-5'>时代</b>AI存储新品

    天数智芯通用GPU产品为大模型时代提供强大算力底座

    第七届集微半导体峰会于6月初在厦门成功举办,上海天数智芯半导体有限公司(以下简称“天数智芯”)产品线总裁邹翾受邀参加“集微通用芯片行业应用峰会”,发表了题为“国产GPU助力大模型的实践”的主题演讲
    的头像 发表于 06-08 22:55 1036次阅读
    天数智芯通用<b class='flag-5'>GPU</b>产品为大<b class='flag-5'>模型</b><b class='flag-5'>时代</b>提供强大算力底座

    中科驭数分享DPU在AI大模型时代面临的机遇

    中科驭数正式加入“移动云信息技术融合应用创新产业生态联合体”,创始人、CEO鄢贵海应邀在“磐石算力底座”论坛圆桌对话发言,分享DPU在AI大模型时代面临的机遇。
    的头像 发表于 05-08 09:21 997次阅读