0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

英伟达A800芯片也要被禁售了?中国AI大模型还能怎么玩?国产GPU能否挑大梁

Carol Li 来源:电子发烧友网 作者:李弯弯 2023-06-29 09:09 次阅读

电子发烧友网报道(文/李弯弯)近日消息,美国考虑进一步限制向中国出口AI芯片,商务部最早可能在下个月初采取行动。在没有获得许可证的情况下,美商务部将禁止英伟达等制造商向中国客户运送AI芯片。英伟达专供中国的A800芯片,在无许可证的情况下也将被禁售。

A800是英伟达专为中国客户推出的产品,用以解决美国商务部的半导体出口新规,取代A100 GPU,该产品在2022年第三季度起投产。近段时间,大模型迅猛发展,国内在新规之前采购的可流通A100并不多,目前各互联网厂商争相采购的主要是A800。

A800被禁售,国内AI大模型训练受阻?

在AI大模型的训练上,现在基本上是用英伟达的A100、H100以及特供中国的减配版 A800、H800。2020年和2022年,英伟达先后推出了A100芯片、H100芯片,其中A100显卡又提供80GB、40GB两个显存版本,H100则提供80GB显存。

A100拥有540亿晶体管,采用台积电7nm工艺制程,支持FP16、FP32和FP64浮点运算,为人工智能、数据分析和HPC数据中心等提供算力。

H100集成800亿晶体管,采用台积电定制的4nm工艺,相比于A100,H100在FP16、FP32和FP64计算上比A100快三倍,非常适用于当下流行且训练难度高的大模型。

2022年9月,美国商务部对GPU 的出口规定,主要限制是显卡的算力和带宽,算力上线是4800 TOPS,带宽上线是600 GB/s。A800的带宽为400GB/s,低于A100的600GB/s,H800的参数并未公布,据知情人士透露只有H100(900 GB/s)到约一半。

这意味着A800、H800在进行AI模型训练的时候,需要耗费更长的时间,不过这相比于其他的同类产品,性能仍然是高的。

最近大半年时间,随着ChatGPT的出圈,国内外各大互联网公司、AI企业都在大力研发自己的AI大模型产品,而这也造成了对GPU的极大需求。各大互联网厂商都在大力采购英伟达的GPU芯片,包括百度、阿里、腾讯、字节跳动等等。

在国内,还可流通的A100并不多,据一家服务器定制企业的销售经理描述,需求太过火爆,甚至有人从机房里把芯片禁运政策生效前购买的A100 80GB拆出来倒卖。

如今,国内市场还是主要倚赖在政策允许范围内的A800芯片。不过大模型火爆之后,因为需求太大,A800也出现供货周期拉长、价格上涨的情况,据业内人士透露,之前两周时间就能到货,现在乐观的情况也要4-6周的时间,甚至更长。

如今,根据美国商务部的意思,A800在无许可证的情况下将被禁售,这意味着,后续国内企业在大模型的研究中,不仅仅是买到A800需要更长时间的问题,而是很可能买不到的问题。而且不仅仅是A800,其他AI芯片向中国的销售也可能受阻,包括原本也可以用于一些模型训练,性能较差一些的V100等。这意味着,国内企业AI大模型后续的训练将受阻。

国产GPU能否挑大梁?

如此看来,国内AI后续的发展,它对算力的需求似乎就只能指望国产GPU了。目前国产GPU的情况如何呢?

大模型训练需要处理高颗粒度的信息,对云端训练芯片的芯片处理信息的精细度和算力速度要求更高,现阶段国产GPU大多数不具备支撑大模型训练所需的能力。

不同于多媒体和图形处理的单精度浮点计算(FP32)计算需求,在超算领域,双精度浮点计算能力FP64是进行高算力计算的硬性指标。

目前国内GPU芯片的云端训练公司,大多只能处理单精度浮点计算,如壁仞科技(通用GPU芯片BR100)、天数智芯(“智铠100”)、寒武纪(云端推理思元270)的产品在FP32的理论指标上做得不错,但没有处理FP64的能力。

所以说,从短期来看,国产的GPU产品还难以支撑起AI大模型的训练,这意味着英伟达A800芯片被禁售,国内AI大模型接下来的研究将难以为继。

那是不是说,无论是国内的AI大模型企业,还是国产的GPU企业,真的就束手无策了?也并不是。据业内人士介绍,对于算力的需求主要与模型参数有关,大厂现在所做的通用大模型依然只能使用英伟达的产品。但是,垂类行业的大模型(金融、医疗等)或者参数量不像GPT那样大的模型,一些国产GPU也能够做到。

比如,国内某短视频平台参数量约为1000亿的大模型,就用了寒武纪的产品,做训练和推理。当然该模型训练使用了英伟达的A100。

此外,今年6月10日,天数智芯对外宣布,在天垓100加速卡的算力集群,基于北京智源人工智能研究院70亿参数的Aquila语言基础模型,使用代码数据进行继续训练,稳定运行19天,模型收敛效果符合预期,证明天数智芯有支持百亿级参数大模型训练的能力。

摩尔学院院长李丰此前对媒体表示,公司已经可以支持3亿参数量模型的训练。

首都在线表示,公司与燧原科技联合开发的AIGC模型方案已发布内测,产品可以从容应对前期投入大、算力要求高、算法模型快速迭代创新的需求,并广泛支持文本、语音、视觉等各技术方向的模型训练。

可见,目前国产GPU虽然在参数量较大的模型训练上存在不足,但是确实已经能够在一些中小参数模型的训练上有所作为。

登临科技联合创始人王平此前对媒体表示,相比于国际领先的GPU产品,国产GPU确实在满足大模型训练上存在差距,因为此前行业在产品定义上未朝大模型方向做设计。

而现在国产GPU公司都在朝着大模型方向去布局,相信未来终能够找到方向,进行突破。而且如今A800在无许可证的情况下如果禁售,这对于国产GPU的发展将会有强大的刺激作用,因为如果不突破,意味着国内未来AI大模型的发展将无计可施,这似乎成了唯一的出路。

目前业界正在做相关的探索,比如,思考能否通过Chiplet、先进封装的方式提高算力。研究如何提升芯片与芯片间的数据传输速度等。昆仑芯就表示,相较于第一代产品,昆仑芯2在算力、互联上都有大幅优化,公司正在不断研发新的产品和技术,以满足ChatGPT等大模型的应用需求。

小结

很显然,在A100、H100之后,若A800在无许可证下被禁售,意味着国内AI大模型后续的训练将无GPU可用。目前而言国产GPU几乎还不能用于较大规模参数模型的训练。不过可以看到,一些产品在较小规模,比如几亿、甚至百亿级别参数规模的模型训练上,已经可以有所作为。而且目前众厂商都在朝着大模型应用方向进行探索,从长远来看,必然会逐步取得进展。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    26459

    浏览量

    264079
  • 英伟达
    +关注

    关注

    22

    文章

    3330

    浏览量

    87783
  • A800
    +关注

    关注

    0

    文章

    14

    浏览量

    134
收藏 人收藏

    评论

    相关推荐

    连AMD 7900 XT也未能幸免?4090之后,戴尔在中国禁售多款显卡

    的产品等。   这意味着,在10月份英伟达多款AI加速GPU包括A100、A800、H100等,以及消费级旗舰GPU RTX 4090在
    的头像 发表于 11-27 09:14 3040次阅读
    连AMD 7900 XT也未能幸免?4090之后,戴尔在<b class='flag-5'>中国</b><b class='flag-5'>禁售</b>多款显卡

    算力市场掀起价格风暴 英伟A800租赁价跳水

    在这场价格风暴中,英伟A800的租赁价格跳水至仅需2元/时,无疑成为了市场的焦点。
    的头像 发表于 04-03 16:43 1755次阅读

    英伟达称受管制GPUA800和H800外,RTX 4090也被禁;壁仞回应被美列入实体清单:强烈反对

    热点新闻 1、英伟达称受管制GPUA800和H800外,RTX 4090也被禁 美国政府10月17日公布了新的出口管制措施,进一步限制更多
    的头像 发表于 10-18 19:05 2476次阅读
    <b class='flag-5'>英伟</b>达称受管制<b class='flag-5'>GPU</b>:<b class='flag-5'>A800</b>和H<b class='flag-5'>800</b>外,RTX 4090也<b class='flag-5'>被禁</b>;壁仞回应被美列入实体清单:强烈反对

    升腾910和英伟A800性能对比

    升腾910和英伟A800性能对比  随着人工智能技术的快速发展,AI芯片也越来越受到关注。其中,升腾910和英伟
    的头像 发表于 08-31 17:08 1.1w次阅读

    英伟A800 GPU交货中国大陆客户或排到明年Q1

    知情人士称,百度、腾讯、阿里巴巴已订购10亿美元,将从这家美国芯片制造商购买约10万个a800 gpu处理器。该处理器将于今年交付。据nvidia的两位亲信透露,中国集团还购买了将在2
    的头像 发表于 08-16 10:58 608次阅读

    GPU国产化率不足1%!沐曦GPU芯片曦思N100和曦云C500火爆登场

    电子发烧友原创 章鹰   “美国的高端GPU中国禁售,即使是英伟达面对中国市场供应的A800
    的头像 发表于 08-16 01:13 8560次阅读
    <b class='flag-5'>GPU</b><b class='flag-5'>国产</b>化率不足1%!沐曦<b class='flag-5'>GPU</b><b class='flag-5'>芯片</b>曦思N100和曦云C500火爆登场

    英伟达h800a800的区别

    英伟达h800a800的区别 英伟达H800A800都是
    的头像 发表于 08-08 16:20 2.8w次阅读
    <b class='flag-5'>英伟</b>达h<b class='flag-5'>800</b>和<b class='flag-5'>a800</b>的区别

    英伟达h800a800的区别

    英伟达h800a800的区别 V100和A100是非常强大的GPU。A100、H100是原版,特供中国市场的减配版是
    的头像 发表于 08-08 15:59 6508次阅读

    英伟达h800的参数介绍

    英伟达h800的参数介绍 英伟达H800是一款特供版本,是英伟达为了符合美国出口标准,推出了A800
    的头像 发表于 08-08 15:38 2.4w次阅读
    <b class='flag-5'>英伟</b>达h<b class='flag-5'>800</b>的参数介绍

    英伟达a100和a800参数对比

    英伟达a100和a800参数对比 以下是英伟达A100和A800的主要参数对比: | 参数 | A100 | A800 | |  | 架构
    的头像 发表于 08-07 18:00 1w次阅读
    <b class='flag-5'>英伟</b>达a100和<b class='flag-5'>a800</b>参数对比

    英伟达a100和a800的区别

    Core加速器,而A800则没有。 5. 能效比不同:A100比A800更节能,功耗为400W,而A800为250W。 总的来说,A100在AI计算方面表现更加强大,而
    的头像 发表于 08-07 17:57 3.2w次阅读

    a800怎么样 a800和A100显卡区别

    时间推回到2022年11月,英伟达推出了中国特供版GPU芯片A800,可以直接取代A100系列,是专门为了解决美国商务部半导体出口新规而设计
    发表于 07-31 14:15 7842次阅读
    <b class='flag-5'>a800</b>怎么样 <b class='flag-5'>a800</b>和A100显卡区别

    谁在疯抢A800 GPU芯片?疯抢还将持续多久?

    7月中旬,英伟达代理商反馈,英伟达的A800 GPU单价涨至12万元。
    的头像 发表于 07-25 09:08 1123次阅读
    谁在疯抢<b class='flag-5'>A800</b> <b class='flag-5'>GPU</b><b class='flag-5'>芯片</b>?疯抢还将持续多久?

    英伟A800一周涨价超30%

    多位AI企业人士透露,目前A800变得越发稀缺,几乎难以在市场上找到。这是因为英伟达现在更倾向于推广售价更高、良率更高的H系列GPU,因此削减了A系列产品的产量。
    的头像 发表于 07-19 17:11 1069次阅读

    美商务部7月初要禁A800AI芯片及云服务出口限制再加码

    英伟A800 GPU在2022年第三季度投产,是英伟达A100的另一个替代品,供中国客户使用。A8
    的头像 发表于 06-29 15:21 558次阅读
    美商务部7月初要禁<b class='flag-5'>A800</b>?<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>及云服务出口限制再加码