0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4,华人AI芯片独角兽估值365亿

传感器技术 来源:量子位 2023-09-23 10:29 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

高端GPU持续缺货之下,一家要挑战英伟达的芯片初创公司成为行业热议焦点。

8枚芯片跑大模型,就能支持5万亿参数(GPT-4的三倍)。

这是独角兽企业SambaNova刚刚发布的新型AI芯片SN40L——

型号中40代表是他们第四代产品,L代表专为大模型(LLM)优化:高达1.5T的内存,支持25.6万个token的序列长度。

CEORodrigo Liang表示,当前行业标准做法下运行万亿参数大模型需要数百枚芯片,我们的方法使总拥有成本只有标准方法的1/25。

SambaNova目前估值50亿美元(约365亿人民币),累计完成了6轮总计11亿美元的融资,投资方包括英特尔、软银、三星、GV等。

他们不仅在芯片上要挑战英伟达,业务模式上也说要比英伟达走的更远:直接参与帮助企业训练私有大模型。

目标客户上野心更是很大:瞄准世界上最大的2000家企业。

1.5TB内存的AI芯片

最新产品SN40L,由台积电5纳米工艺制造,包含1020亿晶体管,峰值速度638TeraFLOPS。

与英伟达等其他AI芯片更大的不同在于新的三层Dataflow内存系统。

520MB片上SRAM内存

65GB的高带宽HBM3内存

以及高达1.5TB的外部DRAM内存

831e8822-599c-11ee-939d-92fbcf53809c.png

与主要竞品相比,英伟达H100最高拥有80GB HBM3内存,AMD MI300拥有192GB HBM3内存。

SN40L的高带宽HBM3内存实际比前两者小,更多依靠大容量DRAM。

Rodrigo Liang表示,虽然DRAM速度更慢,但专用的软件编译器可以智能地分配三个内存层之间的负载,还允许编译器将8个芯片视为单个系统。

83257e16-599c-11ee-939d-92fbcf53809c.png

除了硬件指标,SN40L针对大模型做的优化还有同时提供密集和稀疏计算加速。

他们认为大模型中许多权重设置为0,像其他数据一样去执行操作很浪费。

他们找到一种软件层面的加速办法,与调度和数据传输有关,但没有透露细节,“我们还没准备好向公布是如何做到这一点的”。

咨询机构Gartner的分析师Chirag Dekate认为,SN40L的一个可能优势在于多模态AI。

GPU的架构非常严格,面对图像、视频、文本等多样数据时可能不够灵活,而SambaNova可以调整硬件来满足工作负载的要求。

目前,SambaNova的芯片和系统已获得不少大型客户,包括世界排名前列的超算实验室,日本富岳、美国阿贡国家实验室、劳伦斯国家实验室,以及咨询公司埃森哲等。

业务模式也比较特别,芯片不单卖,而是出售其定制技术堆栈,从芯片到服务器系统,甚至包括部署大模型。

为此,他们与TogetherML联合开发了BloomChat,一个1760亿参数的多语言聊天大模型。

BloomChat建立在BigScience组织的开源大模型Bloom之上,并在来自OpenChatKit、Dolly 2.0和OASST1的OIG上进行了微调。

训练过程中,它使用了SambaNova独特的可重配置数据流架构,然后在SambaNova DataScale系统进行训练。

8345a0ce-599c-11ee-939d-92fbcf53809c.png

这也是这家公司最大被投资者热捧之外的最大争议点之一,很多人不看好一家公司既做芯片又做大模型。

给每家大企业打造150个大模型

在与The Next Platform网站交流时,CEO Rodrigo Liang表示:

用于大模型训练的公开数据已快耗尽,但对参数数量的追求还在不断增加。

各种大模型的性能相差只有几个百分点,这不是大家应该玩的游戏。

他认为大模型与生成式AI商业化的下一个战场是企业的私有数据,尤其是大企业。

这些企业坐拥大量的数据,但自己不知道其中大部分内容是什么。

834f900c-599c-11ee-939d-92fbcf53809c.png

对于企业私有大模型的形态,SambaNova也有与众不同的观点。

他们认为最终企业内部不会运行一个GPT-4或谷歌Gemini那样的超大模型,而是根据不同数据子集创建150个独特的模型,聚合参数超过万亿。

相当于把GPT-4等大模型内部的Mixture of Experts(专家混合)架构扩展到整个系统,称为Composition of Experts(专家合成)。

在企业运转的每个节点运行一个完整且经过专门调整的基础模型,分别用法律语料库、制造语料库、风险管理语料库、财富管理语料库、客户销售语料库、客户支持语料库等等不同数据训练。

这些专家模型之间通过一种软件路由或负载平衡器联在一起,收到推理请求后决定具体向哪个模型推送提示词。

这一策略与GPT-4和谷歌Gemini等做法形成鲜明对比,巨头大多希望创建一个能泛化到数百万个任务的巨型模型。

分析师认为技术上可能谷歌的做法性能更强,但SambaNova的方法对企业来说更实用。

没有任何一个模型或人能完整访问企业的所有数据,限制每个部门能访问的专家模型,就能限制他们能访问的数据。

斯坦福系芯片公司,华人工程师主力

SambaNova成立于2017年,2020年之前都比较低调。

联创3人都是斯坦福背景,连产品系列名Cardinal(深红色)都是斯坦福的昵称与代表颜色。

CEO Rodrigo Liang是前Sun/甲骨文工程副总裁,也有人将这个名字解读为暗指甲骨文老对头IBM的DeepBlue(深蓝)。

另外两位联合创始人都是斯坦福教授。

CTOKunle Olukotun是电气工程教授,因多核芯片架构方面的研究而闻名,开发了首批支持线程级推测 (TLS) 的芯片之一。

Christopher Ré是计算机科学副教授,重点研究方向机器学习和数据分析的速度和可扩展性。

此外团队中还有不少华人工程师。

从官网公开信息来看,SambaNova的领导团队中,至少有3名华人。

Jonathan Chang,拥有UC伯克利的机械工程学士学位以及南加州大学的MBA学位。

他在构建高增长方面拥有20多年的经验。加入SambaNova之前,Chang在特斯拉工作了近9年。

Marshall Choy,此前曾担任甲骨文公司系统产品管理和解决方案开发副总裁,监督了数十个行业的企业硬件和软件产品的上市。

Penny Li,在EDA工具微处理器设计方面拥有超过27年的经验。此前,她曾在IBM和甲骨文工作过。

如果去领英搜索还能发现更多华人团队成员。

目前SambaNova包含SN40L芯片的人工智能引擎已上市,但定价没有公开。

根据Rodrigo Liang的说法,8个SN40L组成的集群总共可处理5万亿参数,相当于70个700亿参数大模型。

全球2000强的企业只需购买两个这样的8芯片集群,就能满足所有大模型需求。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5272

    浏览量

    136072
  • 英伟达
    +关注

    关注

    23

    文章

    4116

    浏览量

    99634
  • AI芯片
    +关注

    关注

    17

    文章

    2165

    浏览量

    36869

原文标题:1.5T内存挑战英伟达!8枚芯片撑起3个GPT-4,华人AI芯片独角兽估值365亿

文章出处:【微信号:WW_CGQJS,微信公众号:传感器技术】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    喜讯 | Zynalog徴格半导体入选“准独角兽

    榜单》。凭借在集成电路模拟芯片领域过硬的技术实力、出色的市场化水平以及全面的综合能力,Zynalog徴格半导体成功入选准独角兽企业。准独角兽是指
    的头像 发表于 04-24 17:04 287次阅读
    喜讯 | Zynalog徴格半导体入选“准<b class='flag-5'>独角兽</b>”

    洛微科技蝉联2026杭州准独角兽企业荣誉

    《2026杭州独角兽与准独角兽企业榜单》重磅发布,杭州洛微科技有限公司凭借持续的技术创新力与强劲的市场增长潜力,荣耀登榜,获杭州市准独角兽企业殊荣,成为杭州硬科技赛道高质量发展的标杆企业之一。
    的头像 发表于 04-24 16:16 997次阅读
    洛微科技蝉联2026杭州准<b class='flag-5'>独角兽</b>企业荣誉

    加速科技荣登2026杭州准独角兽企业榜单

    更是备受业内瞩目。 会上,由杭州市创业投资协会、微链和杭州银行联合发布《2026杭州独角兽与准独角兽企业榜单》。 加速科技凭借优异表现 , 再登2026杭州准独角兽企业榜单 ,连续获此殊荣,是对企业成长韧性与发展势能的权威认证。
    的头像 发表于 04-24 14:00 94次阅读
    加速科技荣登2026杭州准<b class='flag-5'>独角兽</b>企业榜单

    智行者科技荣膺2026年度中国独角兽企业

    3月29日,第三届全球独角兽企业大会在北京召开。作为中关村论坛的重要组成部分,大会汇聚了全球顶尖的创新力量与产业领袖,探讨科技前沿与未来趋势,同时评选出2026年度“中国独角兽企业”。智行者以在物理
    的头像 发表于 03-30 15:58 585次阅读

    3倍,破110亿美元!英伟投资,AI初创公司剑指IPO

    2月4日,人工智能初创公司ElevenLabs 周三宣布,已完成5亿美元D轮资金, 110 亿
    的头像 发表于 02-06 10:51 1.9w次阅读
    涨<b class='flag-5'>3</b>倍,<b class='flag-5'>估</b><b class='flag-5'>值</b>破110<b class='flag-5'>亿</b>美元!<b class='flag-5'>英伟</b><b class='flag-5'>达</b>投资,<b class='flag-5'>AI</b>初创公司剑指IPO

    航盛集团受邀出席第三届中国汽车独角兽大会

    1月18日,由汽车评价研究院、北京隐形独角兽信息科技院、中国汽车隐形独角兽评委会联合主办,以“硬核创新・重构生态:‘十五五’汽车独角兽攻坚科技制高点”为主题的第三届中国汽车独角兽大会在
    的头像 发表于 01-23 15:42 556次阅读

    深兰科技荣登2025全球独角兽企业500强榜单

    近日,在青岛举办的“2025全球独角兽企业500强大会”上,深兰科技凭借在人工智能特别是具身智能方向的技术创新与产业落地能力,成功入选“2025全球独角兽企业500强”,并获颁“全球独角兽企业”证书。自2021年起,深兰科技已连
    的头像 发表于 12-24 16:13 838次阅读

    奕斯伟计算荣登2025全球独角兽企业500强榜单

    近日,由独角兽工程院联合中国人民大学中国民营企业研究中心、清华大学新质生产力研究院、北京隐形独角兽信息科技院和浙江清华长三角研究院独角兽企业研究中心共同发布的《2025全球独角兽企业5
    的头像 发表于 12-18 13:50 558次阅读

    桐汭科技荣获2025深圳市“种子独角兽企业”

    近日,深圳桐汭科技有限公司(简称:桐汭科技)凭借卓越的创新实力与高速成长潜力,荣获由深圳市瞪羚独角兽企业评价委员会授予的【种子独角兽企业】证书!
    的头像 发表于 11-14 17:46 2116次阅读

    左蓝微电子入选2025年江苏省潜在独角兽企业

    2025年9月24日,江苏省新质生产力促进中心在南京举办了“2025年江苏独角兽企业和瞪羚企业评估结果发布会”。会上,2025年江苏独角兽企业、潜在独角兽企业和瞪羚企业名单正式揭晓。在这份重量级榜单
    的头像 发表于 09-30 10:52 1475次阅读

    宏景智驾荣登中国AI出海未来独角兽企业TOP100榜单

    此前,2025年9月17日-21日,第22届中国-东盟博览会(以下简称“东博会”)在广西南宁隆重召开。宏景智驾应邀参会,并凭借其技术优势和行业影响力在东博会的主题活动AI出海独角兽之夜活动中入选《中国AI出海未来
    的头像 发表于 09-30 10:43 1044次阅读

    宏景智驾荣登2025中国隐形独角兽500强榜单

    “2025中国隐形独角兽大会”在广州举办,会上发布《2025中国隐形独角兽500强榜单》,宏景智驾(衢州)科技有限公司(以下简称:宏景智驾)荣登榜单。
    的头像 发表于 08-28 11:19 1491次阅读

    芯驰科技出席独角兽企业融资对接会

    8月15日,由市科委中关村管委会创新创业服务处、中关村高科技产业促进中心联合中关村独角兽企业发展联盟、中国银行北京市分行主办的“独角兽企业融资对接会”在中关村特色园区——首钢园成功举办。
    的头像 发表于 08-19 13:46 1183次阅读

    1414亿元,2025最新中国传感器独角兽名单出炉,有3家退出!(附全名单)

    独角兽企业共372家,总超1.2万亿美元,平均33.4亿美元。其中,11家超级
    的头像 发表于 07-30 18:11 15.6w次阅读
    总<b class='flag-5'>估</b><b class='flag-5'>值</b>1414<b class='flag-5'>亿</b>元,2025最新中国传感器<b class='flag-5'>独角兽</b>名单出炉,有<b class='flag-5'>3</b>家退出!(附全名单)

    隼眼科技荣获2025年度南京市培育独角兽企业

    近日,备受瞩目的《2025年度南京市独角兽、培育独角兽、瞪羚企业榜单》正式揭晓,隼眼科技成功入选“2025年度南京市培育独角兽企业”。这一荣誉不仅是对隼眼科技过往成绩的高度认可,更是对其未来发展潜力的充分肯定。
    的头像 发表于 06-05 17:49 1544次阅读