电子发烧友网报道(文/黄山明)近日,据新华社报道,上海交通大学集成电路学院陈一彤课题组在新一代光计算芯片领域取得重大突破,首次实现支持大规模语义媒体生成模型的全光计算芯片LightGen,相关成果已经发表于国际顶级学术期刊《科学》(Science),并被选为高光论文重点报道。
这是国际上首次实现大规模全光生成式AI芯片,标志着光计算在生成式AI领域的应用从理论可行性迈入实际效能领先阶段。
全光计算芯片LightGen,突破三项世界级技术瓶颈
资料显示,LightGen定位专为大规模生成式人工智能任务设计的全光端到端计算芯片,主要应用在高分辨率图像生成、3D场景重建、高清视频生成、语义操控、去噪、局部/全局特征迁移等复杂生成任务。
要知道,生成式AI通常需要处理高维张量数据,这就要求芯片具备超大规模的并行计算能力,就好像一个工厂需要生产大量产品,就需要有足够多的员工同时干活。
而传统的光芯片问题在于,无法在单片上集成足够多的光学神经元,并且光信号容易互相干扰。因为光本身具有衍射性和相干性,如果芯片上集成的光学神经元太密集,相邻的神经元的光场就会互相干扰,导致计算出错。
并且光学神经元需要在芯片上加工纳米级的光学元件,这些元件的尺寸远小于电子芯片的晶体管,加工精度要求极高。
LightGen则采用高密度光子集成架构,在仅136.5平方毫米的芯片上集成了200多万个光学神经元,并通过特殊材料和结构设计,解决了串扰和热漂移问题,首次实现了大规模光学神经元的可靠集成。
此外,光不能直接做“非线性激活”,而所有深度神经网络都依赖非线性激活函数(如ReLU、GELU)。但在纯光域中,光与光之间几乎不相互作用,打个比方,真空中两束激光交叉并不会互相影响,这就导致天然缺乏非线性。
以往的光计算芯片只能做线性运算,遇到非线性层就必须把光信号转成电信号,再用电子电路处理,再转回光。这个过程就叫O-E-O(光-电-光转换),不仅速度慢、功耗高,带宽瓶颈也很严重,完全抵消了光计算的速度优势。
LightGen芯片攻克全光域高维特征空间变换难题,实现从低维输入到高维特征的直接转换,可以无需电子辅助,完全通过光场调控完成维度转换,保持光计算的高速特性。
再一个,生成式AI模型通常用“无监督学习”训练,即模型在没有人工标签的情况下,自己学会生成新内容。但光子芯片此前只能做“有监督学习”,原因主要是缺乏可微分的训练机制,以及光子权重更新困难与无法自主“理解”语义。
而LightGen芯片团队提出贝叶斯无真值训练算法(BOGT),解决了光场训练缺乏标注数据的核心难题,使光芯片具备自主学习能力。该算法在光子硬件上实现了可微分的梯度近似,使光子芯片也能像电子神经网络一样,进行端到端的生成式训练。
性能飞跃,走向全面自主
陈一彤课题组不仅解决了光芯片三项世界级技术难题,也让LightGen实现了性能上的飞跃。通过极严格算力评价标准的实测表明,即便采用性能较为滞后的输入设备,LightGen仍可取得相比顶尖数字芯片2个数量级的算力和能效提升。
从参数来看,该芯片面积仅136.5平方毫米,集成200多万光学神经元,算力达3.57×10⁴万亿次/秒,能效664TOPS/W,较英伟达高端计算卡(A100)提升两个数量级,理论上最高可提升7个数量级。
这意味着该芯片如果能够量产,有望解决生成式AI算力短缺、能耗高企的问题,为AI在医疗影像、工业设计、元宇宙、自动驾驶等场景的规模化应用提供核心算力支撑。
而LightGen的出现,也标志着我国在下一代算力芯片国际竞争中占据有利位置,突破了对高端电子芯片的依赖,有助于推动国产AI算力生态的自主可控。
另一方面,随着生成式AI的规模化应用,需要使用大量算力,而传统电子芯片的高能耗已经成为瓶颈。而LightGen的能效的巨大提升,可直接降低数据中心的电力需求与PUE值(电源使用效率),缓解当前数据中心面临的电力短缺与“碳排放”问题。若大规模应用,可使AI数据中心能耗降低90%以上,缓解“算力黑洞”问题。
值得一提的是,LightGen采用薄膜铌酸锂(LNOI)和磷化铟(InP)等非硅基光子材料,以克服硅在电光调制速度、片上光源集成和高效非线性光学响应等方面的物理限制,从而实现高性能全光神经网络。
简单解释一下,原因在于硅是一种半导体,不是理想的绝缘体。当用高强度的光照射硅时,两个光子可以同时被一个硅原子吸收,激发出一个自由电子。这些被激发出来的自由电子会像云一样在材料中漂浮,它们会进一步吸收后续通过的光信号。这个过程不仅严重增加了光信号的损耗,还会改变材料的折射率,导致计算结果出错。
而LNOI是一种宽禁带绝缘体,它的能带结构决定了它在通信和计算常用的光波段下,几乎不会发生双光子吸收,避免了硅材料的缺陷。
更重要的是,LightGen为生成式AI、科学计算提供了不依赖先进制程的替代方案,规避EUV光刻机限制。因为光芯片的核心结构是光波导、微环谐振器、调制器等,这些器件通常在几百纳米到几微米量级,因此无需 EUV,主流使用DUV光刻甚至电子束光刻即可制造。
这也意味着,我国可以建立不依赖传统半导体产业链的全新光计算生态,掌握核心技术自主权。为AI大模型、高性能计算等战略领域提供不受制于人的算力保障,最终实现算力自主可控。
总结
LightGen芯片的诞生,标志着我国光计算的重大突破,其非硅基、非电子依赖的特性,为解决当前AI算力的能耗瓶颈与硅基依赖问题提供了全新路径。这种突破不仅具有技术上的颠覆性,更对“双碳”目标下的绿色AI发展具有深远意义。业内评价认为,LightGen不仅是实验室突破,更展示了光计算在复杂生成任务中的实用化潜力,为我国在前沿人工智能领域的竞争提供了关键硬件基础。
这是国际上首次实现大规模全光生成式AI芯片,标志着光计算在生成式AI领域的应用从理论可行性迈入实际效能领先阶段。
全光计算芯片LightGen,突破三项世界级技术瓶颈
资料显示,LightGen定位专为大规模生成式人工智能任务设计的全光端到端计算芯片,主要应用在高分辨率图像生成、3D场景重建、高清视频生成、语义操控、去噪、局部/全局特征迁移等复杂生成任务。
要知道,生成式AI通常需要处理高维张量数据,这就要求芯片具备超大规模的并行计算能力,就好像一个工厂需要生产大量产品,就需要有足够多的员工同时干活。
而传统的光芯片问题在于,无法在单片上集成足够多的光学神经元,并且光信号容易互相干扰。因为光本身具有衍射性和相干性,如果芯片上集成的光学神经元太密集,相邻的神经元的光场就会互相干扰,导致计算出错。
并且光学神经元需要在芯片上加工纳米级的光学元件,这些元件的尺寸远小于电子芯片的晶体管,加工精度要求极高。
LightGen则采用高密度光子集成架构,在仅136.5平方毫米的芯片上集成了200多万个光学神经元,并通过特殊材料和结构设计,解决了串扰和热漂移问题,首次实现了大规模光学神经元的可靠集成。
此外,光不能直接做“非线性激活”,而所有深度神经网络都依赖非线性激活函数(如ReLU、GELU)。但在纯光域中,光与光之间几乎不相互作用,打个比方,真空中两束激光交叉并不会互相影响,这就导致天然缺乏非线性。
以往的光计算芯片只能做线性运算,遇到非线性层就必须把光信号转成电信号,再用电子电路处理,再转回光。这个过程就叫O-E-O(光-电-光转换),不仅速度慢、功耗高,带宽瓶颈也很严重,完全抵消了光计算的速度优势。
LightGen芯片攻克全光域高维特征空间变换难题,实现从低维输入到高维特征的直接转换,可以无需电子辅助,完全通过光场调控完成维度转换,保持光计算的高速特性。
再一个,生成式AI模型通常用“无监督学习”训练,即模型在没有人工标签的情况下,自己学会生成新内容。但光子芯片此前只能做“有监督学习”,原因主要是缺乏可微分的训练机制,以及光子权重更新困难与无法自主“理解”语义。
而LightGen芯片团队提出贝叶斯无真值训练算法(BOGT),解决了光场训练缺乏标注数据的核心难题,使光芯片具备自主学习能力。该算法在光子硬件上实现了可微分的梯度近似,使光子芯片也能像电子神经网络一样,进行端到端的生成式训练。
性能飞跃,走向全面自主
陈一彤课题组不仅解决了光芯片三项世界级技术难题,也让LightGen实现了性能上的飞跃。通过极严格算力评价标准的实测表明,即便采用性能较为滞后的输入设备,LightGen仍可取得相比顶尖数字芯片2个数量级的算力和能效提升。
从参数来看,该芯片面积仅136.5平方毫米,集成200多万光学神经元,算力达3.57×10⁴万亿次/秒,能效664TOPS/W,较英伟达高端计算卡(A100)提升两个数量级,理论上最高可提升7个数量级。
这意味着该芯片如果能够量产,有望解决生成式AI算力短缺、能耗高企的问题,为AI在医疗影像、工业设计、元宇宙、自动驾驶等场景的规模化应用提供核心算力支撑。
而LightGen的出现,也标志着我国在下一代算力芯片国际竞争中占据有利位置,突破了对高端电子芯片的依赖,有助于推动国产AI算力生态的自主可控。
另一方面,随着生成式AI的规模化应用,需要使用大量算力,而传统电子芯片的高能耗已经成为瓶颈。而LightGen的能效的巨大提升,可直接降低数据中心的电力需求与PUE值(电源使用效率),缓解当前数据中心面临的电力短缺与“碳排放”问题。若大规模应用,可使AI数据中心能耗降低90%以上,缓解“算力黑洞”问题。
值得一提的是,LightGen采用薄膜铌酸锂(LNOI)和磷化铟(InP)等非硅基光子材料,以克服硅在电光调制速度、片上光源集成和高效非线性光学响应等方面的物理限制,从而实现高性能全光神经网络。
简单解释一下,原因在于硅是一种半导体,不是理想的绝缘体。当用高强度的光照射硅时,两个光子可以同时被一个硅原子吸收,激发出一个自由电子。这些被激发出来的自由电子会像云一样在材料中漂浮,它们会进一步吸收后续通过的光信号。这个过程不仅严重增加了光信号的损耗,还会改变材料的折射率,导致计算结果出错。
而LNOI是一种宽禁带绝缘体,它的能带结构决定了它在通信和计算常用的光波段下,几乎不会发生双光子吸收,避免了硅材料的缺陷。
更重要的是,LightGen为生成式AI、科学计算提供了不依赖先进制程的替代方案,规避EUV光刻机限制。因为光芯片的核心结构是光波导、微环谐振器、调制器等,这些器件通常在几百纳米到几微米量级,因此无需 EUV,主流使用DUV光刻甚至电子束光刻即可制造。
这也意味着,我国可以建立不依赖传统半导体产业链的全新光计算生态,掌握核心技术自主权。为AI大模型、高性能计算等战略领域提供不受制于人的算力保障,最终实现算力自主可控。
总结
LightGen芯片的诞生,标志着我国光计算的重大突破,其非硅基、非电子依赖的特性,为解决当前AI算力的能耗瓶颈与硅基依赖问题提供了全新路径。这种突破不仅具有技术上的颠覆性,更对“双碳”目标下的绿色AI发展具有深远意义。业内评价认为,LightGen不仅是实验室突破,更展示了光计算在复杂生成任务中的实用化潜力,为我国在前沿人工智能领域的竞争提供了关键硬件基础。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。
举报投诉
-
光芯片
+关注
关注
3文章
111浏览量
11417
发布评论请先 登录
相关推荐
热点推荐
华为领衔,三剑客入局!十万卡智算集群落地,国产算力芯片强势崛起
中国移动宣布,将持续加大对人工智能领域的投入力度,总体投入翻一番,建成国内规模最大、技术领先的智算基础设施,探索十万卡智算集群建设,全国产智能算力
国产算力出海元年开启
国产算力开启“大航海”时代。 黄仁勋前段时间访华时曾表示:“华为AI芯片取代英伟达只是时间问题。”彼时,这话多被解读为对老对手的客套。但在刚刚结束的2025世界人工智能大会上,华为
力争百万 Tokens 推理成本降低百倍:云天励飞发布未来三年大算力芯片战略,首曝 DeepVerse 路线图
2月3日,云天励飞正式举办“大算力芯片战略前瞻会”,首次对外公布未来三年的大算力 AI 推理芯片
这家公司研发玻璃光计算芯片,算力超传统AI推理芯片千倍
电子发烧友网报道 近日,光本位科技宣布正在用玻璃代替硅作为衬底来研制玻璃光计算芯片。在光本位科技此次突破之前,世界主流光计算公司普遍选择以硅
北大团队最新研究:AI芯片算力提升数倍,能效提升超90倍
首次实现后摩尔新器件异质集成的多物理域融合傅里叶变换系统。 这一全新计算架构将傅里叶变换计算速度从当前每秒约1300亿次提升至每秒约5000亿次,算力提升近4倍,能效提升超90
国产AI芯片真能扛住“算力内卷”?海思昇腾的这波操作藏了多少细节?
最近行业都在说“算力是AI的命门”,但国产芯片真的能接住这波需求吗?
前阵子接触到海思昇腾910B,实测下来有点超出预期——7nm工艺下算
发表于 10-27 13:12
突破瓶颈!中国成功研制新型芯片 求解大规模MIMO信号检测时效能提升超百倍
我国新型芯片的研发正加速突破,日前;北京大学人工智能研究院传来好消息,突破瓶颈!中国成功研制新型芯片 ;在求解大规模MIMO信号检测时效能提升超
睿海光电领航AI光模块:超快交付与全场景兼容赋能智算时代——以创新实力助力全球客户构建高效算力底座
到全场景兼容,从800G量产突破到1.6T前瞻布局,睿海光电始终以客户需求为导向,以技术创新为引擎,为全球AI基础设施建设提供坚实底座。凭借智能制造实力与开放生态策略,睿海光电正携手合作伙伴,共同推动智能时代的算力革命!
睿海光
发表于 08-13 19:03
中国首条"算力光轨"通车!国内首个分布式光互连光交换超节点发布
电子发烧友网报道(文 / 吴子鹏)超节点技术(SuperPod)是一种通过高带宽、低时延互连技术,将大量 GPU芯片整合为统一超级计算单元的技术架构。它突破了传统单服务器架构限制,将算
发表于 08-01 08:59
•6703次阅读
成都汇阳投资关于太空算力打破传统地天观,重构天基智能版图
(响应速度提升百倍)、 解决传统模式下 90%数据浪费的痛点 。 其核心优势在于:1)突破地面算力"能耗-密度-扩展性"三重矛盾 ,轨道太阳能效率达地面 5
AIGC算力基础设施技术架构与行业实践
代提升1.5倍,内存容量达288GB,适配千亿参数模型训练需求。 国产突破:国内首款6nm高性能GPU芯片于2025年5月成功点亮,性能对标国际中端产品,已获亿元级订单;
国产光芯片大突破,算力超百倍,绕开EUV
评论