0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

谷歌开源张量网络库TensorNetwork,GPU处理提升100倍!

WpOh_rgznai100 来源:yxw 2019-06-06 13:56 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

世界上许多最严峻的科学挑战,如开发高温超导体和理解时空的本质,都涉及处理量子系统的复杂性。然而,这些系统中量子态的数量程指数级增长,使得暴力计算并不可行。为了解决该问题,数据结构采用了张量网络的方式。张量网络让人们关注与现实世界问题最相关的量子态,如低能态。张量网络已经越来越多地在机器学习中得到应用。

然而,目前仍存在相当多的一些挑战阻碍了其在机器学习社区中的广泛使用:1)用于加速硬件的生产级张量网络库还不能用于大规模运行张量网络算法;2)大多数张量网络文献是面向物理应用的,并产生了一种错误的印象,即需要量子力学方面的专业知识来理解算法。

为了解决这一问题,谷歌 X 实验室与加拿大Perimeter理论物理研究所(Perimeter Institute for Theoretical Physics )的研究人员合作开发了张量网络 TensorNetwork,以 TensorFlow 作为后端,针对 GPU 处理进行了优化。与在 CPU 上计算工作相比,可以实现高达 100 倍的加速。这是一个全新的开源库,旨在提高张量计算的效率。

据悉,研究人员已经发布了一些列论文对张量网络的概念、特性以及应用特例等方面进行了详细阐释。

工作原理

张量是一种多维数组,按照顺序进行分类。例如,一个普通数零阶张量,也称为标量,一个向量是一阶张量,一个矩阵是二阶张量。虽然低阶张量可以很容易地用数字数组或像 Tijnklm 这样的数学符号来表示,但一旦开始讨论高阶张量,这个符号就变得非常麻烦。

这一点上,使用图解记数法是非常有用的,在这种记数法中,人们只需画一个有许多条线或” 腿 “的圆(或其他形状)。在这个符号中,标量只是一个圆,向量只有一条腿,矩阵有两条腿等。张量的每条腿也有大小,也就是腿的长度。

张量的图解符号

以这种方式表示张量的好处是简洁地编码数学运算,例如,将一个矩阵乘以一个向量得到另一个向量,或者两个向量相乘得到标量。这个过程被称为张量收缩。

张量收缩的图解表示法

向量和矩阵乘法以及矩阵迹线(即矩阵对角元素的总和)。

除了这些案例之外,还有以张量收缩模式进行编码以形成一个新张量的图形方式。每个组成张量都有一个由自己的腿数决定的顺序。连接的腿在图中形成一条边,代表收缩,而剩余悬空腿的数量决定了合成张量的顺序。

左:四个矩阵乘积的表示,即 tr(ABCD),它是一个标量。右:三个三阶张量收缩,三条腿悬空,产生一个新的三阶张量。

虽然这些例子非常简单,但张量网络通常代表以各种方式收缩的数百个张量。用传统的符号来描述这样一件事情是非常模糊的,这也是 Roger Penrose 在 1971 年发明图解符号(diagrammatic notation)的原因。

实践过程

以一些黑白图像为例,每个图像可以被看做是 N 个像素值的列表。单个图像中的单个像素可以被独热编码( one-hot-encoding)成二维向量,并且通过这些像素编码组合在一起,我们可以得到 2N 个维独热编码的结果。我们可以将高维向量转化为 N 阶张量,然后将图像集合中所有张量相加,得到量 Ti1,i2,...,iN 的集合。

这听起来像是一件非常浪费时间的事情。因为以这种方式对约 50 像素的图像进行编码已经占用了数千兆字节的内存。这正是张量网络的作用所在。研究人员没有直接存储或操纵张量 T,而是将张量 T 作为张量网络内的多个小的张量组合。结果证明这非常有效。例如,流行的矩阵乘积态(matrix product state,MPS)网络可以将 T 表示为 N 个较小的张量,从而总参数量为 N 的线性级,而不是指数级。

高阶张量 T 用矩阵乘积态张量网络中的许多低阶张量来表示。

但在有效构建或操纵大型张量网络的同时又能始终避免使用大量内容的需求,是不太明显的。但事实证明,这在许多情况下是可能的,这也是张量网络广泛用于量子物理和机器学习领域的原因。Stoudenmire 和 Schwab 使用这种编码来构建图像分类模型,展示了张量网络的新用途。而 TensorNetwork 库旨在推进这类工作,研究人员在 TensorNetwork 相关论文中介绍了该库如何应用于张量网络的操作。

在物理场景中的应用性能

TensorNetwork 是一个针对张量网络算法的通用库,因此它适用于物理学场景。逼近量子态是张量网络在物理学中的一个典型用例,可说明张量网络库的能力。在另一篇论文《TensorNetwork on TensorFlow: A Spin Chain Application Using Tree Tensor Networks》中,研究人员提出了一种近似树张量网络(tree tensor network,TTN),并使用张量网络库实现了该算法。此外,研究人员还对比了 CPU 和 GPU 的情况,发现在使用 GPU 和张量网络库时,计算速度显著提高了近 100 倍。

计算时间作为连接维度的函数 X。连接维度( bond dimension )决定了张量网络中张量的大小。连接维度越大意味着张量网络约强大,但这个过程也需要更多的计算资源。

总结及未来工作

本文是讲述 TensorNetwork 实际应用案例的第一篇文章,后续的论文中,研究人员将使用 TensorNetwork 在 MNIST 和 Fashion-MNIST 上执行图像分类,后面还将包括时序分析、量子电路仿真等。研究人员希望 TensorNetwork 能成为物理学家和机器学习从业者的宝贵工具。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 处理器
    +关注

    关注

    68

    文章

    20377

    浏览量

    255600
  • 谷歌
    +关注

    关注

    27

    文章

    6271

    浏览量

    112179
  • gpu
    gpu
    +关注

    关注

    28

    文章

    5321

    浏览量

    136206

原文标题:谷歌开源张量网络库TensorNetwork,GPU处理提升100倍!

文章出处:【微信号:rgznai100,微信公众号:rgznai100】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    谷歌联手黑石砸250亿美元造AI云公司

    近日,谷歌母公司Alphabet与全球最大私募巨头黑石集团正式宣布:双方将联手成立一家全新的AI云计算公司。黑石掏出50亿美元真金白银作为初始股权资本,并持有多数股权;谷歌则拿出自家王牌——TPU张量
    的头像 发表于 05-21 11:18 458次阅读

    沐曦股份GPU产品正式接入华佗开源生态

    沐曦股份坚持“自主创新与开放兼容”双轨战略,以自研MXMACA软件栈为核心,构建硬件与应用的桥梁,并承载开源核心使命。该栈于2025年2月正式开源,致力于打造开放的GPU编程接口标准,大幅降低开发门槛,有效破解跨平台兼容难题,驱
    的头像 发表于 03-16 14:40 1783次阅读
    沐曦股份<b class='flag-5'>GPU</b>产品正式接入华佗<b class='flag-5'>开源</b>生态

    如何在 VisionFive v2 上使用外部 GPU

    如果旧的 amd gpu 在 VisionFive V2 上运行,我想使用带有开源 amd 驱动程序的 amd gpu。我需要什么以及如何将 GPU 连接到 VisionFive v2
    发表于 03-13 06:38

    瀚博半导体GPU云底座与一体机方案支持OpenClaw开源AI智能体框架

    瀚博半导体,以创新的GPU云底座与一体机方案,支持OpenClaw开源AI智能体框架,全天候运行AI智能体,在大幅提升数字生产力的同时保证数据安全与隐私安全,让智能体真正落地千行百业。
    的头像 发表于 03-11 13:39 784次阅读
    瀚博半导体<b class='flag-5'>GPU</b>云底座与一体机方案支持OpenClaw<b class='flag-5'>开源</b>AI智能体框架

    网络接口到 DMA,一套面向工程师的 FPGA 网络开发框架

    在高性能网络、数据中心和智能网卡加速领域,硬件与软件协同设计已成为提升网络处理效率的关键。Liberouter 提供的 Network Development Kit(NDK) 就是这
    的头像 发表于 02-12 11:28 611次阅读
    从<b class='flag-5'>网络</b>接口到 DMA,一套面向工程师的 FPGA <b class='flag-5'>网络</b>开发框架

    GPU 利用率<30%?这款开源智算云平台让算力不浪费 1%

    一套 AI 服务要折腾几天,环境配置、依赖处理耗尽心力;运维告警凌晨轰炸,集群故障诊断如同大海捞针,MTTR(平均修复时间)高得离谱…… AI 时代的算力浪费,早已成为制约企业 AI 落地的核心痛点。而秒如科技开源的 Lnjoying 人工智能云平台 —— 包含全球首个
    的头像 发表于 01-26 14:20 328次阅读

    谷歌评论卡,碰一碰即可完成谷歌评论 #谷歌评论卡 #NFC标签 #nfc卡

    谷歌
    深圳市融智兴科技有限公司
    发布于 :2026年01月15日 17:02:00

    炎核开源开放平台上架推出OpenSparseBlas高性能稀疏计算

    在科学计算与工程仿真领域,高效处理大规模稀疏矩阵运算是提升整体计算效能的关键。为此,我们在炎核开源开放平台上架推出 OpenSparseBlas——一个专为稀疏矩阵/向量计算而打造的高性能稀疏计算
    的头像 发表于 12-15 15:18 1081次阅读

    亚马逊发布新一代AI芯片Trainium3,性能提升4

    Trainium 4的开发计划。亚马逊表示,这款芯片能够比英伟达市场领先的图形处理单元(GPU)更便宜、更高效地驱动AI模型背后的密集计算。     作为亚马逊首款3纳米工艺AI芯片,Trainium3的核心突破在于性能、能效与扩展性的全面跃升。其计算性能较前代Train
    的头像 发表于 12-09 08:37 9018次阅读
    亚马逊发布新一代AI芯片Trainium3,性能<b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    如何通过交替式几何处理实现更优的多核 GPU 扩展

    在理论上,通过增加更多GPU核心来提升性能似乎很简单:核心越多,性能越强。但在实践中,这是图形架构领域最棘手的挑战之一。虽然某些工作负载因其独立特性能实现良好扩展,但另一些工作负载(尤其是几何处理
    的头像 发表于 12-01 10:12 835次阅读
    如何通过交替式几何<b class='flag-5'>处理</b>实现更优的多核 <b class='flag-5'>GPU</b> 扩展

    谷歌云发布最强自研TPU,性能比前代提升4

    电子发烧友网报道(文/李弯弯)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(张量处理器)“Ironwood”,该芯片预计在未来几周内正式上市。   “Ironwood”由谷歌
    的头像 发表于 11-13 07:49 9161次阅读
    <b class='flag-5'>谷歌</b>云发布最强自研TPU,性能比前代<b class='flag-5'>提升</b>4<b class='flag-5'>倍</b>

    NMSIS神经网络使用介绍

    NMSIS NN 软件是一组高效的神经网络内核,旨在最大限度地提高 Nuclei N 处理器内核上的神经网络的性能并最​​大限度地减少其内存占用。 该
    发表于 10-29 06:08

    今日看点:谷歌芯片实现量子计算比经典超算快13000;NFC 技术突破:读取距离从 5 毫米提升至 20 毫米

    谷歌芯片实现量子计算比经典超算快13000 近日,谷歌在《自然》杂志披露与Willow芯片相关的量子计算突破性研究成果。该公司称这是历史上首次证明量子计算机可以在硬件上成功运行一项可验证算法,其
    发表于 10-23 10:20 1863次阅读

    如何将训练好的神经网络模型部署到蜂鸟e203开发板上

    本帖欲分享如何将训练好的神经网络模型部署到蜂鸟e203开发板上。 1. 加载TFLite模型 std::unique_ptr interpreter(new tflite::Interpreter
    发表于 10-22 08:04

    【「AI芯片:科技探索与AGI愿景」阅读体验】+第二章 实现深度学习AI芯片的创新方法与架构

    基于注意力机制的神经网络结构。该模型将计算资源集中在对任务真正具有价值的关注焦点,使用于大规模并行处理任务,专为在GPU上进行处理而设计。 Transformer 模型的核心思想是自
    发表于 09-12 17:30