0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

剖析流体仿真为什么要选择GPU?

SSDFans 来源:在下子文 作者:在下子文 2021-03-30 17:44 次阅读

由于仿真软件需要耗费大量计算资源,许多计算机辅助工程 (CAE) 应用都可以从 GPU 的并行处理能力中大受裨益。与 CPU 相比,GPU 的密度更高而总体拥有成本更低,因此具有明显的性价比优势,今天为大家分享基于CFD领域的GPU加速体验。

计算流体仿真力学,英文全称Computational Fluid Dynamics,缩写为CFD,它是数值数学和计算机科学结合的产物,通过空间离散和数值求解的思路,对流体力学的各类问题进行数值实验、模拟和分析研究,以解决学习、科研或者工程设计中的问题。

面对一个具体的工程问题,CFD工程师在应用CFD工具进行仿真分析时的基本流程,通常可以总结为五步:前处理、网格划分、边界条件加载、求解计算和后处理。但如何去平衡计算量(网格数量)和计算时间,对于很多CFD工程师都是个挑战。

在实际解决问题的过程中,CFD工程师除了希望能选择一款称手的软件工具外,当然也希望计算机的主频越高越好,核心越多越好。但是,核心与计算速度并非线性关系,不会因为核心等比例增长。若想在单台电脑上发挥极限运算能力,还需要使用GPU加速,因为GPU加速通过协调处理器并行运算,能够极大地提升计算能力,尤其适合多个项目同时进行,这样获得的时间收益较大。

1流体仿真为什么要选择GPU?

CFD始终向处理更高精确度、更复杂的几何结构方向发展。但现阶段,CFD软件应用于复杂流体问题方面还有待拓展,受到的阻碍主要源自以下三个方面:

● 隐式算法的高内存要求——一些CFD分析工程师总是希望得到完美的残差收敛曲线,以证明计算结果的可靠性,因此,他们会首选隐式算法,这意味着高内存的需求;

● CFD结果对网格的强依赖性——网格的合理设计和高质量生成是CFD计算的前提条件,是影响CFD计算结果的最主要的决定性因素之一,是CFD工作中人工工作量最大的部分,也是制约CFD工作效率的瓶颈问题之一。即使在CFD高度发达的国家,网格生成仍占整个CFD计算任务全部人力时间的70%~80%。

● 工程流体仿真问题复杂多变——在流体力学模拟中,由于流体力学模拟是个复杂的过程,存在极端变形、自由液面以及物质运动交界面等问题,在应用网格数值模拟时,会出现网格扭曲导致计算不收敛或者产生很大的计算误差,需要重新模拟,这使得计算成本大大增加。

为了使CFD仿真发挥最大效用,CFD工程师往往需要快速得到计算结果。而借助于GPU加速计算所提供的非凡应用程序性能,能将CFD程序计算密集部分的工作负载转移到GPU,同时仍有CPU运行其余程序代码,这样计算速度大大提升。另外,从计算性能来看,在CFD应用中单个GPU的性能远远优于CPU,基于GPU加速的CFD计算速度明显加快,很多复杂的CFD难题得以解决,因此,越来越多的CFD工程师选择GPU加速。

2流体仿真分析GPU评测

CFD是一个计算需求强烈的领域,GPU的选择将从根本上决定CFD分析过程的体验。在CFD分析中,工程师前期花费的时间主要在模型建立和修改上,后期真正的分析时间消耗在计算机上,因此,选择一款适合自身的CFD软件和高性能建模工作站就显得尤为重要。接下来分享来自e-works平台基于Altair CFD应用软件以及一些案例模型的实际评测,供大家参考:

基于Altair AcuSolve软件的 GPU加速

【软件环境介绍】Altair AcuSolve是一款基于GLS-FEM算法的通用热流体求解器,不但有快速良好的收敛速度,还能达到很高的求解精度,同时对网格有良好的兼容性,特别方便于复杂模型网格的划分,广泛应用于汽车、流体机械和海洋平台等工业和科学应用问题的解决。值得一提的是,最新版本的AcuSolve,不仅通过GPU加速提高了3~4倍的计算速度,同时也支持核态沸腾、热辐射、冷凝/蒸发多相流和流固耦合(FSI)等CFD难题的解决。

硬件环境介绍】CPU采用单颗Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU选用Quadro RTX 8000,它采用了NVIDIA Turing架构和NVIDIA RTX平台支持,对于追求以高稳健性、高精度为目标的CFD仿真分析带来了卓越的计算性能体验。

【测试模型】在新能源汽车、医疗设备、军工设备等大功率密度的应用场合,设备运行时会产生大量的热损耗,为保证设备的安全运行,需要采用各种冷却措施来对设备进行冷却,水冷是其中一种方式。以新能源车的水冷板为例,其设计直接影电池的温度均匀性,进而影响车辆的续航里程和安全性。本测试模型拥有网格数量4300万,求解方程采用湍流+固体传热组合,湍流模型选择基于SA一方程的模型,设置稳态迭代步为200步,分别采用无GPU和1块GPU加速进行计算时间对比。

动力电池水冷板模型

计算时间对比

【测试结果】数据表明,无GPU加速时,水冷板分析的计算时间需要21小时;采用单块Quadro RTX 8000加速,水冷板分析的计算时间只需要4小时。由此可见,采用Altair AcuSolve进行水冷板仿真分析,并提供RTX GPU的增强支持,计算速度与无GPU加速相比提高了4.25倍。显然,这种方式对于CFD工程师快速探索水冷板的设计,并根据准确的计算结果做出决策非常有益。

基于Altair nanoFluidX软件的 GPU加速

【软件环境介绍】Altair nanoFluidX是一款基于粒子的流体动力学 (SPH) 仿真工具,用于预测运动轨迹复杂的几何结构周围的流体。以整车CFD仿真为例,传统CFD方法需要建立网格耗时巨大,但Altair nanoFluidX基于粒子的特性,无需建立网格,还可基于GPU显卡计算,非常有助于工程师获得简洁而高效的CFD解决方案。

【硬件环境介绍】CPU采用单颗Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU选用Quadro RTX 8000和Tesla V100,由于Altair nanoFluidX采用的粒子方法,其计算是由一系列的流体粒子的相互作用完成,在计算中每个粒子所执行的计算是完全相同的,而在不同的数据上执行相同的程序,恰恰是GPU计算最擅长的。

【测试模型】整车涉水分析是近年来新兴的CFD仿真领域,主要研究汽车以一定速度涉水时,关键零部件的进水风险,如防火墙渗水,传统的发动机进气口进水,电动汽车电气短路等问题。整车涉水模型往往需要消耗大量的计算资源和时间进行求解,以本次建立的整车涉水模型为例,拥有粒子数量为4100万,设置车速为50公里/小时、瞬态物理时间为4秒,建立单相流模型,本次测试分别采用1块RTX 8000 、2块RTX 8000、4块RTX 8000和4块Tesla V100加速,对比计算时间。

整车涉水模型

计算时间对比

【测试结果】数据表明,采用1块、2块、4块RTX 8000加速,整车涉水分析分别需要花费48小时、28小时、13小时;采用4块V100,则需要16个小时。从计算时间来看,采用4块RTX 8000加速,计算时间最少,与采用1块RTX 8000加速相比,计算速度提升了约2.7倍。计算结果也表明,采用基于GPU加速和Altair nanoFluidX的组合方式,允许CFD工程师在一个更可接受的短时间内研究类似整车涉水这样的复杂流体问题。

基于Altair ultraFluidX软件的 GPU加速

【软件环境介绍】Altair ultraFluidX专用于超快预测乘用车、轻型卡车、赛车和重型车辆的空气动力特性的仿真分析,它基于格子玻尔兹曼(LBM)技术,无需建立网格,这大大缩短了建模时间,使得设计变得更加容易,同时保留了所有重要的几何细节。

【硬件环境介绍】CPU采用单颗Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU选用NVIDIA RTX8000和NVIDIA Tesla V100,由于Altair ultraFluidX采用的LBM方法,非常适合大规模并行架构,而采用GPU加速,可以明显提高吞吐量,达到Altair ultraFluidX的周转时间,同时降低硬件和能源成本。

【测试模型】对于车辆的早期开发优化,采用CFD手段无疑是最有效且最经济的方法,但这类CFD分析往往是高内存和高计算资源消耗的典型代表,需要使用GPU来优化计算性能。以此次建立的汽车虚拟风洞模型为例,拥有格子数量1亿6千万,格子的最小尺寸为1.8mm,设置车速为140公里/小时、瞬态物理时间为2秒,分别采用2块NVIDIA RTX 8000、4块NVIDIA RTX 8000和4块V100加速,对比计算时间。

汽车虚拟风洞模型

计算时间对比

【测试结果】数据表明,采用2块、4块NVIDIA RTX8000加速,模拟汽车虚拟风洞分别需要花费14小时、8小时;采用4块V100,则需要8.4个小时。三种GPU加速中,采用4块NVIDIA RTX8000加速,计算时间最少,与采用2块NVIDIA RTX8000加速相比,计算速度提升了约0.75倍。计算结果也表明,基于GPU和Altair ultraFluidX的组合方式,可以明显加速汽车虚拟风洞分析,有效缩短汽车开发周期。

3总结

作为当前最重要的三大协处理加速技术之一,GPU已经成为数值分析的新宠,广泛应用于各个领域。以流体仿真领域为例,随着CFD分析对计算能力的要求日益增高,越来越多的CFD工程师倾向于采用GPU加速,例如借助 RTX 8000 GPU加速,能以远低于传统 CPU 解决方案的成本、空间和功耗,获得无与伦比的计算性能。

同时,在渲染方面,利用RTX 8000强大的运算能力,将流场和流体构件建立数学模型,并用数字化可视化的形式表现出来,可以获得任意位置的结果值,这无疑也极大地提高了设计的精确性。e-works认为,优秀的计算性能和尖端的数值方法的组合,在更短的时间内研究复杂的流体问题,将成为未来CFD领域高效而主流的方式。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    10455

    浏览量

    206589
  • 显卡
    +关注

    关注

    16

    文章

    2357

    浏览量

    65873
  • CFD
    CFD
    +关注

    关注

    1

    文章

    82

    浏览量

    18028

原文标题:流体仿真为什么要选择GPU?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    流体电子冷却浅析

    DARPA的故事:微流体电子冷却
    的头像 发表于 12-28 11:35 230次阅读
    微<b class='flag-5'>流体</b>电子冷却浅析

    基于液滴微流体的微流控芯片系统的研究

    ) 的芯片上,由微通道形成网络,由可控流体贯穿整个系统。目前的微流控芯片系统主要包括连续微流体系统和液滴微流体系统。
    的头像 发表于 11-21 16:30 350次阅读

    LTspice的瞬态仿真为什么先计算电路的静态工作点?

    LTspice的瞬态仿真为什么先计算电路的静态工作点?在找到电路的静态工作点之后,电路发生振荡的原因和仿真的运算有关吗?
    发表于 11-15 08:12

    基于面向对象的热流体系统建模方法及应用研究

    以多领域统一面向对象建模语言 Modelica 为例,详细分析了面向对象建模仿真的原理及技术特征,结合热流体系统本身的特点,探索了基于面向对象技术的热流体系统分解和层次递进构建方法,继而研究热
    发表于 10-11 15:29 0次下载

    基于PDMS的静态微流体混合器的制作与仿真

    电子发烧友网站提供《基于PDMS的静态微流体混合器的制作与仿真.pdf》资料免费下载
    发表于 10-09 14:21 0次下载
    基于PDMS的静态微<b class='flag-5'>流体</b>混合器的制作与<b class='flag-5'>仿真</b>

    在模块化设计过程中编写testbench并仿真的方法介绍

     在开始设计前,根据设计划分好各功能模块(为了叙述方便,这里以对“FPGA数字信号处理(十三)锁相环位同步技术的实现”中设计的系统仿真为例)。
    的头像 发表于 09-04 09:54 1217次阅读
    在模块化设计过程中编写testbench并<b class='flag-5'>仿真</b>的方法介绍

    加速流体仿真软件国产化替代进程,积鼎亮相第19届CAE年会

    8月18-20日,中国CAE工程分析技术年会盛大召开,高端流体仿真分论坛顺利举办。积鼎科技与产学研近600位专家现场互动,在收获“自主软件创新奖”和“卓越应用奖”的同时,也向各界专家展示了其在流体
    的头像 发表于 09-01 15:32 454次阅读
    加速<b class='flag-5'>流体</b><b class='flag-5'>仿真</b>软件国产化替代进程,积鼎亮相第19届CAE年会

    流体仿真软件VirtualFlow 提供完整的多相流模型框架

    通用流体仿真软件VirtualFlow 提供了比较完整的多相流模型的框架,针对界面流、混合流与离散相流体等流动问题的特点提供了相应的多相流动的模型。
    的头像 发表于 08-15 15:20 908次阅读
    <b class='flag-5'>流体</b><b class='flag-5'>仿真</b>软件VirtualFlow 提供完整的多相流模型框架

    光呈现的量子流体图像简析

    流体无摩擦流动的能力,即超流性,并不局限于流体动力学所描述的系统。十多年前,研究人员开始对超流体和其他量子流体产生兴趣,这是因为在非线性介质中传播的光可以表现出量子
    的头像 发表于 07-24 10:43 439次阅读
    光呈现的量子<b class='flag-5'>流体</b>图像简析

    一维热流体系统仿真软件Flownex建模和仿真高级技巧应用

    Flownex是一款符合ISO 9001:2008标准和核电设施质量保证要求(NQA1)的系统级热流体仿真软件,能快速、准确、高效地模拟复杂的热流动环境,并对复杂的热流系统进行设计和优化。
    的头像 发表于 06-18 16:44 5269次阅读
    一维热<b class='flag-5'>流体</b>系统<b class='flag-5'>仿真</b>软件Flownex建模和<b class='flag-5'>仿真</b>高级技巧应用

    PyTorch教程23.5之选择服务器和GPU

    电子发烧友网站提供《PyTorch教程23.5之选择服务器和GPU.pdf》资料免费下载
    发表于 06-06 09:17 0次下载
    PyTorch教程23.5之<b class='flag-5'>选择</b>服务器和<b class='flag-5'>GPU</b>

    GPU的预测瞬态仿真分析

    如今,图形处理单元 (GPU) 具有数百亿个晶体管。随着每一代新一代 GPU 的出现,GPU 中的晶体管数量不断增加,以提高处理器性能。然而,晶体管数量的增加也导致功率需求呈指数增长,这使得满足瞬态响应规范变得更加困难。
    的头像 发表于 05-30 09:02 430次阅读
    <b class='flag-5'>GPU</b>的预测瞬态<b class='flag-5'>仿真</b>分析

    电池集流体基本原理

    复合集流体技术是一种材料创新,它能够在发生内短路时起到保险丝的作用。复合集流体在安全、性能和成本上有较大优化,有望对传统集流体形成部分替代。     业内反馈,领跑电池企业可能已具备量产能力。而其
    的头像 发表于 05-29 10:41 3082次阅读
    电池集<b class='flag-5'>流体</b>基本原理

    如何检查imx6中的GPU使用情况?

    - - - 可用 GPU 空闲时间:45.942692 毫秒 在这里,随着我们使用更多 Qt6 应用程序,我得到的 Contiguous 值越来越大。这是确认 GPU 使用情况的正确方法吗? 请简要说明 GPU 使用情况
    发表于 05-22 07:04

    GPU的预测瞬态仿真分析

    如今,图形处理单元 (GPU) 具有数百亿个晶体管。随着每一代新一代 GPU 的出现,GPU 中的晶体管数量不断增加,以提高处理器性能。然而,晶体管数量的增加也导致功率需求呈指数增长,这使得满足瞬态响应规范变得更加困难。
    的头像 发表于 05-22 00:28 261次阅读
    <b class='flag-5'>GPU</b>的预测瞬态<b class='flag-5'>仿真</b>分析