0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

剖析流体仿真为什么要选择GPU?

SSDFans 来源:在下子文 作者:在下子文 2021-03-30 17:44 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

由于仿真软件需要耗费大量计算资源,许多计算机辅助工程 (CAE) 应用都可以从 GPU 的并行处理能力中大受裨益。与 CPU 相比,GPU 的密度更高而总体拥有成本更低,因此具有明显的性价比优势,今天为大家分享基于CFD领域的GPU加速体验。

计算流体仿真力学,英文全称Computational Fluid Dynamics,缩写为CFD,它是数值数学和计算机科学结合的产物,通过空间离散和数值求解的思路,对流体力学的各类问题进行数值实验、模拟和分析研究,以解决学习、科研或者工程设计中的问题。

面对一个具体的工程问题,CFD工程师在应用CFD工具进行仿真分析时的基本流程,通常可以总结为五步:前处理、网格划分、边界条件加载、求解计算和后处理。但如何去平衡计算量(网格数量)和计算时间,对于很多CFD工程师都是个挑战。

在实际解决问题的过程中,CFD工程师除了希望能选择一款称手的软件工具外,当然也希望计算机的主频越高越好,核心越多越好。但是,核心与计算速度并非线性关系,不会因为核心等比例增长。若想在单台电脑上发挥极限运算能力,还需要使用GPU加速,因为GPU加速通过协调处理器并行运算,能够极大地提升计算能力,尤其适合多个项目同时进行,这样获得的时间收益较大。

1流体仿真为什么要选择GPU?

CFD始终向处理更高精确度、更复杂的几何结构方向发展。但现阶段,CFD软件应用于复杂流体问题方面还有待拓展,受到的阻碍主要源自以下三个方面:

● 隐式算法的高内存要求——一些CFD分析工程师总是希望得到完美的残差收敛曲线,以证明计算结果的可靠性,因此,他们会首选隐式算法,这意味着高内存的需求;

● CFD结果对网格的强依赖性——网格的合理设计和高质量生成是CFD计算的前提条件,是影响CFD计算结果的最主要的决定性因素之一,是CFD工作中人工工作量最大的部分,也是制约CFD工作效率的瓶颈问题之一。即使在CFD高度发达的国家,网格生成仍占整个CFD计算任务全部人力时间的70%~80%。

● 工程流体仿真问题复杂多变——在流体力学模拟中,由于流体力学模拟是个复杂的过程,存在极端变形、自由液面以及物质运动交界面等问题,在应用网格数值模拟时,会出现网格扭曲导致计算不收敛或者产生很大的计算误差,需要重新模拟,这使得计算成本大大增加。

为了使CFD仿真发挥最大效用,CFD工程师往往需要快速得到计算结果。而借助于GPU加速计算所提供的非凡应用程序性能,能将CFD程序计算密集部分的工作负载转移到GPU,同时仍有CPU运行其余程序代码,这样计算速度大大提升。另外,从计算性能来看,在CFD应用中单个GPU的性能远远优于CPU,基于GPU加速的CFD计算速度明显加快,很多复杂的CFD难题得以解决,因此,越来越多的CFD工程师选择GPU加速。

2流体仿真分析GPU评测

CFD是一个计算需求强烈的领域,GPU的选择将从根本上决定CFD分析过程的体验。在CFD分析中,工程师前期花费的时间主要在模型建立和修改上,后期真正的分析时间消耗在计算机上,因此,选择一款适合自身的CFD软件和高性能建模工作站就显得尤为重要。接下来分享来自e-works平台基于Altair CFD应用软件以及一些案例模型的实际评测,供大家参考:

基于Altair AcuSolve软件的 GPU加速

【软件环境介绍】Altair AcuSolve是一款基于GLS-FEM算法的通用热流体求解器,不但有快速良好的收敛速度,还能达到很高的求解精度,同时对网格有良好的兼容性,特别方便于复杂模型网格的划分,广泛应用于汽车、流体机械和海洋平台等工业和科学应用问题的解决。值得一提的是,最新版本的AcuSolve,不仅通过GPU加速提高了3~4倍的计算速度,同时也支持核态沸腾、热辐射、冷凝/蒸发多相流和流固耦合(FSI)等CFD难题的解决。

【硬件环境介绍】CPU采用单颗Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU选用Quadro RTX 8000,它采用了NVIDIA Turing架构和NVIDIA RTX平台支持,对于追求以高稳健性、高精度为目标的CFD仿真分析带来了卓越的计算性能体验。

【测试模型】在新能源汽车、医疗设备、军工设备等大功率密度的应用场合,设备运行时会产生大量的热损耗,为保证设备的安全运行,需要采用各种冷却措施来对设备进行冷却,水冷是其中一种方式。以新能源车的水冷板为例,其设计直接影电池的温度均匀性,进而影响车辆的续航里程和安全性。本测试模型拥有网格数量4300万,求解方程采用湍流+固体传热组合,湍流模型选择基于SA一方程的模型,设置稳态迭代步为200步,分别采用无GPU和1块GPU加速进行计算时间对比。

动力电池水冷板模型

计算时间对比

【测试结果】数据表明,无GPU加速时,水冷板分析的计算时间需要21小时;采用单块Quadro RTX 8000加速,水冷板分析的计算时间只需要4小时。由此可见,采用Altair AcuSolve进行水冷板仿真分析,并提供RTX GPU的增强支持,计算速度与无GPU加速相比提高了4.25倍。显然,这种方式对于CFD工程师快速探索水冷板的设计,并根据准确的计算结果做出决策非常有益。

基于Altair nanoFluidX软件的 GPU加速

【软件环境介绍】Altair nanoFluidX是一款基于粒子的流体动力学 (SPH) 仿真工具,用于预测运动轨迹复杂的几何结构周围的流体。以整车CFD仿真为例,传统CFD方法需要建立网格耗时巨大,但Altair nanoFluidX基于粒子的特性,无需建立网格,还可基于GPU显卡计算,非常有助于工程师获得简洁而高效的CFD解决方案。

【硬件环境介绍】CPU采用单颗Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU选用Quadro RTX 8000和Tesla V100,由于Altair nanoFluidX采用的粒子方法,其计算是由一系列的流体粒子的相互作用完成,在计算中每个粒子所执行的计算是完全相同的,而在不同的数据上执行相同的程序,恰恰是GPU计算最擅长的。

【测试模型】整车涉水分析是近年来新兴的CFD仿真领域,主要研究汽车以一定速度涉水时,关键零部件的进水风险,如防火墙渗水,传统的发动机进气口进水,电动汽车电气短路等问题。整车涉水模型往往需要消耗大量的计算资源和时间进行求解,以本次建立的整车涉水模型为例,拥有粒子数量为4100万,设置车速为50公里/小时、瞬态物理时间为4秒,建立单相流模型,本次测试分别采用1块RTX 8000 、2块RTX 8000、4块RTX 8000和4块Tesla V100加速,对比计算时间。

整车涉水模型

计算时间对比

【测试结果】数据表明,采用1块、2块、4块RTX 8000加速,整车涉水分析分别需要花费48小时、28小时、13小时;采用4块V100,则需要16个小时。从计算时间来看,采用4块RTX 8000加速,计算时间最少,与采用1块RTX 8000加速相比,计算速度提升了约2.7倍。计算结果也表明,采用基于GPU加速和Altair nanoFluidX的组合方式,允许CFD工程师在一个更可接受的短时间内研究类似整车涉水这样的复杂流体问题。

基于Altair ultraFluidX软件的 GPU加速

【软件环境介绍】Altair ultraFluidX专用于超快预测乘用车、轻型卡车、赛车和重型车辆的空气动力特性的仿真分析,它基于格子玻尔兹曼(LBM)技术,无需建立网格,这大大缩短了建模时间,使得设计变得更加容易,同时保留了所有重要的几何细节。

【硬件环境介绍】CPU采用单颗Intel(R) Xeon(R) Gold 6126 CPU @ 2.60GH;GPU选用NVIDIA RTX8000和NVIDIA Tesla V100,由于Altair ultraFluidX采用的LBM方法,非常适合大规模并行架构,而采用GPU加速,可以明显提高吞吐量,达到Altair ultraFluidX的周转时间,同时降低硬件和能源成本。

【测试模型】对于车辆的早期开发优化,采用CFD手段无疑是最有效且最经济的方法,但这类CFD分析往往是高内存和高计算资源消耗的典型代表,需要使用GPU来优化计算性能。以此次建立的汽车虚拟风洞模型为例,拥有格子数量1亿6千万,格子的最小尺寸为1.8mm,设置车速为140公里/小时、瞬态物理时间为2秒,分别采用2块NVIDIA RTX 8000、4块NVIDIA RTX 8000和4块V100加速,对比计算时间。

汽车虚拟风洞模型

计算时间对比

【测试结果】数据表明,采用2块、4块NVIDIA RTX8000加速,模拟汽车虚拟风洞分别需要花费14小时、8小时;采用4块V100,则需要8.4个小时。三种GPU加速中,采用4块NVIDIA RTX8000加速,计算时间最少,与采用2块NVIDIA RTX8000加速相比,计算速度提升了约0.75倍。计算结果也表明,基于GPU和Altair ultraFluidX的组合方式,可以明显加速汽车虚拟风洞分析,有效缩短汽车开发周期。

3总结

作为当前最重要的三大协处理加速技术之一,GPU已经成为数值分析的新宠,广泛应用于各个领域。以流体仿真领域为例,随着CFD分析对计算能力的要求日益增高,越来越多的CFD工程师倾向于采用GPU加速,例如借助 RTX 8000 GPU加速,能以远低于传统 CPU 解决方案的成本、空间和功耗,获得无与伦比的计算性能。

同时,在渲染方面,利用RTX 8000强大的运算能力,将流场和流体构件建立数学模型,并用数字化可视化的形式表现出来,可以获得任意位置的结果值,这无疑也极大地提高了设计的精确性。e-works认为,优秀的计算性能和尖端的数值方法的组合,在更短的时间内研究复杂的流体问题,将成为未来CFD领域高效而主流的方式。

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • cpu
    cpu
    +关注

    关注

    68

    文章

    11216

    浏览量

    222913
  • 显卡
    +关注

    关注

    16

    文章

    2517

    浏览量

    71058
  • CFD
    CFD
    +关注

    关注

    1

    文章

    165

    浏览量

    19446

原文标题:流体仿真为什么要选择GPU?

文章出处:【微信号:SSDFans,微信公众号:SSDFans】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    如何选择适合的智驾仿真工具进行场景生成和测试?

    在自动驾驶技术日益发展的背景下,选择合适的智驾仿真工具进行场景生成和测试显得尤为重要。该工具不仅需要支持高精度的场景重建,还需满足多种环境条件和传感器模型的兼容性。本文将深入探讨如何评估不同智驾仿真
    的头像 发表于 11-25 10:32 148次阅读
    如何<b class='flag-5'>选择</b>适合的智驾<b class='flag-5'>仿真</b>工具进行场景生成和测试?

    人工智能+工业软件:智能仿真加速赋能产业变革

    在智能制造领域,工业仿真为数字孪生与智慧工厂建设提供核心支撑;在绿色可持续发展领域,仿真技术助力优化能源配置与碳排放减排方案;在人工智能与虚拟现实领域,仿真则为算法训练、沉浸式体验搭建
    的头像 发表于 10-09 14:16 241次阅读

    如何看懂GPU架构?一分钟带你了解GPU参数指标

    分析GPU核心参数体系:算力、显存大小、显存带宽、热门架构特性等关键指标,旨在帮您理解不同应用场景下,如何选择最合适的GPU算力解决方案。1、算力GPU执行浮点运算
    的头像 发表于 10-09 09:28 576次阅读
    如何看懂<b class='flag-5'>GPU</b>架构?一分钟带你了解<b class='flag-5'>GPU</b>参数指标

    NVIDIA Isaac Lab多GPU多节点训练指南

    NVIDIA Isaac Lab 是一个适用于机器人学习的开源统一框架,基于 NVIDIA Isaac Sim 开发,其模块化高保真仿真适用于各种训练环境,可提供各种物理 AI 功能和由 GPU 驱动的物理仿真,缩小
    的头像 发表于 09-23 17:15 1969次阅读
    NVIDIA Isaac Lab多<b class='flag-5'>GPU</b>多节点训练指南

    从自然仿真到智能调度——GPU并行计算的多场景突破

    的体系结构,成为科学仿真与智能调度的核心计算平台。在自然现象模拟中,风沙流、流体力学等问题往往涉及海量粒子间的相互作用,计算负担极为沉重,而GPU的并行邻居搜索与空间
    的头像 发表于 09-03 10:32 577次阅读
    从自然<b class='flag-5'>仿真</b>到智能调度——<b class='flag-5'>GPU</b>并行计算的多场景突破

    aicube的n卡gpu索引该如何添加?

    请问有人知道aicube怎样才能读取n卡的gpu索引呢,我已经安装了cuda和cudnn,在全局的py里添加了torch,能够调用gpu,当还是只能看到默认的gpu0,显示不了gpu1
    发表于 07-25 08:18

    【VisionFive 2单板计算机试用体验】1、开箱初体验(刷系统+静态IP设置+GPU跑分测评)

    文件:注意:balenaEtcher这个软件表面上可以选择bz2文件,但是在软件内解压的话会卡在73%的进度。所以,bz2文件先解压,再用balenaEtcher烧录镜像到TF卡。 开机设置静态IP
    发表于 07-09 21:50

    康谋分享 | 物理级传感器仿真:破解自动驾驶长尾场景验证难题

    本文聚焦物理级仿真剖析摄像头光学建模、CMOS 光电转换、激光雷达高斯光束与衰减建模,解读 ASAM OpenMATERIAL 3D 标准,以构建可信仿真闭环,助力算法验证与高阶智驾落地。
    的头像 发表于 07-09 09:36 3798次阅读
    康谋分享 | 物理级传感器<b class='flag-5'>仿真</b>:破解自动驾驶长尾场景验证难题

    pspice一直显示元器件没有仿真模型怎么回事?

    有大佬知道pspice仿真为什么总是显示找不到仿真模型吗,就连自带库的元器件左上角也有个绿圈显示没有仿真模型仿真不了,我把相应元器件的仿真
    发表于 06-09 18:57

    LMFD格子多相流体力学仿真机:超级计算如何实现平民化?

    多相流体力学仿真一直是工业设计与优化的核心环节。然而,传统仿真依赖高性能超级计算机,不仅硬件投入高昂,且计算资源占用巨大,导致中小企业难以承受。为解决这一行业痛点,LMFD格子多相流体
    的头像 发表于 05-12 14:34 730次阅读
    LMFD格子多相<b class='flag-5'>流体</b>力学<b class='flag-5'>仿真</b>机:超级计算如何实现平民化?

    高性能GPU服务器推荐

    面对市场上种类繁多的GPU服务器,如何选择一款适合自身需求的设备呢?接下来,AI部落小编为您推荐。
    的头像 发表于 03-20 10:14 854次阅读

    OpenVINO™检测到GPU,但网络无法加载到GPU插件,为什么?

    OpenVINO™安装在旧的 Windows 10 版本 Windows® 10 (RS1) 上。 已安装 GPU 驱动程序版本 25.20.100.6373,检测到 GPU,但网络无法加载
    发表于 03-05 06:01

    选择数字孪生厂商考虑哪四点

    选择数字孪生厂商时,企业需要考虑多方面因素以确保选择到最适合自身需求的合作伙伴。以下是四个关键方面,企业在选择数字孪生厂商时应着重考虑: 一、厂商的行业经验与技术能力 行业经验:厂商在相同或相邻
    的头像 发表于 12-18 11:39 439次阅读

    《CST Studio Suite 2024 GPU加速计算指南》

    监控/利用率、选择可用GPU卡子集等内容。 6. 故障排除:针对NVIDIA驱动安装、多GPU设置、GPU模式、硬件识别、CUDA错误、TCC模式等问题给出了相应的解决方法。
    发表于 12-16 14:25