0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“一亿”是“一千万”的十倍吗?显然不是

CAE学习之家 来源:恩宇科技 作者:CAE学习之家 2021-10-28 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

-----1亿是1千万的10倍?-----

早期笔者使用矩量法求解线性方程组,在不使用快速多级方法,自由度达到3万时,台式机上已经无法求解出,8G的机器内存不够用。对于满秩矩阵的线性方程组,常规求解方法时间复杂度为n^3(n的3次方)。

对于自由度1千万以下稀疏矩阵的求解,好的台式机基本能应付,而当自由度达到1亿的时候,简单的将硬件乘以10倍完全不能满足要求。因为计算的空间复杂度,时间复杂度并不是线性,通常是NlogN,N^2或者更高。当自由度达到1亿时,不仅需要对硬件核心部件CPU,内存扩容,而且在磁盘阵列,I/O,并发计算,GPU,网络,带宽等方面都提出了更苛刻的要求。

算法方面看,减少网格密度,在物理量梯度大的地方加密,无变化的地方将网格变稀疏,可以有效减少计算量;另外优化求解算法本身,使其更加易于并行化计算。

从目前来看,计算机硬件计算能力的更新速度,跟不上指数级求解规模的增加速度。这也是量子力学发展的最大推动力!

-----------------

针对该问题,本文稍微展开一下。

这里的1亿,主要指仿真中最终求解线性方程组的自由度个数,就是刚度矩阵的规模,即在方程Kx=b中,K的规模为1亿*1亿的方阵。

从硬件角度看,性能瓶颈首先在内存。目前台式机的内存普遍在64G以下。对于1千万的稀疏矩阵,存储勉强够用,加上计算,一般都不够用,在windows系统上如果内存不够用,会启用虚拟内存,也就是用页面交换把硬盘当内存使用,频繁读写磁盘,这时候性能会大大降低。而对于1亿自由度的矩阵,可能刚度矩阵组装都不够用。对于一亿自由度的矩阵,首先要保证内存能够存储,一般的方法是使用具有超大内存的工作站服务器。

内存问题解决后,再就是CPU性能。前面讲过,通常矩阵计算的空间复杂度,时间复杂度并不是线性,而是NlogN,N^2或者更高。使用单核单线程,耗费的时间是条曲线上升趋势。虽然稀疏矩阵采用了CSR等方法压缩数据,但自由度的平方数据仍然还是海量数据。现在的CPU普遍多核多个逻辑线程。这也要求在进行迭代法求解方程组时,合理的进行矩阵分解,参考一篇文章入门仿真软件性能优化,采用分治的方法适应硬件的需求。

这里需要注意的是单核CPU的性能以及CPU的数量。根据实际情况进行分治!

在满足了单机CPU运行之后,再就是集群分布式计算。采用多台计算设备,比如刀片等专业服务器,超算等等,这里需要考量的是负载均衡和网络带宽,即保证单台设备的利用率和整体进度保持一致。对于超大量的计算,最好能软件实现动态规划,对于频繁交换数据的计算,要注意网络带宽的瓶颈。

再从软件方面来看,根据笔者的研发经验,相当一部分仿真的性能问题可以通过软件以及改进算法解决。在前处理中,尽量避免软件中高频操作,大数据拷贝,大量细小数据操作等。如果必须有,对操作进行采样性能评估,保证在可接受范围内。在求解线性方程组前,提取矩阵特征,尽可能在最细度上根据矩阵特征,同时结合模型和业务的特点,选取最合适的求解方法。

其实目前对于数值计算方法而言,其算法都是公开透明的,商业软件之间真正较量的是业务模型的准确性,算法的稳定性以及效率。而这也恰恰是每个软件可以改进和提升的地方

2004年,ANSYS解出了1亿自由度的模型,2008年,ANSYS解出了10亿自由度的模型。即使现在来看,我们认为自由度超过1千万的模型是个大模型,所以1亿自由度的模型仍然可以认为是超大模型,且只能在超大的服务器上运行,可以想象,随着硬件的提升和算法的改进,实际应用中会有越来越多的超1亿自由度的模型求解。

回到开始的问题,“一亿”是“一千万”的十倍吗?显然不是。

最后还是以业内的一句话作为结束语:

“如果你的仿真还没有受到硬件的限制,那说明你的仿真还没有入门”。

编辑:fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • CAE技术
    +关注

    关注

    0

    文章

    9

    浏览量

    7092
  • 数值计算
    +关注

    关注

    3

    文章

    5

    浏览量

    6953
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人形机器人市场即将迎来大爆发,马斯克预测明年产量翻10

    电子发烧友网报道(文/黄山明)近期,在CES展会上,特斯拉创始人马斯克公开表示,计划将在2025年制造数千台Optimus,如果顺利的话,2026年这一目标产量将增加十倍,生产5万到10万台人形
    的头像 发表于 01-11 00:05 6990次阅读
    人形机器人市场即将迎来大爆发,马斯克预测明年产量翻10<b class='flag-5'>倍</b>

    壹连科技CCS产品全球累计出货量突破一亿

    近日,壹连科技自主研发生产的CCS电芯连接组件全球累计出货量正式突破100,000,000片!一亿片不仅仅是一个数字,它是市场与客户的信任见证,是壹连人用智慧和汗水铸就的里程碑,更是壹连科技赋能新能源产业的生动注脚。
    的头像 发表于 11-18 09:59 373次阅读

    为什么FPU在MCU中很重要呢?

    性能飞跃: 这是最主要的原因。与软件模拟相比,FPU 执行浮点运算的速度可以快几十倍甚至上百。 单周期操作: 许多基本的浮点运算(如加、乘)可以在一个或几个时钟周期内完成,而软件模拟可能需要数
    发表于 11-18 07:05

    三坐标高效测量压缩机涡旋盘精度解决方案

    Mizar Silver676三坐标测量机及CP500S连续扫描测头的完整测量方案,优势在于精准采集+智能分析的全链路适配。连续扫描测头实现匀速滑动采集,相比传统触发式测头,数据密度提升十倍以上
    发表于 11-13 14:06

    10G网速不是梦!5G-A如何“榨干”毫米波,跑出比5G快10的速度?

    6G网络的发展奠定了坚实基础。作为5G向6G过渡的关键技术,5G-A通过多载波聚合、毫米波扩展、时隙结构优化、1024QAM调制等创新技术,实现了网络能力的十倍质变,为未来智能生活和产业数字化升级提供了强大的网络支撑。 什么是5G-A?它在通信技术演进中的位置 5G-A,全称为
    的头像 发表于 09-16 16:34 994次阅读

    地平线余凯称辅助驾驶的底层逻辑正在改写

    从大模型黑马DeepSeek,到春晚出圈的宇树机器人,人工智能撬动的科技创新引领又一轮产业革命。这印证了“生产力决定生产关系”的底层逻辑,当科技动能触发的“十倍生产力”涌现,行业格局必将引发重塑。
    的头像 发表于 06-03 13:59 682次阅读

    AD8429无法放大成理想的倍数,如何解决?

    增益公式为G=1+6KΩ/R1 ,R1设置为650Ω时,电压放大十倍还是比较理想的,但改为60.5时输出电压为15.546mV,放大了77.7不是理想的100,请问如何解决?请大
    发表于 04-24 07:45

    MAX1978为什么测试误差放大五十倍的DIFOUT点会在直流偏置的基础上叠加一个交流信号?

    你好,ADI,最近我们在使用MAX1978这款芯片的时候遇到一些问题如下: 测试环境为: +5V供电,开关频率选择1M,采用内部参考源1.5V,进行TEC控温实验, 问题为:为什么测试误差放大五十倍的DIFOUT 点会在直流偏置的基础上叠加一个交流信号,这个是由于我PID控制没有控稳造成的吗?
    发表于 04-18 06:57

    一文详解Ceph分布式存储

    传统的IDE的IO值是100次/秒,SATA固态磁盘500次/秒,固态硬盘达到2000-4000次/秒。即使磁盘的IO能力再大数十倍,也不够抗住网站访问高峰期数十万、数百万甚至上亿用户的同时访问,这同时还要受到主机网络IO能力的限制。
    的头像 发表于 04-03 14:13 1662次阅读
    一文详解Ceph分布式存储

    AI天气预报系统速度提升数十倍

    行业资讯
    电子发烧友网官方
    发布于 :2025年03月25日 11:59:33

    OpenAI重磅推出升级版AI模型o1-pro 价格翻十倍

    行业芯事行业资讯
    电子发烧友网官方
    发布于 :2025年03月21日 13:35:26

    百度李彦宏称自动驾驶比人类司机安全十倍

    在近日于阿联酋迪拜开幕的“世界政府峰会”上,百度创始人李彦宏发表了关于自动驾驶技术的看法。他表示,随着技术的飞速进步,自动驾驶的安全性已经远超人类司机,其安全性可以达到人类司机的十倍
    的头像 发表于 02-13 16:10 621次阅读

    李彦宏:自动驾驶比人开车安全十倍

    近日,“世界政府峰会”在阿联酋迪拜隆重开幕。百度创始人李彦宏在主论坛上与阿联酋AI部长奥马尔·苏丹·奥拉马进行了深入对谈。在这次对谈中,李彦宏特别强调了自动驾驶技术对于降低交通事故死亡率的重要作用。 李彦宏指出,百度旗下的自动驾驶出租车服务萝卜快跑已经取得了显著成果。从萝卜快跑的实际记录来看,其自动驾驶车辆的出险率仅为人类驾驶员的1/14,这一数据充分证明了自动驾驶技术在提升道路安全性方面的巨大潜力。 据百度方
    的头像 发表于 02-12 09:08 1111次阅读

    信号差值经INA143放大10送入ADS8505后,INA143的输入偏执电压对ADC的采集结果有没有影响?

    十倍后,万用表测是10V,没什么问题; b、Vin+=5V,Vin-=4V,ref脚输入1V,放大十倍后,万用表测是11V; c、Vin+=5V,Vin-=4.5V,ref脚输入2V,放大10
    发表于 12-26 07:31

    精科技”获近千万元天使轮融资

    近日,“精科技”成功完成了近千万元的天使轮融资,本轮融资由麒麟创投及其基金联合投资,德太资本则担任公司的长期财务顾问。 这笔资金将主要用于公司的日常运营、产品研发和生产制造以及市场开拓等方面。随着
    的头像 发表于 12-18 10:48 797次阅读