0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“一亿”是“一千万”的十倍吗?显然不是

CAE学习之家 来源:恩宇科技 作者:CAE学习之家 2021-10-28 11:14 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

-----1亿是1千万的10倍?-----

早期笔者使用矩量法求解线性方程组,在不使用快速多级方法,自由度达到3万时,台式机上已经无法求解出,8G的机器内存不够用。对于满秩矩阵的线性方程组,常规求解方法时间复杂度为n^3(n的3次方)。

对于自由度1千万以下稀疏矩阵的求解,好的台式机基本能应付,而当自由度达到1亿的时候,简单的将硬件乘以10倍完全不能满足要求。因为计算的空间复杂度,时间复杂度并不是线性,通常是NlogN,N^2或者更高。当自由度达到1亿时,不仅需要对硬件核心部件CPU,内存扩容,而且在磁盘阵列,I/O,并发计算,GPU,网络,带宽等方面都提出了更苛刻的要求。

算法方面看,减少网格密度,在物理量梯度大的地方加密,无变化的地方将网格变稀疏,可以有效减少计算量;另外优化求解算法本身,使其更加易于并行化计算。

从目前来看,计算机硬件计算能力的更新速度,跟不上指数级求解规模的增加速度。这也是量子力学发展的最大推动力!

-----------------

针对该问题,本文稍微展开一下。

这里的1亿,主要指仿真中最终求解线性方程组的自由度个数,就是刚度矩阵的规模,即在方程Kx=b中,K的规模为1亿*1亿的方阵。

从硬件角度看,性能瓶颈首先在内存。目前台式机的内存普遍在64G以下。对于1千万的稀疏矩阵,存储勉强够用,加上计算,一般都不够用,在windows系统上如果内存不够用,会启用虚拟内存,也就是用页面交换把硬盘当内存使用,频繁读写磁盘,这时候性能会大大降低。而对于1亿自由度的矩阵,可能刚度矩阵组装都不够用。对于一亿自由度的矩阵,首先要保证内存能够存储,一般的方法是使用具有超大内存的工作站服务器。

内存问题解决后,再就是CPU性能。前面讲过,通常矩阵计算的空间复杂度,时间复杂度并不是线性,而是NlogN,N^2或者更高。使用单核单线程,耗费的时间是条曲线上升趋势。虽然稀疏矩阵采用了CSR等方法压缩数据,但自由度的平方数据仍然还是海量数据。现在的CPU普遍多核多个逻辑线程。这也要求在进行迭代法求解方程组时,合理的进行矩阵分解,参考一篇文章入门仿真软件性能优化,采用分治的方法适应硬件的需求。

这里需要注意的是单核CPU的性能以及CPU的数量。根据实际情况进行分治!

在满足了单机CPU运行之后,再就是集群分布式计算。采用多台计算设备,比如刀片等专业服务器,超算等等,这里需要考量的是负载均衡和网络带宽,即保证单台设备的利用率和整体进度保持一致。对于超大量的计算,最好能软件实现动态规划,对于频繁交换数据的计算,要注意网络带宽的瓶颈。

再从软件方面来看,根据笔者的研发经验,相当一部分仿真的性能问题可以通过软件以及改进算法解决。在前处理中,尽量避免软件中高频操作,大数据拷贝,大量细小数据操作等。如果必须有,对操作进行采样性能评估,保证在可接受范围内。在求解线性方程组前,提取矩阵特征,尽可能在最细度上根据矩阵特征,同时结合模型和业务的特点,选取最合适的求解方法。

其实目前对于数值计算方法而言,其算法都是公开透明的,商业软件之间真正较量的是业务模型的准确性,算法的稳定性以及效率。而这也恰恰是每个软件可以改进和提升的地方

2004年,ANSYS解出了1亿自由度的模型,2008年,ANSYS解出了10亿自由度的模型。即使现在来看,我们认为自由度超过1千万的模型是个大模型,所以1亿自由度的模型仍然可以认为是超大模型,且只能在超大的服务器上运行,可以想象,随着硬件的提升和算法的改进,实际应用中会有越来越多的超1亿自由度的模型求解。

回到开始的问题,“一亿”是“一千万”的十倍吗?显然不是。

最后还是以业内的一句话作为结束语:

“如果你的仿真还没有受到硬件的限制,那说明你的仿真还没有入门”。

编辑:fqj

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • CAE技术
    +关注

    关注

    0

    文章

    9

    浏览量

    7109
  • 数值计算
    +关注

    关注

    3

    文章

    5

    浏览量

    6969
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    百亿营收、单季利润暴增十倍!存储行业惊现“印钞机”?

    电子发烧友网报道(文/莫婷婷)2025年,全球半导体产业迎来强劲增长,其中存储赛道表现尤为亮眼。受益于人工智能(AI)算力需求爆发、服务器内存升级、端侧智能设备普及以及存储价格触底回升等多重因素,国产存储产业链企业普遍实现业绩大幅增长或显著减亏。   就在近期,佰维存储、澜起科技、德明利、恒烁股份等四家代表性企业陆续发布2025年年度业绩预告。电子发烧友网对其进行统计,可以看到佰维存储和德明利在2025年迎来了百亿营收,其
    的头像 发表于 01-25 04:26 1.5w次阅读
    百亿营收、单季利润暴增<b class='flag-5'>十倍</b>!存储行业惊现“印钞机”?

    博世智能座舱方案全球累计交付量突破1000万套

    近日,博世基于高通骁龙座舱平台打造的智能座舱方案,全球累计交付量正式突破1000万套。从2023年百万套交付,短短三年间实现十倍跨越式增长,这不仅是一个数字突破,更有力夯实了博世满足全球差异化市场的智能座舱开发与交付体系。
    的头像 发表于 04-16 14:55 291次阅读

    存储市场现罕见倒挂:DDR4价格涨幅十倍于DDR5涨价潮持续蔓延

    这一规律完全背离,上演了一幕令人瞠目的反常景象:DDR4内存的价格涨幅不仅远超市场预期,更大幅超越了技术更先进的DDR5。这种“前代产品价格涨幅碾压新一代”的现象,在存储行业数年的发展历程中尚属首次,引发了上下游产业链的广泛关
    的头像 发表于 02-04 15:23 504次阅读
    存储市场现罕见倒挂:DDR4价格涨幅<b class='flag-5'>十倍</b>于DDR5涨价潮持续蔓延

    内存条崩了?涨了十倍的内存颗粒卖给谁?内存芯片接下来怎么玩?

    内存条
    芯广场
    发布于 :2026年01月26日 17:48:21

    施耐德电气揭秘弘昇年实现业务规模十倍跨越的成长密码

    作为系统集成商的优秀代表,弘昇与施耐德电气已携手合作余年,从2014年签约额仅三百万人民币的初创企业,到2023年整体销售额突破亿元大关,实现业务规模十倍跨越,2024年更保持营业额翻倍的强劲
    的头像 发表于 01-24 16:51 2244次阅读

    汇川技术朱兴明亮相2026中国智能制造企业家生态峰会

    “创业很难,二次创业更难。”“低价竞争等于慢性自杀。”“活力比经验重要十倍。”在2026年1月16日的中国智能制造企业家生态峰会上,私董会联盟会长、汇川技术董事长兼总裁朱兴明抛出一系列硬核观点。
    的头像 发表于 01-21 11:54 887次阅读

    NVIDIA Grace Blackwell平台实现MoE模型性能十倍提升

    如今,几乎任一前沿模型的内部结构都采用混合专家 (MoE) 模型架构,这种架构旨在模拟人脑的高效运作机制。
    的头像 发表于 12-13 09:23 1051次阅读
    NVIDIA Grace Blackwell平台实现MoE模型性能<b class='flag-5'>十倍</b>提升

    AI算法开发,SpeedDP打辅助!不止10效率

    。而那些能够带来10工作效率的AI自然能够轻松取代人类。当然这也是相对的,不是每个领域都适用,厨师再快,也无法让实物快10熟;医生再优秀,也不可能让病人快10
    的头像 发表于 11-20 18:09 763次阅读
    AI算法开发,SpeedDP打辅助!不止10<b class='flag-5'>倍</b>效率

    壹连科技CCS产品全球累计出货量突破一亿

    近日,壹连科技自主研发生产的CCS电芯连接组件全球累计出货量正式突破100,000,000片!一亿片不仅仅是一个数字,它是市场与客户的信任见证,是壹连人用智慧和汗水铸就的里程碑,更是壹连科技赋能新能源产业的生动注脚。
    的头像 发表于 11-18 09:59 802次阅读

    为什么FPU在MCU中很重要呢?

    性能飞跃: 这是最主要的原因。与软件模拟相比,FPU 执行浮点运算的速度可以快几十倍甚至上百。 单周期操作: 许多基本的浮点运算(如加、乘)可以在一个或几个时钟周期内完成,而软件模拟可能需要数
    发表于 11-18 07:05

    三坐标高效测量压缩机涡旋盘精度解决方案

    Mizar Silver676三坐标测量机及CP500S连续扫描测头的完整测量方案,优势在于精准采集+智能分析的全链路适配。连续扫描测头实现匀速滑动采集,相比传统触发式测头,数据密度提升十倍以上
    发表于 11-13 14:06

    10G网速不是梦!5G-A如何“榨干”毫米波,跑出比5G快10的速度?

    6G网络的发展奠定了坚实基础。作为5G向6G过渡的关键技术,5G-A通过多载波聚合、毫米波扩展、时隙结构优化、1024QAM调制等创新技术,实现了网络能力的十倍质变,为未来智能生活和产业数字化升级提供了强大的网络支撑。 什么是5G-A?它在通信技术演进中的位置 5G-A,全称为
    的头像 发表于 09-16 16:34 2022次阅读

    步进电机和伺服电机的区别是什么?

    强的 价格方面不同 步进电机一个最大的优点就是便宜;伺服电机的价格普遍是步进电机的几十倍 总结:交流伺服系统在许多性能方面都优于步进电机但是控制也会更加复杂,如果我们对电机的需求是操作简单、价格便宜、可以开环控制、距离误差小在一些要求不高的场合可以选用步进电机。
    发表于 06-18 13:27

    地平线余凯称辅助驾驶的底层逻辑正在改写

    从大模型黑马DeepSeek,到春晚出圈的宇树机器人,人工智能撬动的科技创新引领又一轮产业革命。这印证了“生产力决定生产关系”的底层逻辑,当科技动能触发的“十倍生产力”涌现,行业格局必将引发重塑。
    的头像 发表于 06-03 13:59 848次阅读

    AD8429无法放大成理想的倍数,如何解决?

    增益公式为G=1+6KΩ/R1 ,R1设置为650Ω时,电压放大十倍还是比较理想的,但改为60.5时输出电压为15.546mV,放大了77.7不是理想的100,请问如何解决?请大
    发表于 04-24 07:45