0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一探究竟Java 8的Stream API性能

汽车玩家 来源:今日头条 作者:Java的小本家 2020-05-04 14:20 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

Stream Performance

已经对 Stream API 的用法鼓吹够多了,用起简洁直观,但性能到底怎么样呢?会不会有很高的性能损失?

本节我们对 Stream API 的性能一探究竟。

为保证测试结果真实可信,我们将 JVM 运行在-server模式下,测试数据在 GB 量级,测试机器采用常见的商用服务器,配置如下:

一探究竟Java 8的Stream API性能

测试方法和测试数据

性能测试并不是容易的事,Java 性能测试更费劲,因为虚拟机对性能的影响很大,JVM 对性能的影响有两方面:

GC 的影响。GC 的行为是 Java 中很不好控制的一块,为增加确定性,我们手动指定使用 CMS 收集器,并使用 10GB 固定大小的堆内存。具体到 JVM 参数就是-XX:+UseConcMarkSweepGC-Xms10G-Xmx10G

JIT(Just-In-Time) 即时编译技术。即时编译技术会将热点代码在 JVM 运行的过程中编译成本地代码,测试时我们会先对程序预热,触发对测试函数的即时编译。相关的 JVM 参数是-XX:CompileThreshold=10000。

Stream 并行执行时用到ForkJoinPool.commonPool()得到的线程池,为控制并行度我们使用 Linux 的taskset命令指定 JVM 可用的核数。

测试数据由程序随机生成。为防止一次测试带来的抖动,测试 4 次求出平均时间作为运行时间。

实验一 基本类型迭代

测试内容:找出整型数组中的最小值。对比 for 循环外部迭代和 Stream API 内部迭代性能。

测试程序 IntTest,测试结果如下图:

一探究竟Java 8的Stream API性能

图中展示的是 for 循环外部迭代耗时为基准的时间比值。分析如下:

对于基本类型 Stream 串行迭代的性能开销明显高于外部迭代开销(两倍);

Stream 并行迭代的性能比串行迭代和外部迭代都好。

并行迭代性能跟可利用的核数有关,上图中的并行迭代使用了全部 12 个核,为考察使用核数对性能的影响,我们专门测试了不同核数下的 Stream 并行迭代效果:

一探究竟Java 8的Stream API性能


分析,对于基本类型:

使用 Stream 并行 API 在单核情况下性能很差,比 Stream 串行 API 的性能还差;

随着使用核数的增加,Stream 并行效果逐渐变好,比使用 for 循环外部迭代的性能还好。

以上两个测试说明,对于基本类型的简单迭代,Stream 串行迭代性能更差,但多核情况下 Stream 迭代时性能较好。

实验二 对象迭代

再来看对象的迭代效果。

测试内容:找出字符串列表中最小的元素(自然顺序),对比 for 循环外部迭代和 Stream API 内部迭代性能。

测试程序 StringTest,测试结果如下图:

一探究竟Java 8的Stream API性能


结果分析如下:

对于对象类型 Stream 串行迭代的性能开销仍然高于外部迭代开销(1.5 倍),但差距没有基本类型那么大。

Stream 并行迭代的性能比串行迭代和外部迭代都好。

再来单独考察 Stream 并行迭代效果:

一探究竟Java 8的Stream API性能

分析,对于对象类型:

使用 Stream 并行 API 在单核情况下性能比 for 循环外部迭代差;

随着使用核数的增加,Stream 并行效果逐渐变好,多核带来的效果明显。

以上两个测试说明,对于对象类型的简单迭代,Stream 串行迭代性能更差,但多核情况下 Stream 迭代时性能较好。

实验三 复杂对象归约

从实验一、二的结果来看,Stream 串行执行的效果都比外部迭代差(很多),是不是说明 Stream 真的不行了?先别下结论,我们再来考察一下更复杂的操作。

测试内容:给定订单列表,统计每个用户的总交易额。对比使用外部迭代手动实现和 Stream API 之间的性能。

我们将订单简化为构成的元组,并用Order对象来表示。测试程序 ReductionTest,测试结果如下图:

一探究竟Java 8的Stream API性能

分析,对于复杂的归约操作:

Stream API 的性能普遍好于外部手动迭代,并行 Stream 效果更佳;

再来考察并行度对并行效果的影响,测试结果如下:

一探究竟Java 8的Stream API性能

分析,对于复杂的归约操作:

使用 Stream 并行归约在单核情况下性能比串行归约以及手动归约都要差,简单说就是最差的;

随着使用核数的增加,Stream 并行效果逐渐变好,多核带来的效果明显。

以上两个实验说明,对于复杂的归约操作,Stream 串行归约效果好于手动归约,在多核情况下,并行归约效果更佳。我们有理由相信,对于其他复杂的操作,Stream API 也能表现出相似的性能表现。

结论

上述三个实验的结果可以总结如下:

对于简单操作,比如最简单的遍历,Stream 串行 API 性能明显差于显示迭代,但并行的 Stream API 能够发挥多核特性。

对于复杂操作,Stream 串行 API 性能可以和手动实现的效果匹敌,在并行执行时 Stream API 效果远超手动实现。

所以,如果出于性能考虑,

对于简单操作推荐使用外部迭代手动实现,

对于复杂操作,推荐使用 Stream API,

在多核情况下,推荐使用并行 Stream API 来发挥多核优势,

单核情况下不建议使用并行 Stream API。

如果出于代码简洁性考虑,使用 Stream API 能够写出更短的代码。即使是从性能方面说,尽可能的使用 Stream API 也另外一个优势,那就是只要 Java Stream 类库做了升级优化,代码不用做任何修改就能享受到升级带来的好处。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • JAVA
    +关注

    关注

    20

    文章

    3006

    浏览量

    116828
  • API
    API
    +关注

    关注

    2

    文章

    2474

    浏览量

    67004
收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    探究C8051F040/1/2/3/4/5/6/7 8K ISP FLASH MCU家族的强大性能与应用潜力

    探究C8051F040/1/2/3/4/5/6/7 8K ISP FLASH MCU家族的强大性能与应用潜力 在电子工程师的日常工作中,选择款合适的微控制器(MCU)至关重要。今天我
    的头像 发表于 04-15 10:55 158次阅读

    使用恩智浦MCU实现创新人形机器人灵巧手解决方案

    如此“丝滑”的人形机器人灵巧手,是如何实现的?本文带你一探究竟
    的头像 发表于 02-02 09:54 2031次阅读

    铁路乘务员手持检票智能终端PDA是什么?其五大核心功能全解析

    本文将深入解析火车/高铁乘务员手中的“工作神机”,全能型手持检票智能终端(PDA)。它如何在个手掌大小的设备中,完美融合身份证识别、护照读取、极速验票、智能巡检与实时通信五大核心功能?让我们一探究竟
    的头像 发表于 01-15 14:39 315次阅读
    铁路乘务员手持检票智能终端PDA是什么?其五大核心功能全解析

    文读懂VCSEL芯片为何与众不同

    VCSEL芯片是如何诞生的?是德科技带你走进慧芯激光产业园一探究竟
    的头像 发表于 01-09 14:19 835次阅读

    教你如何使用API

    、了解API API(Application Programming Interface)即应用程序编程接口,是种使不同的应用程序能共享数据和功能的软件工具。
    的头像 发表于 11-09 17:48 1493次阅读

    Arm Neoverse CPU上大代码量Java应用的性能测试

    Java 是互联网领域广泛使用的编程语言。Java 应用的些特性使其性能表现与提前编译的原生应用(例如 C 程序)大相径庭。由于 Java
    的头像 发表于 11-05 11:25 934次阅读
    Arm Neoverse CPU上大代码量<b class='flag-5'>Java</b>应用的<b class='flag-5'>性能</b>测试

    如何选择高效工业电源?基于ST VIPERGAN100的2.7 V/100W反激电源了解下!

    ,成为工业电源领域的佼佼者。那么,这款电源究竟有哪些亮点?它如何帮助设计人员实现高效能与快速上市?让我们一探究竟!场景应用图核心技术亮点1.准谐振(QR)反激控制器基于VIPERGA
    的头像 发表于 09-01 16:33 4647次阅读
    如何选择高效工业电源?基于ST VIPERGAN100的2.7 V/100W反激电源了解<b class='flag-5'>一</b>下!

    规格书标注的最大电压 ≠ 安全电压!警惕电阻的过载失效风险

    各位电子工程师同行,是否曾有这样的困惑:“明明按照规格书标注的最大工作电压使用电阻,为何它还是提前失效了?”这背后可能隐藏着个容易被忽视的关键因素,今天以我们自研产品为例一探究竟
    的头像 发表于 08-13 10:45 1242次阅读
    规格书标注的最大电压 ≠ 安全电压!警惕电阻的过载失效风险

    颗电阻100多块?国产替代能否打破天价神话?

    长期以来,高端精密电阻市场被海外品牌垄断,它们靠先发优势和技术积累主导市场,价格居高不下,给国内依赖此类电阻的企业带来成本压力,制约行业发展。 开步电子自主研发的 PCSR2512 精密检流电阻突破技术壁垒,打入国际市场,为国产精密电阻争得席之地。这款电阻究竟有何硬核实
    的头像 发表于 08-12 13:53 960次阅读
    <b class='flag-5'>一</b>颗电阻100多块?国产替代能否打破天价神话?

    多摩川高分辨率编码器:究竟如何赋能数控机床超精密运动控制?

    在现代制造业中,数控机床的应用极为广泛,其加工精度直接影响着产品的质量和性能。而多摩川高分辨率编码器的出现,为数控机床的超精密运动控制带来了新的突破。那么,它究竟是如何实现这赋能的呢?让我们
    的头像 发表于 08-04 17:59 1122次阅读

    深入解析电商支付API性能瓶颈与解决方案

      在电子商务蓬勃发展的今天,支付API作为交易流程的核心环节,其性能直接影响用户体验、转化率和业务收入。次缓慢的支付响应可能导致用户流失或交易失败,造成不可估量的损失。本文将从性能
    的头像 发表于 07-10 14:52 804次阅读
    深入解析电商支付<b class='flag-5'>API</b>的<b class='flag-5'>性能</b>瓶颈与解决方案

    淘宝电商 API 接口 VS 其他平台,优势究竟在哪?

    、亚马逊等)相比,淘宝电商 API 究竟有哪些独特优势?本文将逐步分析,帮助开发者、商家和决策者做出明智选择。 1. 淘宝电商 API 的核心功能概述 淘宝 API 提供了
    的头像 发表于 07-09 15:11 787次阅读
    淘宝电商 <b class='flag-5'>API</b> 接口 VS 其他平台,优势<b class='flag-5'>究竟</b>在哪?

    一探究竟差分晶振

    随着科技的发展,我们传输的数据变大,传输的距离变长,对频率稳定度的要求变高。近年来也受到越来越多的电子工程师更青睐差分晶振,它具备高性能、低功耗、低噪声的优点,使其成为很多设计适合的方案。并广泛应用
    的头像 发表于 07-07 14:42 1732次阅读
    <b class='flag-5'>一探究竟</b>差分晶振

    数字隔离器与传统隔离技术:谁是电路安全的新宠

    在电子设备里,不同电压的电路就像住在同栋楼却互不往来的邻居,为了让它们能安全 “交流”,就需要隔离技术来帮忙。如今,数字隔离器和传统隔离技术之间的竞争愈发激烈,到底谁更厉害?我们从下面几个方面来一探究竟
    的头像 发表于 06-27 17:08 734次阅读

    雷曼光电分析MiP器件显示技术的优势

    在显示技术不断迭代的浪潮中,MiP(Micro LED-in-Package)器件(无衬底芯片)显示技术(下文简称:MiP),正以其独特的优势和创新的架构,成为行业瞩目的焦点。这项技术究竟有何魔力,能在众多显示技术中脱颖而出,甚至有望改写行业规则?让我们一探究竟
    的头像 发表于 05-27 11:38 1933次阅读