通过本文,你可以更深入的学习 Java 语言中 forEach 语法的知识,以及它和 C 语言形式的 for 循环、 Steam API 的比照。
Java 程序员经常使用容器,比方 ArrayList 和 HashSet。Java 8 中的 lambda 语法和 steaming API 可以让我们更方便的使用容器。
大部分情况下,我们仅仅解决几千个元素,也不会去考虑性能问题。但是,在少量极端场景下,假如我们需要遍历上百万个元素,性能问题就凸显出来了。
本文将采用 JMH 计算每块代码的运行时间。
遍历是一个基本的功能。所有编程语言都提供了简单的语法,让程序员去遍历容器。Steam API 以一种非常直接的形式来遍历容器。
public List<Integer> streamSingleThread(BenchMarkState state){ List<Integer> result = new ArrayList<>(state.testData.size()); state.testData.stream().forEach(item -> { result.add(item); }); return result;}public List<Integer> streamMultiThread(BenchMarkState state){ List<Integer> result = new ArrayList<>(state.testData.size()); state.testData.stream().parallel().forEach(item -> { result.add(item); }); return result;}
forEach 循环也很简单:
public List<Integer> forEach(BenchMarkState state){ List<Integer> result = new ArrayList<>(state.testData.size()); for(Integer item : state.testData){ result.add(item); } return result;}
C 语言形式的 for 循环啰嗦少量,不过仍然很紧凑:
public List<Integer> forCStyle(BenchMarkState state){ int size = state.testData.size(); List<Integer> result = new ArrayList<>(size); for(int j = 0; j < size; j ++){ result.add(state.testData.get(j)); } return result;}
以下是性能报告:
Benchmark Mode Cnt Score Error UnitsTestLoopPerformance.forCStyle avgt 200 18.068 ± 0.074 ms/opTestLoopPerformance.forEach avgt 200 30.566 ± 0.165 ms/opTestLoopPerformance.streamMultiThread avgt 200 79.433 ± 0.747 ms/opTestLoopPerformance.streamSingleThread avgt 200 37.779 ± 0.485 ms/op
使用 C 语言形式的 for 循环,JVM 每次仅仅添加一个数字,而后直接从内存里读出数据。这使得它非常迅速。但是 forEach 就大不一样,根据 StackOverFlow 的这篇答复,和 Oracle 的文章,JVM 需要把 forEach 转换成一个 iterator,而后每个元素都调用一次 hasNext() 方法。这就是 forEach 比 C 语言的形式慢少量的起因。
我们先定义测试数据集:
@State(Scope.Benchmark)public static class BenchMarkState { @Setup(Level.Trial) public void doSetup() { for(int i = 0; i < 500000; i++){ testData.add(Integer.valueOf(i)); } } @TearDown(Level.Trial) public void doTearDown() { testData = new HashSet<>(500000); } public Set<Integer> testData = new HashSet<>(500000);}
Java 中的 Set 也支持 Steam API 和 forEach 循环。参考之前的测试,假如我们把 Set 转换成 ArrayList,而后遍历 ArrayList,或者许性能会好少量?
public List<Integer> forCStyle(BenchMarkState state){ int size = state.testData.size(); List<Integer> result = new ArrayList<>(size); Integer[] temp = (Integer[]) state.testData.toArray(new Integer[size]); for(int j = 0; j < size; j ++){ result.add(temp[j]); } return result;}
假如把 iterator 和 C 语言形式结合起来呢?
public List<Integer> forCStyleWithIteration(BenchMarkState state){ int size = state.testData.size(); List<Integer> result = new ArrayList<>(size); Iterator<Integer> iteration = state.testData.iterator(); for(int j = 0; j < size; j ++){ result.add(iteration.next()); } return result;}
或者者,简单的遍历怎样样?
public List<Integer> forEach(BenchMarkState state){ List<Integer> result = new ArrayList<>(state.testData.size()); for(Integer item : state.testData) { result.add(item); } return result;}
这个主意不错,不过它的效率也不高,由于初始化一个新的 ArrayList 同样需要消耗资源。
Benchmark Mode Cnt Score Error UnitsTestLoopPerformance.forCStyle avgt 200 6.013 ± 0.108 ms/opTestLoopPerformance.forCStyleWithIteration avgt 200 4.281 ± 0.049 ms/opTestLoopPerformance.forEach avgt 200 4.498 ± 0.026 ms/op
HashMap (使用 HashMap<E,Object> 的 HashSet) 不是为遍历所有元素设计的。遍历一个 HashMap 最快的方法是把 Iterator 和 C 语言形式结合起来,这样 JVM 就不会去调用 hasNext()。
Foreach 和 Steam API 用来解决集合是很方便的。你可以更快的写代码。不过,假如你的系统很稳固,性能是一个主要的考量,你应该考虑一下重写你的循环。
欢迎关注:java大牛爱好者
原文链接: [dzone] 翻译: [ImportNew.com ]
译文链接: [http://www.importnew.com/29465.html]