reduce补充二

2021-06-13

java

人生要有意义只有发扬生命,快乐就是发扬生命的最好方法。——张闻天

关于reduce我已经写过博客

今天最后再来聊一聊它的第三个重载

image-20210613204159258

之前一直用得少,所以没有去探究它的妙用

最近稍微抽空看了下

发现还挺有意思的

例如它的第三个参数

并行流的场景下同样的代码竟有不同的效果

如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
public static void main(String[] args) {
sum();
parallelSum();
}

private static void sum() {
List<Integer> list = Stream.generate(() -> 1).limit(100).collect(Collectors.toList());
System.out.println(list);
int sum = list.stream().reduce(1, Integer::sum, (a, b) -> {
System.out.println("stream执行sum时上次结果:[" + a + "]本次值:[" + b + "]");
return Integer.sum(a, b);
});
System.out.println(sum);
}

private static void parallelSum() {
List<Integer> list = Stream.generate(() -> 1).limit(100).collect(Collectors.toList());
System.out.println(list);
int sum = list.parallelStream().reduce(1, Integer::sum, (a, b) -> {
System.out.println("parallelStream执行sum时上次结果:[" + a + "]本次值:[" + b + "]");
return Integer.sum(a, b);
});
System.out.println(sum);
}

仅仅是把stream换成了parallelStream,得到的结果就不一样了

image-20210613204830067

并且可以通过日志看出,上方第一个stream是没有执行我们第三个参数BinaryOperator<U> combiner

image-20210613205002228

而我们下面的parallelStream却执行了

image-20210613205029867

并且两者返回的值不一样

第一个返回101

是因为我们调用reduce

给了个默认值为1

再加上我们聚合计算得到的结果为100相加得到101

注意这里我们第三个参数BinaryOperator<U> combiner并没有执行,于是忽略

就像(((默认值1+第一个元素1)+第二个元素1)+第三个元素1)+...这样一直累加,得到结果101

1
2
3
4
5
graph LR
普通stream
100个1组成的list -->|第一次累加| 默认值1+第一个元素1
--> 2 -->|第二次累加| 上次得到的结果2+第二个元素1
--> 省略...

image-20210613210620991

第二个返回了164

是因为我们调用reduce

给了个默认值为1

而我们在并行流计算时,每次计算都会去重复计算一遍这个默认值

就像(默认值1+第一个元素1)+(默认值1+第二个元素1)+(默认值1+第三个元素1)...这样

但要注意,并行流的内部使用了默认的 ForkJoinPool分支/合并框架,它的默认线程数量就是你的处理器数量

我这里最大线程数为64,因此最多我们的默认值会被多加63次,得到结果164,要注意,可能我的最大线程数并没有这么多,一些线程可能会被重复使用,因此累加次数可能是大于最大线程数

它像一个BUG,一个坑,所以要多多注意,这里我们可以避免这个坑的话,初始值我们给0即可,因为0无论是加一次还是63次都不会影响我们最终的结果~

1
2
3
4
5
6
7
graph LR
并行流parallelStream
list[100个1组成的list] -->|第一次累加| A[默认值1+第一个元素1] --> C[2] --> final[前面的计算执行完毕后]
list --> 注意是同时执行
list -->|第二次累加| B[默认值1+第一个元素1] --> D[2] --> final
list -->|第...次累加| 默认值1+上次得到的结果+第...个元素1 --> E[x] --> final
final --> 将计算结果再次累加得到最后的结果

image-20210613211745300