Back-end/이것이 자바다[신용권 한빛미디어]

스트림 파이프라인

Ho's log 2022. 5. 28. 20:43

대량의 데이터를 가공해서 축소하는 것을 일반적으로 리덕션(Reduction) 이라고 하는데,

데이터의 합계, 평군값, 카운팅, 최대값, 최소값 등이 대표적인 리덕션의 결과물이라고 볼 수 있다.

그러나 컬렉션의 요소를 리덕션의 결과물로 바로 집계 할 수 없을 경우에는 집계하기 좋도록 필터링, 매핑, 정렬, 그룹핑 

등 중간 처리가 필요하다 

 

중간 처리와 최종 처리


스트림은 데이터의 필터링, 매핑, 정렬, 그룹핑 등 중간 처리와 합계,평균,카운팅,최대값, 최소값 등 최종 처리를 파이프라인(pipelines)으로 해결한다.

 

파이프라인은 여러 개의 스트림이 연결되어 있는 구조를 말한다.

파이프라인에서 최종처리를 제외하고는 모두 중간 처리 스트림 이다. 

 

중간 스트림이 생성될 때 요소들이 바로 중간 처리(필터링, 매핑, 정렬) 되는 것이 아니라
최종 처리가 시작되기 전까지 중간처리는 지연(lazy) 된다.

최종 처리가 시작되면 비로소 컬렉션의 요소가 하나씩 중간 스트림에서 처리되고 최종 처리까지 오게 된다. 

 

Stream 인터페이스에는 필터링, 매핑, 정렬 등의 많은 중간 처리 메소드가 있는데, 

이 메소드들은 중간 처리된 스트림을 리턴한다. 

그리고 이 스트림에서 다시 중간 처리 메소드를 호출해서 파이프라인을 형성하게 된다. 

 

ex) 회원 컬렉션에서 남자만 필터링, 남자의 나이 매핑, 최종 남자 평균 나이 집계 

 

Stream<Member> male

Stream<Member> maleFemaleStream = list.stream();
Stream<Member> maleStream = maleFemaleStream.filter(m->m.getSex() ==Member.MALE);
IntStream.ageStream = maleStream.mapToInt(Member::getAge);

OptionalDouble optionalDouble = ageStream.average();
double ageAvg = optionDouble.getAsDouble();

로컬 변수를 생략하고 연결하면 다음과 같은 형태의 파이프라인 코드만 남는다 

double ageAvg = list.stream().filter(m->m.getSex()==Member.MALE).mapToInt(Member::getAge).average().getAsDouble();

 

filter(m-> m.getSex() ==Member.MALE) 는 남자 Member 객체를 요소로 하는 새로운 스트림은 생성한다.

mapToInt(Member::getAge()) 는 Member 객체를 age 값으로 매핑해서 age 를 요소로 하는 새로운 스트림을 생성한다.

average() 메소드는 age 요소들의 평균을 OptionalDouble 에 저장한다.

OptionalDouble 에서 저장된 평균값을 읽으려면 getAsDouble() 메소드를 호출하면 된다.

 

package Stream;

import java.util.Arrays;
import java.util.List;

public class StreamPipLinesExample {
    public static void main(String[] args) {
        List<Member> list = Arrays.asList(new Member("홍길동", Member.MALE, 3340), new Member("test", Member.FEMALE, 320),
                new Member("ha", Member.MALE, 30));

        double ageAvg = list.stream().filter(m->m.getSex() == Member.MALE).mapToInt(Member::getAge).average().getAsDouble();

        System.out.println("man average age " + ageAvg);

}

}

 

중간 처리 메소드와 최종 처리 메소드


스트림 파이프라인에서 중간 처리를 하는 메소드와 최종 처리를 하는 메소드의 종류를 살펴보기로 하자

다음은 스트림이 제공하는 중간 처리와 최종 처리를 하는 메소드를 설명한 표이다. 

 

중간 처리 메소드와 최종 처리 메소드를 쉽게 구분하는 방법은 리턴 타입을 보면 된다.

리턴 타입이 스트림이라면 중간 처리 메소드이고, 기본 타입이거나 OptionalXXX 라면 최종 처리 메소드이다.

소속된 인터페이스에서 공통의 의미 Stream, IntStream, LongStream, DoubleStream 에서 모두 제공된다는 뜻이다.