시퀀스
컬렉션과 함께 Kotlin 표준 라이브러리에는 또 다른 유형인 시퀀스(Sequence<T>
)가 있습니다.
컬렉션과 달리 시퀀스는 요소를 포함하지 않으며, 반복하는 동안 요소를 생성합니다.
시퀀스는 Iterable
과 동일한 함수를 제공하지만
다단계 컬렉션 처리에 대한 다른 접근 방식을 구현합니다.
Iterable
처리에 여러 단계가 포함된 경우, 각 처리 단계가 완료되고
결과인 중간 컬렉션을 반환하는 방식으로 즉시 실행됩니다. 다음 단계는 이 컬렉션에서 실행됩니다. 반대로, 시퀀스의 다단계
처리는 가능한 경우 지연되어 실행됩니다. 실제 계산은 전체
처리 체인의 결과가 요청될 때만 발생합니다.
연산 실행 순서도 다릅니다. Sequence
는 모든 처리 단계를 각
단일 요소에 대해 하나씩 수행합니다. 반면 Iterable
은 전체 컬렉션에 대한 각 단계를 완료한 다음 다음 단계로 진행합니다.
따라서 시퀀스를 사용하면 중간 단계의 결과를 구축하지 않아도 되므로 전체
컬렉션 처리 체인의 성능을 향상시킬 수 있습니다. 그러나 시퀀스의 지연 특성으로 인해 약간의 오버헤드가 발생하며, 이는
더 작은 컬렉션을 처리하거나 더 간단한 계산을 수행할 때 중요할 수 있습니다. 따라서 Sequence
와 Iterable
을 모두 고려하고
어떤 것이 귀하의 경우에 더 나은지 결정해야 합니다.
생성
요소로부터
시퀀스를 생성하려면 요소를 인수로 나열하는 sequenceOf()
함수를 호출합니다.
val numbersSequence = sequenceOf("four", "three", "two", "one")
Iterable로부터
List
또는 Set
과 같은 Iterable
객체가 이미 있는 경우, asSequence()
를 호출하여 시퀀스를 생성할 수 있습니다.
val numbers = listOf("one", "two", "three", "four")
val numbersSequence = numbers.asSequence()
함수로부터
시퀀스를 생성하는 또 다른 방법은 요소를 계산하는 함수를 사용하여 빌드하는 것입니다.
함수를 기반으로 시퀀스를 빌드하려면, 이 함수를 인수로 사용하여 generateSequence()
를 호출합니다. 필요에 따라 첫 번째 요소를 명시적 값 또는 함수 호출의 결과로 지정할 수 있습니다.
제공된 함수가 null
을 반환하면 시퀀스 생성이 중지됩니다. 따라서 아래 예제의 시퀀스는 무한합니다.
fun main() {
val oddNumbers = generateSequence(1) { it + 2 } // `it`은 이전 요소
println(oddNumbers.take(5).toList())
//println(oddNumbers.count()) // error: the sequence is infinite
}
generateSequence()
를 사용하여 유한 시퀀스를 생성하려면 필요한 마지막 요소 다음에 null
을 반환하는 함수를 제공합니다.
fun main() {
val oddNumbersLessThan10 = generateSequence(1) { if (it < 8) it + 2 else null }
println(oddNumbersLessThan10.count())
}
덩어리(chunk)로부터
마지막으로, 시퀀스 요소를 하나씩 또는 임의 크기의 덩어리(chunk)로 생성할 수 있는 함수가 있습니다. 바로
sequence()
함수입니다.
이 함수는 yield()
및 yieldAll()
함수의 호출을 포함하는 람다 표현식을 취합니다.
이 함수들은 시퀀스 소비자에게 요소를 반환하고 소비자가 다음 요소를
요청할 때까지 sequence()
의 실행을 일시 중단합니다. yield()
는 단일 요소를 인수로 취합니다. yieldAll()
은 Iterable
객체,
Iterator
또는 다른 Sequence
를 취할 수 있습니다. yieldAll()
의 Sequence
인수는 무한할 수 있습니다. 그러나 이러한 호출은
마지막이어야 합니다. 후속 호출은 절대 실행되지 않습니다.
fun main() {
val oddNumbers = sequence {
yield(1)
yieldAll(listOf(3, 5))
yieldAll(generateSequence(7) { it + 2 })
}
println(oddNumbers.take(5).toList())
}
시퀀스 연산
시퀀스 연산은 상태 요구 사항과 관련하여 다음 그룹으로 분류할 수 있습니다.
- 상태 비저장(Stateless) 연산은 상태가 필요하지 않으며 각 요소를 독립적으로 처리합니다. 예를 들어,
map()
또는filter()
가 있습니다. 상태 비저장 연산은 요소를 처리하기 위해 작은 상수 양의 상태를 요구할 수도 있습니다. 예를 들어,take()
또는drop()
가 있습니다. - 상태 저장(Stateful) 연산은 상당한 양의 상태를 필요로 하며, 일반적으로 시퀀스의 요소 수에 비례합니다.
시퀀스 연산이 지연 생성되는 다른 시퀀스를 반환하는 경우, 이는 중간(intermediate) 연산이라고 합니다.
그렇지 않으면 연산은 종단(terminal) 연산입니다. 종단 연산의 예로는 toList()
또는 sum()
이 있습니다. 시퀀스 요소는 종단 연산으로만 검색할 수 있습니다.
시퀀스는 여러 번 반복될 수 있습니다. 그러나 일부 시퀀스 구현은 반복 횟수를 한 번으로 제한할 수 있습니다. 이는 해당 문서에 구체적으로 언급되어 있습니다.
시퀀스 처리 예제
예제를 통해 Iterable
과 Sequence
의 차이점을 살펴보겠습니다.
Iterable
단어 목록이 있다고 가정합니다. 아래 코드는 세 글자보다 긴 단어를 필터링하고 길이들을 처음 네 개의 그러한 단어의 길이들을 출력합니다.
fun main() {
val words = "The quick brown fox jumps over the lazy dog".split(" ")
val lengthsList = words.filter { println("filter: $it"); it.length > 3 }
.map { println("length: ${it.length}"); it.length }
.take(4)
println("Lengths of first 4 words longer than 3 chars:")
println(lengthsList)
}
이 코드를 실행하면 filter()
및 map()
함수가 코드에 나타나는 순서와 동일하게 실행되는 것을 볼 수 있습니다.
먼저 모든 요소에 대해 filter:
가 표시되고, 필터링 후에 남은 요소에 대해 length:
가 표시된 다음
마지막 두 줄의 출력이 표시됩니다.
이것이 목록 처리 방식입니다.
Sequence
이제 시퀀스로 동일하게 작성해 보겠습니다.
fun main() {
val words = "The quick brown fox jumps over the lazy dog".split(" ")
//List를 Sequence로 변환
val wordsSequence = words.asSequence()
val lengthsSequence = wordsSequence.filter { println("filter: $it"); it.length > 3 }
.map { println("length: ${it.length}"); it.length }
.take(4)
println("Lengths of first 4 words longer than 3 chars")
// 종단 연산: 결과를 List로 얻기
println(lengthsSequence.toList())
}
이 코드의 출력은 결과 목록을 작성할 때만 filter()
및 map()
함수가 호출된다는 것을 보여줍니다.
따라서 먼저 텍스트 줄 "Lengths of.."
가 표시된 다음 시퀀스 처리가 시작됩니다.
필터링 후에 남은 요소의 경우, 다음 요소를 필터링하기 전에 맵이 실행됩니다.
결과 크기가 4에 도달하면 take(4)
가 반환할 수 있는 최대 크기이므로 처리가 중지됩니다.
시퀀스 처리는 다음과 같이 진행됩니다.
이 예제에서 요소의 지연 처리 및 4개의 항목을 찾은 후 중지하면 목록 접근 방식을 사용하는 것보다 연산 수가 줄어듭니다.