시퀀스
Kotlin 표준 라이브러리에는 컬렉션과 함께 또 다른 타입인 시퀀스 (Sequence<T>)가 포함되어 있습니다. 컬렉션과 달리 시퀀스는 요소를 포함하지 않고, 반복(iterating)하는 동안 요소를 생성합니다. 시퀀스는 Iterable과 동일한 함수를 제공하지만, 다단계 컬렉션 처리에 대해 다른 접근 방식을 구현합니다.
Iterable 처리가 여러 단계로 구성될 경우, 각 단계는 즉시(eagerly) 실행됩니다. 즉, 각 처리 단계가 완료되어 그 결과인 중간 컬렉션을 반환하고, 다음 단계가 이 컬렉션 위에서 실행됩니다. 반면, 시퀀스의 다단계 처리는 가능한 경우 지연(lazily) 실행됩니다. 실제 계산은 전체 처리 체인의 결과가 요청될 때만 발생합니다.
연산 실행 순서 또한 다릅니다. Sequence는 모든 처리 단계를 각 개별 요소에 대해 하나씩 수행합니다. 반면, Iterable은 전체 컬렉션에 대해 각 단계를 완료한 후 다음 단계로 진행합니다.
따라서 시퀀스를 사용하면 중간 단계의 결과물을 생성하지 않아도 되므로 전체 컬렉션 처리 체인의 성능을 향상시킬 수 있습니다. 하지만 시퀀스의 지연 특성으로 인해 약간의 오버헤드가 발생하며, 이는 작은 컬렉션을 처리하거나 간단한 계산을 수행할 때 유의미할 수 있습니다. 그러므로 Sequence와 Iterable을 모두 고려하여 자신의 사례에 더 적합한 것을 결정해야 합니다.
생성 (Construct)
요소로부터 생성
시퀀스를 생성하려면 sequenceOf() 함수를 호출하고 요소를 인자로 나열합니다.
val numbersSequence = sequenceOf("four", "three", "two", "one")Iterable로부터 생성
이미 Iterable 객체(List나 Set 등)가 있다면, asSequence()를 호출하여 시퀀스를 생성할 수 있습니다.
val numbers = listOf("one", "two", "three", "four")
val numbersSequence = numbers.asSequence()함수로부터 생성
시퀀스를 생성하는 또 다른 방법은 요소를 계산하는 함수를 사용하여 빌드하는 것입니다. 함수를 기반으로 시퀀스를 빌드하려면, 해당 함수를 인자로 하여 generateSequence()를 호출합니다. 선택적으로 첫 번째 요소를 명시적인 값이나 함수 호출의 결과로 지정할 수 있습니다. 제공된 함수가 null을 반환하면 시퀀스 생성이 중단됩니다. 따라서 아래 예제의 시퀀스는 무한합니다.
fun main() {
val oddNumbers = generateSequence(1) { it + 2 } // `it`은 이전 요소입니다.
println(oddNumbers.take(5).toList())
//println(oddNumbers.count()) // 에러: 시퀀스가 무한합니다.
}generateSequence()를 사용하여 유한한 시퀀스를 만들려면, 필요한 마지막 요소 다음에 null을 반환하는 함수를 제공하세요.
fun main() {
val oddNumbersLessThan10 = generateSequence(1) { if (it < 8) it + 2 else null }
println(oddNumbersLessThan10.count())
}청크로부터 생성
마지막으로, 요소를 하나씩 또는 임의의 크기의 청크(chunks)로 생성할 수 있게 해주는 sequence() 함수가 있습니다. 이 함수는 yield()와 yieldAll() 함수 호출을 포함하는 람다 표현식을 인자로 받습니다. 이 함수들은 시퀀스 소비자에게 요소를 반환하고, 소비자가 다음 요소를 요청할 때까지 sequence()의 실행을 중단(suspend)합니다. yield()는 단일 요소를 인자로 받고, yieldAll()은 Iterable 객체, Iterator, 또는 다른 Sequence를 인자로 받을 수 있습니다. yieldAll()의 Sequence 인자는 무한할 수 있습니다. 그러나 이러한 호출은 반드시 마지막이어야 합니다. 이후의 모든 호출은 실행되지 않습니다.
fun main() {
val oddNumbers = sequence {
yield(1)
yieldAll(listOf(3, 5))
yieldAll(generateSequence(7) { it + 2 })
}
println(oddNumbers.take(5).toList())
}시퀀스 연산
시퀀스 연산은 상태 요구 사항에 따라 다음과 같은 그룹으로 분류할 수 있습니다:
- 상태가 없는(Stateless) 연산은 상태를 요구하지 않으며 각 요소를 독립적으로 처리합니다. 예를 들어
map()또는filter()가 있습니다. 상태가 없는 연산은 요소를 처리하기 위해 매우 적은 양의 고정된 상태를 요구할 수도 있습니다. 예를 들어take()또는drop()이 있습니다. - 상태가 있는(Stateful) 연산은 상당한 양의 상태를 요구하며, 일반적으로 시퀀스의 요소 수에 비례합니다.
시퀀스 연산이 지연 생성되는 다른 시퀀스를 반환하는 경우, 이를 중간(intermediate) 연산이라고 합니다. 그렇지 않은 연산은 터미널(terminal) 연산입니다. 터미널 연산의 예로는 toList() 또는 sum()이 있습니다. 시퀀스 요소는 터미널 연산을 통해서만 얻을 수 있습니다.
시퀀스는 여러 번 반복될 수 있습니다. 그러나 일부 시퀀스 구현은 단 한 번만 반복되도록 제한될 수 있으며, 이는 해당 문서에 별도로 명시되어 있습니다.
시퀀스 처리 예시
예시를 통해 Iterable과 Sequence의 차이점을 살펴보겠습니다.
Iterable
단어 리스트가 있다고 가정해 보겠습니다. 아래 코드는 3글자보다 긴 단어를 필터링하고, 처음 4개의 해당 단어의 길이를 출력합니다.
fun main() {
val words = "The quick brown fox jumps over the lazy dog".split(" ")
val lengthsList = words.filter { println("filter: $it"); it.length > 3 }
.map { println("length: ${it.length}"); it.length }
.take(4)
println("Lengths of first 4 words longer than 3 chars:")
println(lengthsList)
}이 코드를 실행하면 filter()와 map() 함수가 코드에 나타난 순서대로 실행되는 것을 볼 수 있습니다. 먼저 모든 요소에 대해 filter:가 나타나고, 필터링 후 남은 요소들에 대해 length:가 나타난 다음, 마지막 두 줄의 출력이 나타납니다.
리스트 처리는 다음과 같이 진행됩니다:
Sequence
이제 시퀀스로 동일한 내용을 작성해 보겠습니다.
fun main() {
val words = "The quick brown fox jumps over the lazy dog".split(" ")
// List를 Sequence로 변환
val wordsSequence = words.asSequence()
val lengthsSequence = wordsSequence.filter { println("filter: $it"); it.length > 3 }
.map { println("length: ${it.length}"); it.length }
.take(4)
println("Lengths of first 4 words longer than 3 chars")
// 터미널 연산: 결과를 List로 얻기
println(lengthsSequence.toList())
}이 코드의 출력은 filter()와 map() 함수가 결과 리스트를 빌드할 때만 호출됨을 보여줍니다. 따라서 먼저 "Lengths of.." 텍스트 줄이 보이고 그 다음 시퀀스 처리가 시작됩니다. 필터링 후 남은 요소의 경우, 다음 요소를 필터링하기 전에 map이 먼저 실행되는 점에 주목하세요. 결과 크기가 4에 도달하면 take(4)가 반환할 수 있는 최대 크기이므로 처리가 중단됩니다.
시퀀스 처리는 다음과 같이 진행됩니다:
이 예시에서 요소의 지연 처리와 4개의 아이템을 찾은 후 중단하는 방식은 리스트 방식에 비해 연산 횟수를 줄여줍니다.
