Skip to content
Advanced

LLVM 백엔드 사용자 지정 팁

Kotlin/Native 컴파일러는 LLVM을 사용하여 다양한 타겟 플랫폼용 바이너리 실행 파일을 최적화하고 생성합니다. 컴파일 시간의 상당 부분이 LLVM에서 소비되며, 대규모 앱의 경우 이는 허용할 수 없을 정도로 오래 걸릴 수 있습니다.

Kotlin/Native가 LLVM을 사용하는 방식을 사용자 지정하고 최적화 패스 목록을 조정할 수 있습니다.

빌드 로그 검토하기

LLVM 최적화 패스에 얼마나 많은 컴파일 시간이 소비되는지 이해하기 위해 빌드 로그를 살펴봅시다:

  1. linkRelease* Gradle 작업을 -Pkotlin.internal.compiler.arguments.log.level=warning 옵션과 함께 실행하여 Gradle이 LLVM 프로파일링 세부 정보를 출력하도록 하세요. 예시:

    bash
    ./gradlew linkReleaseExecutableMacosArm64 -Pkotlin.internal.compiler.arguments.log.level=warning

    실행하는 동안, 해당 작업은 필요한 컴파일러 인자를 출력합니다. 예시:

    none
    > Task :linkReleaseExecutableMacosArm64
    Run in-process tool "konanc"
    Entry point method = org.jetbrains.kotlin.cli.utilities.MainKt.daemonMain
    Classpath = [
            /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/konan/lib/kotlin-native-compiler-embeddable.jar
            /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/konan/lib/trove4j.jar
    ]
    Arguments = [
            -Xinclude=...
            -library
            /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/klib/common/stdlib
            -no-endorsed-libs
            -nostdlib
            ...
    ]
  2. 제공된 인자에 더하여 -Xprofile-phases 인자와 함께 명령줄 컴파일러를 실행하세요. 예시:

    bash
    /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/bin/kotlinc-native \
    -Xinclude=... \
    -library /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/klib/common/stdlib \
    ... \
    -Xprofile-phases
  3. 빌드 로그에서 생성된 출력을 검토하세요. 로그는 수만 줄을 포함할 수 있으며, LLVM 프로파일링 섹션은 끝 부분에 있습니다.

다음은 간단한 Kotlin/Native 프로그램을 실행한 결과 중 발췌한 내용입니다:

none
Frontend: 275 msec
PsiToIr: 1186 msec
...
... 30k lines
...
LinkBitcodeDependencies: 476 msec
StackProtectorPhase: 0 msec
MandatoryBitcodeLLVMPostprocessingPhase: 2 msec
===-------------------------------------------------------------------------===
                          Pass execution timing report
===-------------------------------------------------------------------------===
  Total Execution Time: 6.7726 seconds (6.7192 wall clock)

   ---User Time---   --System Time--   --User+System--   ---Wall Time---  --- Name ---
   0.9778 ( 22.4%)   0.5043 ( 21.0%)   1.4821 ( 21.9%)   1.4628 ( 21.8%)  InstCombinePass
   0.3827 (  8.8%)   0.2497 ( 10.4%)   0.6323 (  9.3%)   0.6283 (  9.4%)  InlinerPass
   0.2815 (  6.4%)   0.1792 (  7.5%)   0.4608 (  6.8%)   0.4555 (  6.8%)  SimplifyCFGPass
...
   0.6444 (100.0%)   0.5474 (100.0%)   1.1917 (100.0%)   1.1870 (100.0%)  Total

ModuleBitcodeOptimization: 8118 msec
...
LTOBitcodeOptimization: 1399 msec
...

Kotlin/Native 컴파일러는 두 가지 별도의 LLVM 최적화 시퀀스(모듈 패스 및 링크 타임 패스)를 실행합니다. 일반적인 컴파일의 경우, 이 두 파이프라인은 연이어 실행되며, 유일한 실제 차이점은 실행하는 LLVM 최적화 패스입니다.

위 로그에서 두 LLVM 최적화는 ModuleBitcodeOptimizationLTOBitcodeOptimization입니다. 형식화된 테이블은 각 패스에 대한 타이밍이 포함된 최적화의 출력입니다.

LLVM 최적화 패스 사용자 지정하기

위 패스 중 하나가 비정상적으로 길게 느껴진다면 건너뛸 수 있습니다. 하지만 이는 런타임 성능에 악영향을 줄 수 있으므로, 그 후에 벤치마크 성능 변화를 확인해야 합니다.

현재로서는 주어진 패스를 직접 비활성화할 방법이 없습니다. 하지만 다음 컴파일러 옵션을 사용하여 실행할 새 패스 목록을 제공할 수 있습니다:

옵션릴리스 바이너리에 대한 기본값
-Xllvm-module-passes"default<O3>"
-Xllvm-lto-passes"internalize,globaldce,lto<O3>"

기본값은 실제 패스의 긴 목록으로 펼쳐지며, 여기서 원치 않는 패스를 제외해야 합니다.

실제 패스 목록을 얻으려면 LLVM 배포판과 함께 ~/.konan/dependencies/llvm-{VERSION}-{ARCH}-{OS}-dev-{BUILD}/bin 디렉토리에 자동으로 다운로드되는 opt 도구를 실행하세요.

예를 들어, 링크 타임 패스 목록을 얻으려면 다음을 실행하세요:

bash
opt -print-pipeline-passes -passes="internalize,globaldce,lto<O3>" < /dev/null

이는 경고와 LLVM 버전에 따라 달라지는 긴 패스 목록을 출력합니다.

opt 도구의 패스 목록과 Kotlin/Native 컴파일러가 실제로 실행하는 패스 사이에는 두 가지 차이점이 있습니다:

  • opt는 디버그 도구이므로, 일반적으로 실행되지 않는 하나 이상의 verify 패스를 포함합니다.
  • Kotlin 컴파일러가 이미 이를 직접 수행하기 때문에 Kotlin/Native는 devirt 패스를 비활성화합니다.

어떤 패스든 비활성화한 후에는, 런타임 성능 저하가 허용 가능한지 확인하기 위해 항상 성능 테스트를 다시 실행해야 합니다.