Advanced

自定义 LLVM 后端的技巧

Kotlin/Native 编译器使用 LLVM 来优化并为不同的目标平台生成二进制可执行文件。编译时间中很大一部分也花在了 LLVM 上，对于大型应用，这最终可能会消耗令人无法接受的长时间。

您可以自定义 Kotlin/Native 使用 LLVM 的方式，并调整优化 pass 列表。

查看构建日志

让我们查看构建日志，以了解 LLVM 优化 pass 在编译过程中占用了多少时间：

运行 linkRelease* Gradle 任务并带有 -Pkotlin.internal.compiler.arguments.log.level=warning 选项，使 Gradle 输出 LLVM 分析（profiling）详细信息，例如：

bash

./gradlew linkReleaseExecutableMacosArm64 -Pkotlin.internal.compiler.arguments.log.level=warning

在执行时，该任务会打印必要的编译器参数，例如：

none

> Task :linkReleaseExecutableMacosArm64
Run in-process tool "konanc"
Entry point method = org.jetbrains.kotlin.cli.utilities.MainKt.daemonMain
Classpath = [
        /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/konan/lib/kotlin-native-compiler-embeddable.jar
        /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/konan/lib/trove4j.jar
]
Arguments = [
        -Xinclude=...
        -library
        /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/klib/common/stdlib
        -no-endorsed-libs
        -nostdlib
        ...
]

使用提供的参数加上 -Xprofile-phases 参数运行命令行编译器，例如：

bash

/Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/bin/kotlinc-native \
-Xinclude=... \
-library /Users/user/.konan/kotlin-native-prebuilt-macos-aarch64-2.2.0/klib/common/stdlib \
... \
-Xprofile-phases

检查构建日志中生成的输出。日志可能包含数万行；带有 LLVM 分析的部分位于末尾。

以下是一个简单的 Kotlin/Native 程序运行后的摘录：

none

Frontend: 275 msec
PsiToIr: 1186 msec
...
... 30k lines
...
LinkBitcodeDependencies: 476 msec
StackProtectorPhase: 0 msec
MandatoryBitcodeLLVMPostprocessingPhase: 2 msec
===-------------------------------------------------------------------------===
                          Pass execution timing report
===-------------------------------------------------------------------------===
  Total Execution Time: 6.7726 seconds (6.7192 wall clock)

   ---User Time---   --System Time--   --User+System--   ---Wall Time---  --- Name ---
   0.9778 ( 22.4%)   0.5043 ( 21.0%)   1.4821 ( 21.9%)   1.4628 ( 21.8%)  InstCombinePass
   0.3827 (  8.8%)   0.2497 ( 10.4%)   0.6323 (  9.3%)   0.6283 (  9.4%)  InlinerPass
   0.2815 (  6.4%)   0.1792 (  7.5%)   0.4608 (  6.8%)   0.4555 (  6.8%)  SimplifyCFGPass
...
   0.6444 (100.0%)   0.5474 (100.0%)   1.1917 (100.0%)   1.1870 (100.0%)  Total

ModuleBitcodeOptimization: 8118 msec
...
LTOBitcodeOptimization: 1399 msec
...

Kotlin/Native 编译器运行两个独立的 LLVM 优化序列：模块 pass 和链接时 pass。对于典型的编译，这两个流水线是紧接着运行的，唯一的实际区别在于它们运行哪些 LLVM 优化 pass。

在上面的日志中，两个 LLVM 优化分别是 ModuleBitcodeOptimization 和 LTOBitcodeOptimization。格式化的表格是优化的输出，包含了每个 pass 的耗时。

自定义 LLVM 优化 pass

如果上述某个 pass 耗时过长得不合理，您可以将其跳过。但是，这可能会损害运行时性能，因此您应该在操作后检查基准测试性能的变化。

目前，没有直接的方法来禁用给定 pass。但是，您可以通过使用以下编译器选项来提供要运行的新 pass 列表：

选项	Release 二进制文件的默认值
`-Xllvm-module-passes`	`"default<O3>"`
`-Xllvm-lto-passes`	`"internalize,globaldce,lto<O3>"`

默认值会被展开为一长串实际的 pass，您需要从中排除不需要的 pass。

要获取实际的 pass 列表，请运行 opt 工具，该工具会随 LLVM 分发自动下载到 ~/.konan/dependencies/llvm-{VERSION}-{ARCH}-{OS}-dev-{BUILD}/bin 目录中。

例如，要获取链接时 pass 列表，请运行：

bash

opt -print-pipeline-passes -passes="internalize,globaldce,lto<O3>" < /dev/null

这将输出一条警告和一长串 pass，具体内容取决于 LLVM 版本。

opt 工具提供的 pass 列表与 Kotlin/Native 编译器实际运行的 pass 之间存在两点差异：

由于 opt 是一个调试工具，它包含一个或多个 verify pass，这些 pass 通常不会运行。
Kotlin/Native 禁用了 devirt pass，因为 Kotlin 编译器本身已经完成了这些操作。

在禁用任何 pass 后，请务必重新运行性能测试，以检查运行时性能的下降是否在可接受范围内。

构建器

特殊类与接口

属性

使用 Kotlin 和 Spring Boot 创建 Web 应用

Kotlin/JS

WebAssembly (Wasm)

内存管理器

最小化心智负担

Dokka

运行 Dokka

输出格式

Java 到 Kotlin 迁移指南

Swift/Objective-C 互操作

C 互操作

Kotlin Notebook 入门

使用数据源

数据可视化

集合

检索

操作与操作符

Kotlin 2.3.x

Kotlin 2.2.x

Kotlin 2.1.x

Kotlin 2.0.x

Kotlin 1.9.x

Kotlin 1.8.x

Kotlin 1.7.x

Kotlin 1.6.x

Kotlin 1.5.x

Kotlin 1.4.x

Kotlin 1.3.x

自定义 LLVM 后端的技巧

查看构建日志

自定义 LLVM 优化 pass

运行 Dokka

输出格式

检索

操作与操作符

自定义 LLVM 后端的技巧

查看构建日志 ​

自定义 LLVM 优化 pass ​

查看构建日志

自定义 LLVM 优化 pass