Skip to content

문자열

Kotlin에서 문자열은 String 타입으로 표현됩니다.

JVM에서 UTF-16 인코딩의 String 타입 객체는 문자당 약 2바이트를 사용합니다.

일반적으로 문자열 값은 이중 따옴표(") 안의 문자 시퀀스입니다:

kotlin
val str = "abcd 123"

문자열의 요소는 인덱싱 연산(s[i])을 통해 접근할 수 있는 문자입니다. for 루프를 사용하여 이 문자들을 순회할 수 있습니다:

kotlin
fun main() {
    val str = "abcd" 
    for (c in str) {
        println(c)
    }
}

문자열은 불변(immutable)입니다. 한 번 초기화된 문자열은 값을 변경하거나 새로운 값을 할당할 수 없습니다. 문자열을 변환하는 모든 연산은 새 String 객체에 결과를 반환하며, 원본 문자열은 변경되지 않습니다:

kotlin
fun main() {
    val str = "abcd"
   
    // 새로운 String 객체를 생성하고 출력합니다.
    println(str.uppercase())
    // ABCD
   
    // 원본 문자열은 동일하게 유지됩니다.
    println(str) 
    // abcd
}

문자열을 연결하려면 + 연산자를 사용합니다. 이는 표현식의 첫 번째 요소가 문자열인 경우 다른 타입의 값과 문자열을 연결하는 데에도 작동합니다:

kotlin
fun main() {
    val s = "abc" + 1
    println(s + "def")
    // abc1def    
}

대부분의 경우 문자열 템플릿 또는 여러 줄 문자열을 사용하는 것이 문자열 연결보다 선호됩니다.

문자열 리터럴

Kotlin에는 두 가지 타입의 문자열 리터럴이 있습니다:

이스케이프 문자열

_이스케이프 문자열_은 이스케이프 문자를 포함할 수 있습니다. 다음은 이스케이프 문자열의 예시입니다:

kotlin
val s = "Hello, world!
"

이스케이프 처리는 역슬래시(\)를 사용하여 일반적인 방식으로 수행됩니다. 지원되는 이스케이프 시퀀스 목록은 Characters 페이지를 참조하세요.

여러 줄 문자열

_여러 줄 문자열_은 개행과 임의의 텍스트를 포함할 수 있습니다. 삼중 따옴표(""")로 구분되며, 이스케이프 처리가 없고 개행 및 다른 모든 문자를 포함할 수 있습니다:

kotlin
val text = """
    for (c in "foo")
        print(c)
    """

여러 줄 문자열에서 선행 공백을 제거하려면 trimMargin() 함수를 사용하세요:

kotlin
val text = """
    |Tell me and I forget.
    |Teach me and I remember.
    |Involve me and I learn.
    |(Benjamin Franklin)
    """.trimMargin()

기본적으로 파이프 기호 |가 마진 접두사로 사용되지만, 다른 문자를 선택하고 trimMargin(">")처럼 매개변수로 전달할 수 있습니다.

문자열 템플릿

문자열 리터럴은 _템플릿 표현식_을 포함할 수 있습니다. 템플릿 표현식은 평가되어 결과가 문자열로 연결되는 코드 조각입니다. 템플릿 표현식이 처리될 때, Kotlin은 표현식의 결과를 문자열로 변환하기 위해 자동으로 .toString() 함수를 호출합니다. 템플릿 표현식은 달러 기호($)로 시작하며 변수 이름으로 구성되거나:

kotlin
fun main() {
    val i = 10
    println("i = $i") 
    // i = 10
    
    val letters = listOf("a","b","c","d","e")
    println("Letters: $letters") 
    // Letters: [a, b, c, d, e]

}

중괄호 안의 표현식으로 구성됩니다:

kotlin
fun main() {
    val s = "abc"
    println("$s.length is ${s.length}") 
    // abc.length is 3
}

템플릿은 여러 줄 문자열과 이스케이프 문자열 모두에서 사용할 수 있습니다. 그러나 여러 줄 문자열은 역슬래시 이스케이프를 지원하지 않습니다. 여러 줄 문자열에서 식별자 시작 부분에 허용되는 기호 앞에 달러 기호 $를 삽입하려면 다음 구문을 사용하세요:

kotlin
val price = """
${'$'}9.99
"""

문자열에서 ${'$'} 시퀀스를 피하려면 실험적인 다중 달러 문자열 보간 기능을 사용할 수 있습니다.

다중 달러 문자열 보간

다중 달러 문자열 보간(Multi-dollar string interpolation)을 사용하면 보간을 트리거하는 데 필요한 연속적인 달러 기호의 수를 지정할 수 있습니다. 보간은 변수 또는 표현식을 문자열에 직접 삽입하는 프로세스입니다.

단일 행 문자열의 경우 리터럴을 이스케이프할 수 있지만, Kotlin의 여러 줄 문자열은 역슬래시 이스케이프를 지원하지 않습니다. 달러 기호($)를 리터럴 문자(literal character)로 포함하려면 문자열 보간을 방지하기 위해 ${'$'} 구문을 사용해야 합니다. 이 방식은 코드를 읽기 어렵게 만들 수 있으며, 특히 문자열에 여러 개의 달러 기호가 포함된 경우 더욱 그렇습니다.

다중 달러 문자열 보간은 단일 행 및 여러 줄 문자열 모두에서 달러 기호를 리터럴 문자로 처리할 수 있게 하여 이를 간소화합니다. 예를 들어:

kotlin
val KClass<*>.jsonSchema : String
    get() = $"""
    {
      "$schema": "https://json-schema.org/draft/2020-12/schema",
      "$id": "https://example.com/product.schema.json",
      "$dynamicAnchor": "meta",
      "title": "${simpleName ?: qualifiedName ?: "unknown"}",
      "type": "object"
    }
    """

여기서 $$ 접두사는 문자열 보간을 트리거하는 데 두 개의 연속적인 달러 기호가 필요함을 지정합니다. 단일 달러 기호는 리터럴 문자로 유지됩니다.

보간을 트리거하는 달러 기호의 수를 조절할 수 있습니다. 예를 들어, 세 개의 연속 달러 기호($$$)를 사용하면 $$$가 리터럴로 유지되면서 $$$로 보간을 활성화할 수 있습니다:

kotlin
val productName = "carrot"
val requestedData =
    $$"""{
      "currency": "$",
      "enteredAmount": "42.45 $",
      "$serviceField": "none",
      "product": "$$productName"
    }
    """

println(requestedData)
//{
//    "currency": "$",
//    "enteredAmount": "42.45 $",
//    "$serviceField": "none",
//    "product": "carrot"
//}

여기서 $$ 접두사는 문자열이 이스케이프를 위해 ${'$'} 구문을 요구하지 않고도 $$$를 포함할 수 있도록 합니다.

다중 달러 문자열 보간은 단일 달러 문자열 보간을 사용하는 기존 코드에 영향을 미치지 않습니다. 이전과 같이 단일 $를 계속 사용할 수 있으며, 문자열에서 리터럴 달러 기호를 처리해야 할 때 다중 달러 기호를 적용할 수 있습니다.

문자열 포매팅

String.format() 함수를 사용한 문자열 포매팅은 Kotlin/JVM에서만 사용할 수 있습니다.

특정 요구 사항에 맞게 문자열을 포매팅하려면 String.format() 함수를 사용하세요.

String.format() 함수는 형식 문자열과 하나 이상의 인수를 받습니다. 형식 문자열은 주어진 인수에 대한 하나의 자리 표시자(%로 표시)를 포함하며, 그 뒤에 형식 지정자가 따릅니다. 형식 지정자는 해당 인수에 대한 포매팅 지시이며, 플래그, 너비, 정밀도, 변환 유형으로 구성됩니다. 총체적으로 형식 지정자는 출력의 포매팅을 형성합니다. 일반적인 형식 지정자로는 정수용 %d, 부동 소수점 숫자용 %f, 문자열용 %s가 있습니다. 또한 argument_index$ 구문을 사용하여 형식 문자열 내에서 동일한 인수를 다른 형식으로 여러 번 참조할 수 있습니다.

형식 지정자에 대한 자세한 내용과 포괄적인 목록은 Java의 Class Formatter 문서를 참조하세요.

예시를 살펴보겠습니다:

kotlin
fun main() { 
    // 정수를 포맷하고, 길이가 7자리에 도달하도록 선행 0을 추가합니다.
    val integerNumber = String.format("%07d", 31416)
    println(integerNumber)
    // 0031416

    // 부동 소수점 숫자를 + 부호와 소수점 이하 4자리로 표시하도록 포맷합니다.
    val floatNumber = String.format("%+.4f", 3.141592)
    println(floatNumber)
    // +3.1416

    // 두 문자열을 대문자로 포맷하며, 각 문자열이 하나의 자리 표시자를 차지합니다.
    val helloString = String.format("%S %S", "hello", "world")
    println(helloString)
    // HELLO WORLD
    
    // 음수를 괄호로 묶어서 포맷한 다음, `argument_index$`를 사용하여 동일한 숫자를 다른 형식(괄호 없음)으로 반복합니다.
    val negativeNumberInParentheses = String.format("%(d means %1\$d", -31416)
    println(negativeNumberInParentheses)
    //(31416) means -31416
}

String.format() 함수는 문자열 템플릿과 유사한 기능을 제공합니다. 그러나 String.format() 함수는 더 많은 포매팅 옵션을 사용할 수 있으므로 더 다용도입니다.

또한 변수에서 형식 문자열을 할당할 수 있습니다. 이는 형식 문자열이 변경될 때 유용하며, 예를 들어 사용자 로케일에 따라 달라지는 지역화 사례에서 그렇습니다.

String.format() 함수를 사용할 때 인수와 해당 자리 표시자의 수 또는 위치가 일치하지 않을 수 있으므로 주의해야 합니다.