Skip to content

데이터 분석을 위한 Kotlin 및 Java 라이브러리

데이터 수집부터 모델 구축에 이르기까지, Kotlin은 데이터 파이프라인의 다양한 작업을 용이하게 하는 강력한 라이브러리를 제공합니다.

자체 라이브러리 외에도 Kotlin은 Java와 100% 상호 운용 가능합니다. 이러한 상호 운용성은 검증된 Java 라이브러리의 전체 생태계를 뛰어난 성능으로 활용하는 데 도움이 됩니다. 이러한 이점을 통해 Kotlin 데이터 프로젝트를 수행할 때 Kotlin 또는 Java 라이브러리를 쉽게 사용할 수 있습니다.

Kotlin 라이브러리

라이브러리목적기능
Kotlin DataFrame
  • 데이터 수집
  • 데이터 정리 및 처리
  • 데이터프레임 생성, 정렬, 정리, 특징 공학 등을 위한 연산
  • 정형 데이터 처리
  • CSV, JSON 및 기타 입력 형식 지원
  • SQL 데이터베이스에서 읽기
  • 다양한 API와 연결하여 데이터 접근 및 타입 안정성 향상
Kandy
  • 데이터 탐색 및 시각화
KotlinDL
  • 모델 구축
  • Keras에서 영감을 받아 Kotlin으로 작성된 딥러닝 API
  • 딥러닝 모델을 처음부터 훈련하거나 기존 Keras 및 ONNX 모델을 가져와 추론
  • 기존 사전 훈련된 모델을 작업에 맞게 조정하기 위한 전이 학습
  • Android 플랫폼 지원
Multik
  • 데이터 정리 및 처리
  • 모델 구축
  • 다차원 배열에 대한 수학 연산 (선형 대수, 통계, 산술 및 기타 계산)
  • 배열 생성, 복사, 인덱싱, 슬라이싱 및 기타 배열 연산
  • 타입 및 차원 안전성, 교체 가능한 계산 엔진 등의 이점을 가진 Kotlin 숙어적 라이브러리로, JVM 또는 네이티브 코드로 실행 가능
Kotlin for Apache Spark
  • 데이터 수집
  • 데이터 정리 및 처리
  • 데이터 탐색 및 시각화
  • 모델 구축
  • Apache Spark와 Kotlin 간의 호환성 계층
  • Kotlin 숙어적 코드의 Apache Spark 데이터 변환 연산
  • 데이터 클래스 및 람다 표현식과 같은 Kotlin 기능의 중괄호 또는 메서드 참조 내 간편한 사용
Lets-Plot
  • 데이터 탐색 및 시각화
KMath
  • 데이터 정리 및 처리
  • 데이터 탐색 및 시각화
  • 모델 구축
  • Kotlin Multiplatform (JVM, JS, Native, Wasm)에서 수학적 추상화 작업을 위한 모듈식 라이브러리
  • 대수 구조, 수학 표현식, 히스토그램 및 스트리밍 연산을 위한 API
  • ND4J, Apache Commons Math, Multik을 포함한 기존 Java 및 Kotlin 라이브러리 위에 있는 교체 가능한 래퍼
  • Python의 NumPy에서 영감을 받았지만 타입 안전성 등 다른 추가 기능 포함
kravis
  • 데이터 탐색 및 시각화

Java 라이브러리

Kotlin은 Java와 최고 수준의 상호 운용성을 제공하므로, Kotlin 코드에서 데이터 작업을 위해 Java 라이브러리를 사용할 수 있습니다. 다음은 그러한 라이브러리의 몇 가지 예시입니다.

라이브러리목적기능
Tablesaw
  • 데이터 수집
  • 데이터 정리 및 처리
  • 데이터 탐색 및 시각화
  • 데이터 로드, 정리, 변환, 필터링 및 요약을 위한 도구
  • Plot.ly에서 영감
CoreNLP
  • 데이터 정리 및 처리
  • 자연어 처리 툴킷
  • 감정 및 인용 속성과 같은 텍스트에 대한 언어학적 주석
  • 8개 언어 지원
Smile
  • 데이터 정리 및 처리
  • 데이터 탐색 및 시각화
  • 모델 구축
  • 기계 학습 및 자연어 처리를 위한 기성 알고리즘
  • 선형 대수, 그래프, 보간 및 시각화 도구
  • 함수형 Kotlin API, Scala API, Clojure API 등을 제공
Smile-NLP-kt
  • 데이터 정리 및 처리
  • Smile의 자연어 처리 부분을 위한 Scala 암시적 변환의 Kotlin 재작성
  • Kotlin 확장 함수 및 인터페이스 형식의 연산
  • 문장 분리, 어간 추출, Bag-of-Words 및 기타 작업
ND4J
  • 데이터 정리 및 처리
  • 모델 구축
  • JVM용 행렬 수학 라이브러리
  • 500개 이상의 수학, 선형 대수 및 딥러닝 연산
Apache Commons Math
  • 데이터 정리 및 처리
  • 모델 구축
  • Java용 수학 및 통계 연산
  • 상관 관계, 분포, 선형 대수, 기하학 및 기타 연산
  • 기계 학습 모델
NM Dev
  • 데이터 정리 및 처리
  • 모델 구축
  • 수치 알고리즘의 Java 수학 라이브러리
  • 객체 지향 수치 메서드
  • 선형 대수, 최적화, 통계, 미적분 및 기타 연산
Apache OpenNLP
  • 데이터 정리 및 처리
  • 모델 구축
  • 자연어 텍스트 처리를 위한 기계 학습 기반 툴킷
  • 토큰화, 문장 분할, 품사 태깅 및 기타 작업
  • 데이터 모델링 및 모델 유효성 검사를 위한 내장 도구
Charts
  • 데이터 탐색 및 시각화
  • 과학 차트를 위한 JavaFX 라이브러리
  • 로그 차트, 히트맵, 힘 기반 그래프와 같은 복합 차트
DeepLearning4J
  • 모델 구축
  • Java용 딥러닝 라이브러리
  • 모델 가져오기 및 재훈련 (Pytorch, Tensorflow, Keras)
  • JVM 마이크로서비스 환경, 모바일 장치, IoT 및 Apache Spark에 배포
Timefold
  • 모델 구축
  • 최적화 계획 문제를 위한 솔버 유틸리티
  • 객체 지향 및 함수형 프로그래밍과 호환