长期记忆

--8<-- "versioning-snippets.md:beta"

LongTermMemory 功能通过两组独立的设置向 Koog AI 智能体添加持久化记忆：

检索 (Retrieval) — 使用来自存储的相关上下文增强 LLM 提示词（检索增强生成或 RAG）
摄取 (Ingestion) — 将对话消息持久化到存储中以便将来检索

快速入门

Kotlin

kotlin

val myStorage = InMemoryRecordStorage() // 或者您的向量数据库适配器

val agent = AIAgent(
    promptExecutor = executor,
    strategy = singleRunStrategy(),
    agentConfig = agentConfig,
    toolRegistry = ToolRegistry.EMPTY
) {
    install(LongTermMemory) {
        retrieval {
            storage = myStorage
            searchStrategy = SimilaritySearchStrategy(topK = 5)
        }
    }
}

agent.run("What did we discuss yesterday?")

Java

java

InMemoryRecordStorage myStorage = new InMemoryRecordStorage();

AIAgent agent = AIAgent.builder()
    .promptExecutor(executor)
    .llmModel(OpenAIModels.Chat.GPT4o)
    .systemPrompt("You are a helpful assistant.")
    .install(LongTermMemory.Feature, config -> {
        config.retrieval(
            new LongTermMemory.RetrievalSettingsBuilder()
                .withStorage(myStorage)
                .withSearchStrategy(
                    SearchStrategy.builder().similarity().withTopK(5).build()
                )
                .build()
        );
    })
    .build();

Object result = agent.run("What did we discuss yesterday?");

仅检索 (RAG)

当您拥有预填充的知识库时，可以使用检索而不开启摄取：

Kotlin

kotlin

install(LongTermMemory) {
    retrieval {
        storage = myVectorDbStorage
        namespace = "my-collection"  // 可选：作用域限定为特定的命名空间/集合
        searchStrategy = SimilaritySearchStrategy(topK = 3, similarityThreshold = 0.7)
        promptAugmenter = SystemPromptAugmenter()
    }
}

Java

java

var retrievalSettings = new LongTermMemory.RetrievalSettingsBuilder()
    .withStorage(myVectorDbStorage)
    .withSearchStrategy(
        SearchStrategy.builder().similarity().withTopK(3).withSimilarityThreshold(0.7).build()
    )
    .withPromptAugmenter(PromptAugmenter.builder().system().build())
    .build();

提示词增强器 (Prompt Augmenters)

增强器	行为
`SystemPromptAugmenter()`	在提示词开头作为系统消息插入上下文（如果没有系统消息则为无操作）
`UserPromptAugmenter()`	在最后一条用户消息的末尾添加检索到的上下文作为额外的文本部分（如果没有用户消息则为无操作）
`PromptAugmenter { prompt, context -> ... }`	通过 lambda表达式进行自定义增强

搜索查询提供程序 (Search Query Providers)

默认情况下，检索流程使用最后一条用户消息作为搜索查询。您可以通过提供 SearchQueryProvider 来自定义此行为：

提供程序	行为
`LastUserMessageQueryProvider()`	使用最后一条用户消息的内容（默认）
`SearchQueryProvider { prompt -> ... }`	通过 lambda表达式进行自定义查询派生

Kotlin

kotlin

install(LongTermMemory) {
    retrieval {
        storage = myStorage
        searchQueryProvider = SearchQueryProvider { prompt ->
            // 将最后两条用户消息合并为搜索查询
            prompt.messages
                .filter { it.role == Message.Role.User }
                .takeLast(2)
                .joinToString(" ") { it.content }
                .ifEmpty { null }
        }
    }
}

Java

java

var retrievalSettings = new LongTermMemory.RetrievalSettingsBuilder()
    .withStorage(myStorage)
    .withSearchQueryProvider(prompt -> {
        var userMessages = prompt.getMessages().stream()
            .filter(m -> m.getRole() == Message.Role.User)
            .toList();
        if (userMessages.isEmpty()) return null;
        return userMessages.get(userMessages.size() - 1).getContent();
    })
    .build();

搜索策略 (Search Strategies)

策略	行为
`SimilaritySearchStrategy()`	向量相似度语义搜索 — 默认
`query -> new SimilaritySearchRequest(query, 20, 0, 0.0, null)`	通过 lambda表达式进行自定义搜索

仅摄取

使用摄取而不开启检索，可以随时间推移构建记忆存储：

Kotlin

kotlin

install(LongTermMemory) {
    ingestion {
        storage = myVectorDbStorage
        namespace = "my-collection"  // 可选：作用域限定为特定的命名空间/集合
        documentExtractor = MessagePassingDocumentExtractor(
            messageRolesToExtract = setOf(Message.Role.User, Message.Role.Assistant)
        )
    }
}

Java

java

var ingestionSettings = new LongTermMemory.IngestionSettingsBuilder()
    .withStorage(myVectorDbStorage)
    .withDocumentExtractor(
        DocumentExtractor.builder()
            .filtering()
            .withExtractRoles(new HashSet<>(Arrays.asList(Message.Role.User, Message.Role.Assistant)))
            .build()
    )
    .build();

摄取在智能体运行完成时执行一次：最终累积的会话提示词/历史记录将作为单个批次传递给配置的 documentExtractor。

禁用自动行为

默认情况下，检索和摄取是自动运行的（检索在每次 LLM 调用之前运行；摄取在智能体完成时运行一次）。您可以禁用自动行为，同时仍然可以从策略节点内部访问配置好的存储和策略：

Kotlin

kotlin

install(LongTermMemory) {
    retrieval {
        storage = myStorage
        enableAutomaticRetrieval = false  // 不进行自动提示词增强
    }
    ingestion {
        storage = myStorage
        enableAutomaticIngestion = false  // 不进行自动消息持久化
    }
}

Java

java

config.retrieval(
    new LongTermMemory.RetrievalSettingsBuilder()
        .withStorage(myStorage)
        .withEnableAutomaticRetrieval(false)
        .build()
);
config.ingestion(
    new LongTermMemory.IngestionSettingsBuilder()
        .withStorage(myStorage)
        .withEnableAutomaticIngestion(false)
        .build()
);

这为您提供了三种清晰的模式：

全自动（默认）：安装功能，配置存储 — 检索和摄取将自动工作。
仅手动：设置 enableAutomaticRetrieval = false / enableAutomaticIngestion = false，并在图策略节点中使用存储和策略。
混合：将自动摄取与手动检索相结合（反之亦然）。

从策略节点访问长期记忆

在策略节点内使用 withLongTermMemory { } 直接搜索或添加记录：

kotlin

val myNode by node<String, Unit> {
    withLongTermMemory {
        // 手动添加记录
        val record = MemoryRecord(content = "important fact")
        ingestionStorage?.add(listOf(record), namespace = "my-namespace")

        // 手动搜索
        val request = SimilaritySearchRequest(queryText = input, limit = 5)
        val results = retrievalStorage?.search(request, namespace = "my-namespace")
    }
}

使用 longTermMemory() 直接获取功能实例：

kotlin

val myNode by node<String, Unit> {
    val memory = longTermMemory()
    val storage = memory.ingestionStorage
}

自定义文档提取器

实现 DocumentExtractor 以控制消息在存储前的转换方式：

kotlin

val summarizingExtractor = DocumentExtractor { messages ->
    messages
        .filter { it.role == Message.Role.Assistant }
        .map { MemoryRecord(content = summarize(it.content)) }
}

install(LongTermMemory) {
    ingestion {
        storage = myStorage
        documentExtractor = summarizingExtractor
    }
}

实现自定义存储

实现 SearchStorage 和/或 WriteStorage 以连接到您的向量数据库：

kotlin

class MyVectorDbStorage : SearchStorage<TextDocument, SearchRequest>, WriteStorage<TextDocument> {
    override suspend fun search(
        request: SearchRequest, namespace: String?
    ): List<SearchResult<TextDocument>> {
        // 查询您的向量数据库
    }

    override suspend fun add(
        records: List<TextDocument>, namespace: String?
    ): List<String> {
        // 更新或插入到您的向量数据库并返回已添加记录的 ID
    }
}

为了进行测试，可以使用内置的 InMemoryRecordStorage，它将记录保存在内存中。它同时支持 KeywordSearchRequest（实现为不区分大小写的子字符串匹配）和 SimilaritySearchRequest（实现为在不区分大小写的单词集上的 Jaccard 系数）；不使用向量嵌入。

规划代理

创建提示词

运行提示词

聊天记忆

OpenTelemetry

子图

长期记忆

快速入门

仅检索 (RAG)

提示词增强器 (Prompt Augmenters)

搜索查询提供程序 (Search Query Providers)

搜索策略 (Search Strategies)

仅摄取

禁用自动行为

从策略节点访问长期记忆

自定义文档提取器

实现自定义存储

长期记忆 ​

快速入门 ​

仅检索 (RAG) ​

提示词增强器 (Prompt Augmenters) ​

搜索查询提供程序 (Search Query Providers) ​

搜索策略 (Search Strategies) ​

仅摄取 ​

禁用自动行为 ​

从策略节点访问长期记忆 ​

自定义文档提取器 ​

实现自定义存储 ​

长期记忆

快速入门

仅检索 (RAG)

提示词增强器 (Prompt Augmenters)

搜索查询提供程序 (Search Query Providers)

搜索策略 (Search Strategies)

仅摄取

禁用自动行为

从策略节点访问长期记忆

自定义文档提取器

实现自定义存储