AI的三大记忆机制：从瞬时对话到持久记忆

一、参数记忆：内化的通用知识

参数记忆指的是内化在模型权重中的知识。在预训练或微调阶段，模型通过反向传播将海量数据中的规律和知识压缩到神经网络的参数中。由于训练数据通常覆盖广泛领域，参数记忆基本上是同通用领域的知识。

参数记忆是AI的“常识库”，但它不包含特定用户的信息，也无法在交互过程中实时更新。就像一本百科全书，所有人都能看到相同的内容。

上下文记忆通常指的是提示词以及可见的历史对话。它包括用户输入的提示词、系统指令以及工具返回的结果等，是模型在当前轮次推理时能够直接看到并利用的信息集合。这类似于人类的工作记忆，放在一个临时工作区，并不会永久存储。

模型将上下文信息编码成一串Token，在生成响应时参考这些信息。但生成结束后，模型不会把这些信息写回权重。因此，上下文记忆的能力边界在于一次对话的上下文长度。

上下文记忆是AI处理当前对话的“草稿纸”，但它的容量有限，且无法持久。更重要的是，当对话足够长时，我们就需要上下文压缩技术来智能地管理这些信息。

当对话内容超出模型的上下文窗口时，我们需要上下文压缩技术。这就像是人类的会议记录——不会逐字记录，而是提取关键信息。

通过智能压缩，AI能够在有限的上下文窗口内保持对话的连贯性和关键信息的可用性。

外接数据库里的持久记忆，解决了参数记忆和上下文记忆无法克服的核心问题：

外部记忆系统将需要记住的信息抽取出来长期保存，并在需要的时候精准取回。这样，AI就可以拥有跨会话、可更新、可管理的记忆。

RAG是目前最成熟的流派。它通过将外部知识库与生成模型结合，在生成响应时先检索相关文档，然后将检索结果作为上下文提供给模型，从而生成更准确、更相关的回答。

工作流程：

优势：

Memory Bank是一种结构化的记忆存储，将对话中的关键信息以结构化的方式存储在外部数据库中。当需要时，通过查询记忆库来获取相关信息。

工作流程：

优势：

通过让模型调用外部工具来获取或存储信息，从而扩展模型的记忆和能力。模型可以主动使用工具来记录信息或查询信息。

工作流程：

优势：

AI的记忆机制是其从简单的问答工具转变为智能伙伴的关键。通过理解参数记忆、上下文记忆和外部持久记忆的各自特点与协同方式，我们可以设计出更强大、更个性化的AI应用。

特别是当我们需要处理长对话时，上下文压缩技术成为必不可少的工具，它让AI能够在有限的资源下保持对话的深度和连贯性。