RAG

概念 ai 检索 llm 来源数 1 Fri Apr 10 2026 08:00:00 GMT+0800 (China Standard Time)

RAG

检索增强生成（Retrieval-Augmented Generation）。一种常见的模式：LLM 通过从向量数据库中检索相关文档片段，并基于这些片段生成回答。

特点

查询时检索 — 文档在构建时被切块和索引，但真正的理解发生在查询时。
无状态 — 每个问题都从头回答，没有积累下来的综合结论。
适用于 — 规模过大、无法预先编译的语料库，以及高度具体的问题。

局限性

LLM 每次都必须重新发现文档之间的关联。
跨文档综合很脆弱，因为它严重依赖于检索的准确性。
没有时间积累的持久产物。

对比

参见 LLM Wiki，一种强调持久、复利式知识编译而非查询时检索的替代模式。

来源

src-llm-wiki-宣言