RAG

概念 ai 检索 llm 来源数 1 Fri Apr 10 2026 08:00:00 GMT+0800 (China Standard Time)

RAG

检索增强生成(Retrieval-Augmented Generation)。一种常见的模式:LLM 通过从向量数据库中检索相关文档片段,并基于这些片段生成回答。

特点

  • 查询时检索 — 文档在构建时被切块和索引,但真正的理解发生在查询时。
  • 无状态 — 每个问题都从头回答,没有积累下来的综合结论。
  • 适用于 — 规模过大、无法预先编译的语料库,以及高度具体的问题。

局限性

  • LLM 每次都必须重新发现文档之间的关联。
  • 跨文档综合很脆弱,因为它严重依赖于检索的准确性。
  • 没有时间积累的持久产物。

对比

参见 LLM Wiki,一种强调持久、复利式知识编译而非查询时检索的替代模式。

来源