RAG
概念 ai 检索 llm
来源数 1 Fri Apr 10 2026 08:00:00 GMT+0800 (China Standard Time)
RAG
检索增强生成(Retrieval-Augmented Generation)。一种常见的模式:LLM 通过从向量数据库中检索相关文档片段,并基于这些片段生成回答。
特点
- 查询时检索 — 文档在构建时被切块和索引,但真正的理解发生在查询时。
- 无状态 — 每个问题都从头回答,没有积累下来的综合结论。
- 适用于 — 规模过大、无法预先编译的语料库,以及高度具体的问题。
局限性
- LLM 每次都必须重新发现文档之间的关联。
- 跨文档综合很脆弱,因为它严重依赖于检索的准确性。
- 没有时间积累的持久产物。
对比
参见 LLM Wiki,一种强调持久、复利式知识编译而非查询时检索的替代模式。