RAG 快速回查
这个页面只负责"快速查到"。它不承担首页分流,也不负责顺序教学;它只服务于术语回查、参数确认、问题定位和从概念反查代码。
标签:术语回查 | 参数速查 | 问题定位 | 代码反查
这页负责快速回查,不负责第一次顺序学习。 如果你是第一次系统学习,请先进入课程路线图。
适合任务
- 复习时回查术语、做项目时确认参数、从问题反查对应页面和代码。
按主题查
| 主题 | 内容 | 对应页面 |
|---|---|---|
| Embedding / 向量 / 余弦相似度 | 概念原理、维度含义、为什么余弦更适合语义检索 | 概念手册 · 向量与检索 |
| Chunking / overlap / 分块边界 | 为什么分块决定上限,以及 V2 代码里三种分块策略的行为差异 | 代码讲解 V1V2 |
| Recall@K / MRR / 黄金数据集 | 做优化前先定义尺子,避免"凭感觉优化" | 工程方法论手册 |
| 混合检索 / Reranking / GraphRAG | 生产级增强策略、适用边界和扩展方向 | 理解 RAG · Ep3 |
按问题查
- 为什么用余弦相似度而不是欧氏距离 → 概念手册 · 向量与检索
- chunk 多大合适,overlap 取多少 → 代码讲解 V2
- 为什么 Demo 能跑但系统不好用 → 工程方法论手册 · 失败模式
- 什么时候该用 RAG,什么时候不该用 → 工程方法论手册 · 方案边界
- RAG 全链路有哪些模块 → 知识地图
- RAG 和微调到底怎么分工 → 工程方法论手册 · 方案边界
标准知识对象
Embedding
一句话定义:把文本映射成向量表示,让"语义接近"可以被检索系统计算。
- 适用任务:理解语义检索、解释向量召回、选 embedding 模型。
- 常见误区:误以为每一维都有可解释的人类含义。
- 实践建议:先理解余弦相似度,再看模型排行榜。
- 相关代码:
01_v1_最小RAG循环.py的 embedding 与相似度计算。
Chunk / Overlap
一句话定义:把文档切成可检索的信息单元,并用 overlap 降低边界切断带来的语义损失。
- 适用任务:调召回、解释分块策略、比较 chunking 方案。
- 常见误区:一味追求块越小越准,忽略语义完整性。
- 实践建议:先用 200-500 字符、10%-20% overlap 作为基线。
- 相关代码:
02_v2_文档分块策略.py。
Recall / MRR
一句话定义:用来判断检索有没有把正确内容找回来,以及把正确结果排在了多靠前的位置。
- 适用任务:建立 Golden Dataset、验证召回优化是否有效。
- 常见误区:只看最终答案,不看检索层指标。
- 实践建议:先定义标准问答集,再比较策略差异。
- 相关代码:
03_v3.5_黄金数据集.py。
Reranking
一句话定义:在粗召回后的候选结果上做精排序,用更高的相关性换取额外延迟。
- 适用任务:候选里已有"差不多相关"的片段,但排序不够准。
- 常见误区:把 reranker 当成解决所有检索问题的万能补丁。
- 实践建议:先确认召回已包含正确候选,再加 reranker。
按场景查
学习首轮(从零理解)
- 先看课程路线图建立顺序感
- 再读概念手册理解 embedding / 检索
- 接着跑 V1 / V2 代码
项目调优(发现效果不好)
- 先看失败模式,判断问题出在召回还是生成
- 再回查 chunk / rerank / 评估指标
- 最后设计 Golden Dataset 做验证
方案说明(售前 / 面试 / 讲解)
- 用工程方法论手册解释原理、边界和典型架构
- 用知识地图展示流程
- 用工程手册说明落地方法
术语表与参数速查
术语表
| 词条 | 一句话定义 | 建议回看 |
|---|---|---|
| Embedding | 把文本转成高维向量,使语义相近的内容在向量空间里更接近。 | 概念手册 · 向量与检索 |
| Chunk | 文档切分后的最小检索单元,太碎会丢语义,太大则噪声多。 | 代码讲解 V2 |
| Reranking | 在粗召回候选集上做精排序,用精度换取额外延迟。 | 理解 RAG · Ep3 |
| Recall@K | 相关内容有没有被找回来,衡量"找全不找全"。 | 工程方法论手册 |
参数速查表
| 参数 / 决策 | 建议基线 | 备注 |
|---|---|---|
| chunk size | 200-500 字符 | 技术文档优先保证句子或段落完整。 |
| overlap | 10%-20% | 用于保住块边界的信息。 |
| Top-K | 5-10 | 过低会漏召回,过高会给 LLM 带来噪声。 |
| 何时加 Reranker | 召回对了但排序不准时 | 典型生产增强项。 |
| 何时做混合检索 | 关键词、编号、自然语言同时重要时 | 如条款号、产品代码、FAQ 混合场景。 |
建议把本页作为浏览器固定书签;学习走路线图,回查走这里。