content/03-rag/ai-knowledge-hub.md

RAG 快速回查

这个页面只负责"快速查到"。它不承担首页分流,也不负责顺序教学;它只服务于术语回查、参数确认、问题定位和从概念反查代码。

标签:术语回查 | 参数速查 | 问题定位 | 代码反查

这页负责快速回查,不负责第一次顺序学习。 如果你是第一次系统学习,请先进入课程路线图。


适合任务

  • 复习时回查术语、做项目时确认参数、从问题反查对应页面和代码。

按主题查

主题内容对应页面
Embedding / 向量 / 余弦相似度概念原理、维度含义、为什么余弦更适合语义检索概念手册 · 向量与检索
Chunking / overlap / 分块边界为什么分块决定上限,以及 V2 代码里三种分块策略的行为差异代码讲解 V1V2
Recall@K / MRR / 黄金数据集做优化前先定义尺子,避免"凭感觉优化"工程方法论手册
混合检索 / Reranking / GraphRAG生产级增强策略、适用边界和扩展方向理解 RAG · Ep3

按问题查

  • 为什么用余弦相似度而不是欧氏距离 → 概念手册 · 向量与检索
  • chunk 多大合适,overlap 取多少 → 代码讲解 V2
  • 为什么 Demo 能跑但系统不好用 → 工程方法论手册 · 失败模式
  • 什么时候该用 RAG,什么时候不该用 → 工程方法论手册 · 方案边界
  • RAG 全链路有哪些模块 → 知识地图
  • RAG 和微调到底怎么分工 → 工程方法论手册 · 方案边界

标准知识对象

Embedding

一句话定义:把文本映射成向量表示,让"语义接近"可以被检索系统计算。

  • 适用任务:理解语义检索、解释向量召回、选 embedding 模型。
  • 常见误区:误以为每一维都有可解释的人类含义。
  • 实践建议:先理解余弦相似度,再看模型排行榜。
  • 相关代码01_v1_最小RAG循环.py 的 embedding 与相似度计算。

Chunk / Overlap

一句话定义:把文档切成可检索的信息单元,并用 overlap 降低边界切断带来的语义损失。

  • 适用任务:调召回、解释分块策略、比较 chunking 方案。
  • 常见误区:一味追求块越小越准,忽略语义完整性。
  • 实践建议:先用 200-500 字符、10%-20% overlap 作为基线。
  • 相关代码02_v2_文档分块策略.py

Recall / MRR

一句话定义:用来判断检索有没有把正确内容找回来,以及把正确结果排在了多靠前的位置。

  • 适用任务:建立 Golden Dataset、验证召回优化是否有效。
  • 常见误区:只看最终答案,不看检索层指标。
  • 实践建议:先定义标准问答集,再比较策略差异。
  • 相关代码03_v3.5_黄金数据集.py

Reranking

一句话定义:在粗召回后的候选结果上做精排序,用更高的相关性换取额外延迟。

  • 适用任务:候选里已有"差不多相关"的片段,但排序不够准。
  • 常见误区:把 reranker 当成解决所有检索问题的万能补丁。
  • 实践建议:先确认召回已包含正确候选,再加 reranker。

按场景查

学习首轮(从零理解)

  1. 先看课程路线图建立顺序感
  2. 再读概念手册理解 embedding / 检索
  3. 接着跑 V1 / V2 代码

项目调优(发现效果不好)

  1. 先看失败模式,判断问题出在召回还是生成
  2. 再回查 chunk / rerank / 评估指标
  3. 最后设计 Golden Dataset 做验证

方案说明(售前 / 面试 / 讲解)

  1. 用工程方法论手册解释原理、边界和典型架构
  2. 用知识地图展示流程
  3. 用工程手册说明落地方法

术语表与参数速查

术语表

词条一句话定义建议回看
Embedding把文本转成高维向量,使语义相近的内容在向量空间里更接近。概念手册 · 向量与检索
Chunk文档切分后的最小检索单元,太碎会丢语义,太大则噪声多。代码讲解 V2
Reranking在粗召回候选集上做精排序,用精度换取额外延迟。理解 RAG · Ep3
Recall@K相关内容有没有被找回来,衡量"找全不找全"。工程方法论手册

参数速查表

参数 / 决策建议基线备注
chunk size200-500 字符技术文档优先保证句子或段落完整。
overlap10%-20%用于保住块边界的信息。
Top-K5-10过低会漏召回,过高会给 LLM 带来噪声。
何时加 Reranker召回对了但排序不准时典型生产增强项。
何时做混合检索关键词、编号、自然语言同时重要时如条款号、产品代码、FAQ 混合场景。

建议把本页作为浏览器固定书签;学习走路线图,回查走这里。

评论