第一步
理解概念
30 min · 适合所有人

5集叙事讲解,从 LLM 缺陷到企业级架构,每集对应一个视频

Ep1 · LLM 缺陷与 RAG 起源 Ep2 · 分块与索引 Ep3 · 混合检索 Ep4 · 评估与优化 Ep5 · 企业级架构
开始学习 →
第二步
动手实验
按需选择 · 需要 Python 环境

v1~v10 渐进式代码工坊,每个文件可独立运行

v1 最小RAG v5 混合检索 v6 Reranking v8 评估 v10 企业级

每个文件顶部有讲师注释,指明核心代码行

rag/code/
第三步
深度辩证
按需查阅 · 面试 / 架构设计

7个专题,从失败案例到模型选型,每篇都是可落地的判断框架

RRF 平局陷阱 Embedding 选型 小模型边界 评估方案

位置:rag/code/mock-interview/

mock-interview/
四阶段学习地图(地基 → 检索优化 → 查询智能 → 企业级),每阶段列出对应代码版本。
打开 →
从零推导向量空间直觉,覆盖余弦相似度、Embedding、稠密/稀疏检索的数学原理。
打开 →
逐行解析最小 RAG 循环(v1)和分块策略(v2),把概念映射到实际代码。
打开 →
生产落地六步法:方法论 · 失败模式 · 实验记录 · 项目清单 · 方案边界 · 定位指南。
打开 →
23 个核心概念速查词典,10+ 参考维度,点击术语即时查看深度解析。用于横向辨析和面试复习。
打开 →
RAG 系统组件全局视图,适合建立架构整体感知,不适合第一次顺序学习。
打开 →
我想了解… 去哪里
RAG 是什么,为什么需要它 01_理解RAG.html · Ep1
分块大小怎么选 01_理解RAG.html · Ep2 · v2 代码
为什么混合检索比纯向量好 01_理解RAG.html · Ep3 · v5 代码
MRR 和 RAGAS 有什么区别 01_理解RAG.html · Ep4 · v8 代码
生产部署需要哪些组件 01_理解RAG.html · Ep5 · v10 代码
某个术语的精确定义 概念手册 rag-5d · 快速回查
向量空间和余弦相似度是什么原理 02 · 概念手册
生产部署、失败模式、方案边界 04 · 工程方法论手册
RRF 平局陷阱怎么回事 mock-interview/05_混合检索RRF平局陷阱.md
Embedding 模型怎么选 mock-interview/06_embedding选型参考.md
Self-RAG 为什么需要大模型 mock-interview/07_agentic_rag_模型选型.md