适合任务
复习时回查术语、做项目时确认参数、从问题反查对应页面和代码。
这个页面只负责“快速查到”。它不承担首页分流,也不负责顺序教学;它只服务于术语回查、参数确认、问题定位和从概念反查代码。
维护规则:这里是高频概念的标准入口。其他页面出现这些概念时,只保留当前语境下的解释,不再重复写完整定义。
| 词条 | 一句话定义 | 建议回看 |
|---|---|---|
| Embedding | 把文本转成高维向量,使语义相近的内容在向量空间里更接近。 | 概念手册 |
| Chunk | 文档切分后的最小检索单元,太碎会丢语义,太大则噪声多。 | 代码讲解 V2 |
| Reranking | 在粗召回候选集上做精排序,用精度换取额外延迟。 | 5D 完全理解 |
| Recall@K | 相关内容有没有被找回来,衡量“找全不找全”。 | 工程手册 |
| 参数 / 决策 | 建议基线 | 备注 |
|---|---|---|
| chunk size | 200-500 字符 | 技术文档优先保证句子或段落完整。 |
| overlap | 10%-20% | 用于保住块边界的信息。 |
| Top-K | 5-10 | 过低会漏召回,过高会给 LLM 带来噪声。 |
| 何时加 Reranker | 召回对了但排序不准时 | 典型生产增强项。 |
| 何时做混合检索 | 关键词、编号、自然语言同时重要时 | 如条款号、产品代码、FAQ 混合场景。 |