📚 RAG 检索增强生成

私有知识库 + 大模型 = 减少胡编 — 阶段 2/5

📚 RAG 是什么?

📄 文档库
50~500 条
🔢 向量化
Embedding
🔍 检索 Top-K
相似片段
🤖 LLM 生成
基于上下文
plan.md 小案例:用 LlamaIndex Cloud 上传 ≤500 字备忘录,网页构建向量库,测试「查找今日待办」。本演示用词袋余弦相似度模拟检索(见下方分步可视化),无需 API。真实 RAG 的 Embedding 来自 Transformer,可先读 图解 Transformer(中文译文)

🎮 个人备忘录问答机器人

内置 12 条短备忘录(模拟上传文档)。输入问题,看检索与生成过程。

🔢 词袋余弦相似度 · 求解过程

演示版用单字分词 + 词频向量模拟 Embedding。Top-3 可点标签切换;下方条形图可点任意文档查看完整计算。真实系统见 图解 Transformer

输入问题并点击「检索 + 回答」查看逐步计算

文档库 · 相似度排序(Top-K = 3 高亮)

(输入问题后查看 RAG 回答)

🧪 推荐测试问题(plan 验证闭环)

✅ 检测题(5 题)

1. RAG 主要解决 LLM 的什么问题?
2. Embedding 的作用是?
3. Top-K 检索的含义是?
4. plan.md 对微调数据集规模的约束是?
5. 阶段 5 综合项目串联了哪三部分?