RAG 检索增强生成 | 必学必会演示

📚 RAG 是什么？

📄 文档库
50~500 条

→

🔢 向量化
Embedding

→

🔍 检索 Top-K
相似片段

→

🤖 LLM 生成
基于上下文

plan.md 小案例：用 LlamaIndex Cloud 上传 ≤500 字备忘录，网页构建向量库，测试「查找今日待办」。本演示用词袋余弦相似度模拟检索（见下方分步可视化），无需 API。真实 RAG 的 Embedding 来自 Transformer，可先读图解 Transformer（中文译文）。

🎮 个人备忘录问答机器人

内置 12 条短备忘录（模拟上传文档）。输入问题，看检索与生成过程。

🔢 词袋余弦相似度 · 求解过程

演示版用单字分词 + 词频向量模拟 Embedding。Top-3 可点标签切换；下方条形图可点任意文档查看完整计算。真实系统见图解 Transformer。

输入问题并点击「检索 + 回答」查看逐步计算

文档库 · 相似度排序（Top-K = 3 高亮）

（输入问题后查看 RAG 回答）

🧪 推荐测试问题（plan 验证闭环）

✅ 检测题（5 题）

1. RAG 主要解决 LLM 的什么问题？

2. Embedding 的作用是？

3. Top-K 检索的含义是？

4. plan.md 对微调数据集规模的约束是？

5. 阶段 5 综合项目串联了哪三部分？