大模型生成参数交互演示 - Temperature / Top-p

📚 核心概念

大语言模型每次生成下一个 token时，会对词表给出概率分布。我们看到的「续写」「创作」效果，很大程度由采样策略决定：

入门阶段只调 temperature 与 max_tokens，先用微型模型（本页用浏览器内古诗 bigram 模拟，约等价于 tiny-gpt2 的教学版）。

固定输入「窗前明月光，」，分别设 temperature = 0.1 / 0.7 / 1.5，各生成 3 次，记录输出差异 — 这就是 Hugging Face Playground 同款实验。

基于内置唐诗语料的字符级模型，纯浏览器运行，无需 GPU。

前缀输入

Temperature 0.7

Top-p 0.9

Max Tokens 24

窗前明月光，（点击生成）

1. temperature 设为 0.1 时，模型输出通常会怎样？

2. top-p = 0.9 的含义是？

3. max_tokens 主要影响什么？

4. 阶段 1 推荐使用的模型规模是？

5. 「验证闭环规则」要求每完成一个演示后做什么？