青少年科技周刊#1：AI会偷懒？不懂编程的人造出了编程工具

发布于 2026/07/05 23:370号员工3 浏览2 访客

本周科技趣闻速读：AI会偷懒、越聪明越容易犯错、不懂编程的人用AI造出编程工具、电脑卡了怎么看体检报告。专为青少年打造的通俗科技解读。

今日导读
本周科技圈发生了几件特别有意思的事：有人发现最新版 AI 居然会“偷懒”——还没想完就停下来；有个完全不懂 Rust 编程的人，靠 AI 写出了一个能运行 WordPress 的程序；还有个反直觉的现象——更强的 AI 模型，反而更容易犯错。让我们一起来搞懂这些事！

一、AI 会“偷懒”？GPT-5.5 推理异常之谜中等

想象一下：你在做一道很难的数学题，写到一半突然有人把你的笔抢走，说“好了，交卷吧！”——你可能还没算完，答案当然容易出错。

最近，一位开发者发现了一个奇怪的现象：OpenAI 公司的 GPT-5.5 模型（就是 ChatGPT 背后的“大脑”），似乎也会这样“被抢笔”。

什么是“模型”？

你可以把 AI 模型想象成一个超级聪明的大脑。它读过互联网上几乎所有的文字，所以能回答问题、写代码、聊天。GPT-5.5 是 OpenAI 公司在 2026 年推出的一个版本。

发现了什么？

这位开发者分析了将近 39 万条使用记录，发现 GPT-5.5 在“思考”时，经常会在这几个数字上突然停下来：516、1034、1552……

你发现规律了吗？它们之间的差都是 518！就像一把梳子的齿，间距完全一样。这种整齐的规律在自然界中很少见，更像是有人设了一个“上限”——思考到 516 个单位就强制停下。

趣味发现

更有意思的是，5 月份 GPT-5.5 的平均“思考量”从 268 直接掉到了 107——减少了超过一半！就好像一个原本能想 5 分钟的人，突然被限制只能想 1 分钟了。

这意味着什么？

如果 AI 真的还没“想完”就被强制停止，那它处理复杂问题时就容易出错——就像你做数学题没算完就被迫交卷。

给我们的启发：当你用 AI 帮你做复杂的任务时，如果发现答案不太对，也许不是 AI“不够聪明”，而是它可能“没想完”。可以尝试让它分步骤慢慢来。

AI推理GPT-5.5

二、越聪明反而越容易犯错？AI 的“画蛇添足”中等

你有没有过这种经历：考试时明明知道答案，却手痒多写了一句不该写的话，结果被扣分了？

最近，Flask 框架（一个很流行的编程工具）的创造者 Armin Ronacher 发现了一个让人哭笑不得的现象：最新的、更聪明的 AI 模型，在执行任务时反而比旧模型更容易犯一种特定的错误——画蛇添足。

什么是 Flask？

Flask 是用 Python 语言写的一个“框架”。框架就像建房子的脚手架，程序员不用从零开始搭建一切，而是在脚手架基础上快速建造自己的程序。Armin Ronacher 就是这个脚手架的设计者。

AI 怎么“画蛇添足”了？

当 AI 需要修改一段代码时，它需要填写一个“表格”告诉系统要做什么。这个表格只需要两个信息：旧内容和新内容。

但最新版的 AI（Anthropic 公司的 Opus 4.8 和 Sonnet 5）在填表格时，会自己“发明”一些根本不存在的选项！比如：

AI 填的表格：
- 旧内容：print("hello") （正确！）
- 新内容：print("world") （正确！）
- requireUnique: true （这是啥？表格里没这一项啊！）
- matchCase: false （这个也是 AI 自己编的……）

最离谱的是——AI 发明的这些“多余选项”多达几十种！而且每次编的名字还不一样。

为什么更聪明反而更容易犯这个错？

想象你在学校写作业，老师特别宽容——你写错格式也不扣分，只要答案对就给你满分。时间长了，你就会养成“随便多写点也没关系”的习惯。当你换到一个严格的老师那里，这个习惯就会让你丢分。

AI 也是类似的。它在训练时用的那个“老师”（叫 Claude Code 的系统）对格式错误特别宽容——多写的选项会被自动删掉，不会影响 AI 拿“奖励”。于是 AI 就养成了“多写点总没错”的习惯。换了新的环境，这个习惯就暴露了。

什么是“训练”？

训练 AI 就像训练小狗：做对了给奖励（在 AI 这里是“正向反馈”），做错了就不给奖励。反复很多次后，AI 就学会了什么该做、什么不该做。这里说的“强化学习（RL）”就是一种通过奖励来教 AI 的方法。

给我们的启发：有时候“更聪明”不等于“更可靠”。就像考试时，不是会做的题就一定能拿满分——格式、规范同样重要。这也提醒我们：好习惯要从小养成，换环境后很难改。

AI训练工具调用

三、不懂编程的人，用 AI 造出了编程工具简单

这是本周最酷的故事：一个人完全不懂 Rust 编程语言，却用 AI 写出了一个能运行 WordPress 网站的程序！

什么是 Rust 和 PHP？

PHP：一种编程语言，你访问的很多网站（比如 WordPress 博客）后台就是用 PHP 写的。PHP 像一个“翻译官”，把网页代码翻译成你看到的内容。

Rust：另一种编程语言，以“又快又安全”著称。就像一辆既跑得快又不容易出故障的汽车。

这个人做了什么？

这位开发者叫 Phargo（项目名），他用 AI 把 PHP 的“翻译官”用 Rust 语言重新写了一遍。相当于：原来有个中文翻译，现在请了个会说日语的翻译来做同样的事——而且这个请翻译的人自己完全不懂日语！

他自己说：“我的贡献大约就是——瞄准。”也就是说，他告诉 AI 要做什么，AI 写代码，他看一眼结果，说一句“看起来不错，继续”。

怎么知道 AI 写得对不对？

PHP 语言官方团队花了 30 年时间，写了大约 22,000 道测试题。这些题不是作者写的，也不是 AI 写的——所以它们“不会说谎”。

结果如何？AI 写的程序通过了 3,844 道题，占总数的 17.4%。听起来不多？别忘了，作者完全不懂 Rust，这一切都是 AI 做的！而且这个程序甚至成功运行了 WordPress 网站！

有趣的插曲

早期测试时，通过率卡在一个数字上不动了。后来发现：差别是看不见的——换行符！Windows 和 Linux 的换行方式不同。改了一行代码，几百道题瞬间“翻绿”。

AI 写的代码有什么“坑”？

测试发现了一类特别有趣的 bug，叫“波特金函数”——意思是“表面好看，里面是空的”。这些功能表面上存在，运行也不报错，但什么都不做！

功能	表面看起来	实际效果
clone（克隆）	正常运行	结果是“空”的
unset（删除）	正常运行	什么都没删
trim（修剪）	正常运行	忽略了你给的条件

给我们的启发：这个故事告诉我们——不要让 AI 给自己打分。就像考试不能自己给自己改卷一样，验证 AI 做得好不好，要用“第三方”的标准来检查。

AI编程测试驱动

四、电脑卡了？学会看懂“体检报告”简单

你有没有遇到过电脑突然变卡，但不知道哪里出了问题？就像人生病了需要看体检报告，电脑也有自己的“体检工具”。在 Linux 系统上，最常用的体检工具叫 htop。

什么是 Linux？

Linux 是一种操作系统，就像 Windows 和 macOS 一样。区别是 Linux 是“开源”的——任何人都能免费使用和修改。世界上大部分网站的服务器都在用 Linux。

“负载”是什么意思？

打开 htop 后，最上面会显示三个数字，比如 1.25 0.98 0.76。这就是“负载平均值”，分别代表过去 1 分钟、5 分钟、15 分钟电脑的“忙碌程度”。

负载 ≠ CPU 使用率！

负载 = 正在干活的程序数 + 正在“排队等东西”的程序数

什么是“排队等东西”？比如一个程序需要从硬盘读取数据，在等硬盘响应的时候，它就在“排队”。这时候它不占用 CPU，但仍然算在负载里。这就是为什么有时候负载很高但 CPU 使用率很低——因为有很多程序在“排队等硬盘”。

冷知识

1 分钟负载 = 63% 来自最近 1 分钟 + 37% 来自“远古历史”。负载数字有一种“记忆效应”，不会瞬间变化。

进程的“状态”你看得懂吗？

字母	状态	通俗解释
R	运行中	正在干活
S	可中断睡眠	在休息，但一叫就醒
D	不可中断睡眠	在等东西，叫都叫不醒！
Z	僵尸	已经“去世”但没被“收尸”
T	停止	被暂停了

最让人头疼的是 D 状态——它表示程序在等待硬盘等设备完成操作，这时候连“强制关闭”（kill -9）都没用！

什么是 kill -9？

在 Linux 里，kill 是“杀掉”（关闭）程序的命令。-9 是一个特殊信号，意思是“无论如何，立刻关闭”。但 D 状态的程序连这个信号都不听，因为它在内核层面“卡住”了。

给我们的启发：了解电脑的“体检报告”是一项很实用的技能。下次如果电脑变卡，你可以想想——是 CPU 忙不过来，还是有什么程序在“排队等东西”？

Linux系统监控

动动脑筋

如果 GPT-5.5 的“思考”真的被限制在 516 个单位，你觉得这对需要深度思考的任务会有什么影响？
Phargo 的作者用“别人写的考题”来检查 AI 的工作，你觉得这个方法可以用在生活中的哪些地方？
为什么“更聪明”的 AI 反而可能犯更多格式错误？你能从自己学习或考试的经历中找到类似的例子吗？
电脑“负载很高但 CPU 使用率很低”是什么原因？用你自己的话解释一下。

在评论区留下你的答案，下期我们会精选优秀回答！

本周总结

这周的四个故事有一个共同的主题：技术再先进，也需要人来把关。

AI 可能会“偷懒”（GPT-5.5 推理异常），需要我们留心
更聪明不等于更可靠（工具调用退化），好习惯很重要
AI 写的代码需要“第三方验证”（Phargo），不能自己给自己打分
学会看懂“体检报告”（htop），才能更好地理解电脑

希望这些故事能让你对科技世界多一些了解，也多一些思考。下周见！

必学必会 · 青少年科技周刊

让科技变得简单有趣

每周日更新 · bixuebihui.com