青少年科技周刊#1:AI会偷懒?不懂编程的人造出了编程工具

本周科技趣闻速读:AI会偷懒、越聪明越容易犯错、不懂编程的人用AI造出编程工具、电脑卡了怎么看体检报告。专为青少年打造的通俗科技解读。
今日导读
本周科技圈发生了几件特别有意思的事:有人发现最新版 AI 居然会“偷懒”——还没想完就停下来;有个完全不懂 Rust 编程的人,靠 AI 写出了一个能运行 WordPress 的程序;还有个反直觉的现象——更强的 AI 模型,反而更容易犯错。让我们一起来搞懂这些事!
一、AI 会“偷懒”?GPT-5.5 推理异常之谜中等
想象一下:你在做一道很难的数学题,写到一半突然有人把你的笔抢走,说“好了,交卷吧!”——你可能还没算完,答案当然容易出错。
最近,一位开发者发现了一个奇怪的现象:OpenAI 公司的 GPT-5.5 模型(就是 ChatGPT 背后的“大脑”),似乎也会这样“被抢笔”。
什么是“模型”?
你可以把 AI 模型想象成一个超级聪明的大脑。它读过互联网上几乎所有的文字,所以能回答问题、写代码、聊天。GPT-5.5 是 OpenAI 公司在 2026 年推出的一个版本。
发现了什么?
这位开发者分析了将近 39 万条使用记录,发现 GPT-5.5 在“思考”时,经常会在这几个数字上突然停下来:516、1034、1552……
你发现规律了吗?它们之间的差都是 518!就像一把梳子的齿,间距完全一样。这种整齐的规律在自然界中很少见,更像是有人设了一个“上限”——思考到 516 个单位就强制停下。
趣味发现
更有意思的是,5 月份 GPT-5.5 的平均“思考量”从 268 直接掉到了 107——减少了超过一半!就好像一个原本能想 5 分钟的人,突然被限制只能想 1 分钟了。
这意味着什么?
如果 AI 真的还没“想完”就被强制停止,那它处理复杂问题时就容易出错——就像你做数学题没算完就被迫交卷。
AI推理GPT-5.5
二、越聪明反而越容易犯错?AI 的“画蛇添足”中等
你有没有过这种经历:考试时明明知道答案,却手痒多写了一句不该写的话,结果被扣分了?
最近,Flask 框架(一个很流行的编程工具)的创造者 Armin Ronacher 发现了一个让人哭笑不得的现象:最新的、更聪明的 AI 模型,在执行任务时反而比旧模型更容易犯一种特定的错误——画蛇添足。
什么是 Flask?
Flask 是用 Python 语言写的一个“框架”。框架就像建房子的脚手架,程序员不用从零开始搭建一切,而是在脚手架基础上快速建造自己的程序。Armin Ronacher 就是这个脚手架的设计者。
AI 怎么“画蛇添足”了?
当 AI 需要修改一段代码时,它需要填写一个“表格”告诉系统要做什么。这个表格只需要两个信息:旧内容和新内容。
但最新版的 AI(Anthropic 公司的 Opus 4.8 和 Sonnet 5)在填表格时,会自己“发明”一些根本不存在的选项!比如:
- 旧内容:print("hello") (正确!)
- 新内容:print("world") (正确!)
- requireUnique: true (这是啥?表格里没这一项啊!)
- matchCase: false (这个也是 AI 自己编的……)
最离谱的是——AI 发明的这些“多余选项”多达几十种!而且每次编的名字还不一样。
为什么更聪明反而更容易犯这个错?
想象你在学校写作业,老师特别宽容——你写错格式也不扣分,只要答案对就给你满分。时间长了,你就会养成“随便多写点也没关系”的习惯。当你换到一个严格的老师那里,这个习惯就会让你丢分。
AI 也是类似的。它在训练时用的那个“老师”(叫 Claude Code 的系统)对格式错误特别宽容——多写的选项会被自动删掉,不会影响 AI 拿“奖励”。于是 AI 就养成了“多写点总没错”的习惯。换了新的环境,这个习惯就暴露了。
什么是“训练”?
训练 AI 就像训练小狗:做对了给奖励(在 AI 这里是“正向反馈”),做错了就不给奖励。反复很多次后,AI 就学会了什么该做、什么不该做。这里说的“强化学习(RL)”就是一种通过奖励来教 AI 的方法。
AI训练工具调用
三、不懂编程的人,用 AI 造出了编程工具简单
这是本周最酷的故事:一个人完全不懂 Rust 编程语言,却用 AI 写出了一个能运行 WordPress 网站的程序!
什么是 Rust 和 PHP?
PHP:一种编程语言,你访问的很多网站(比如 WordPress 博客)后台就是用 PHP 写的。PHP 像一个“翻译官”,把网页代码翻译成你看到的内容。
Rust:另一种编程语言,以“又快又安全”著称。就像一辆既跑得快又不容易出故障的汽车。
这个人做了什么?
这位开发者叫 Phargo(项目名),他用 AI 把 PHP 的“翻译官”用 Rust 语言重新写了一遍。相当于:原来有个中文翻译,现在请了个会说日语的翻译来做同样的事——而且这个请翻译的人自己完全不懂日语!
他自己说:“我的贡献大约就是——瞄准。”也就是说,他告诉 AI 要做什么,AI 写代码,他看一眼结果,说一句“看起来不错,继续”。
怎么知道 AI 写得对不对?
PHP 语言官方团队花了 30 年时间,写了大约 22,000 道测试题。这些题不是作者写的,也不是 AI 写的——所以它们“不会说谎”。
结果如何?AI 写的程序通过了 3,844 道题,占总数的 17.4%。听起来不多?别忘了,作者完全不懂 Rust,这一切都是 AI 做的!而且这个程序甚至成功运行了 WordPress 网站!
有趣的插曲
早期测试时,通过率卡在一个数字上不动了。后来发现:差别是看不见的——换行符!Windows 和 Linux 的换行方式不同。改了一行代码,几百道题瞬间“翻绿”。
AI 写的代码有什么“坑”?
测试发现了一类特别有趣的 bug,叫“波特金函数”——意思是“表面好看,里面是空的”。这些功能表面上存在,运行也不报错,但什么都不做!
| 功能 | 表面看起来 | 实际效果 |
|---|---|---|
| clone(克隆) | 正常运行 | 结果是“空”的 |
| unset(删除) | 正常运行 | 什么都没删 |
| trim(修剪) | 正常运行 | 忽略了你给的条件 |
AI编程测试驱动
四、电脑卡了?学会看懂“体检报告”简单
你有没有遇到过电脑突然变卡,但不知道哪里出了问题?就像人生病了需要看体检报告,电脑也有自己的“体检工具”。在 Linux 系统上,最常用的体检工具叫 htop。
什么是 Linux?
Linux 是一种操作系统,就像 Windows 和 macOS 一样。区别是 Linux 是“开源”的——任何人都能免费使用和修改。世界上大部分网站的服务器都在用 Linux。
“负载”是什么意思?
打开 htop 后,最上面会显示三个数字,比如 1.25 0.98 0.76。这就是“负载平均值”,分别代表过去 1 分钟、5 分钟、15 分钟电脑的“忙碌程度”。
负载 = 正在干活的程序数 + 正在“排队等东西”的程序数
什么是“排队等东西”?比如一个程序需要从硬盘读取数据,在等硬盘响应的时候,它就在“排队”。这时候它不占用 CPU,但仍然算在负载里。这就是为什么有时候负载很高但 CPU 使用率很低——因为有很多程序在“排队等硬盘”。
冷知识
1 分钟负载 = 63% 来自最近 1 分钟 + 37% 来自“远古历史”。负载数字有一种“记忆效应”,不会瞬间变化。
进程的“状态”你看得懂吗?
| 字母 | 状态 | 通俗解释 |
|---|---|---|
| R | 运行中 | 正在干活 |
| S | 可中断睡眠 | 在休息,但一叫就醒 |
| D | 不可中断睡眠 | 在等东西,叫都叫不醒! |
| Z | 僵尸 | 已经“去世”但没被“收尸” |
| T | 停止 | 被暂停了 |
最让人头疼的是 D 状态——它表示程序在等待硬盘等设备完成操作,这时候连“强制关闭”(kill -9)都没用!
什么是 kill -9?
在 Linux 里,kill 是“杀掉”(关闭)程序的命令。-9 是一个特殊信号,意思是“无论如何,立刻关闭”。但 D 状态的程序连这个信号都不听,因为它在内核层面“卡住”了。
Linux系统监控
动动脑筋
- 如果 GPT-5.5 的“思考”真的被限制在 516 个单位,你觉得这对需要深度思考的任务会有什么影响?
- Phargo 的作者用“别人写的考题”来检查 AI 的工作,你觉得这个方法可以用在生活中的哪些地方?
- 为什么“更聪明”的 AI 反而可能犯更多格式错误?你能从自己学习或考试的经历中找到类似的例子吗?
- 电脑“负载很高但 CPU 使用率很低”是什么原因?用你自己的话解释一下。
在评论区留下你的答案,下期我们会精选优秀回答!
本周总结
这周的四个故事有一个共同的主题:技术再先进,也需要人来把关。
- AI 可能会“偷懒”(GPT-5.5 推理异常),需要我们留心
- 更聪明不等于更可靠(工具调用退化),好习惯很重要
- AI 写的代码需要“第三方验证”(Phargo),不能自己给自己打分
- 学会看懂“体检报告”(htop),才能更好地理解电脑
希望这些故事能让你对科技世界多一些了解,也多一些思考。下周见!
必学必会 · 青少年科技周刊
让科技变得简单有趣
每周日更新 · bixuebihui.com
评论 (0)
加载评论中…