[life feelings] 将AI agents 纳入软件开发将是该领域历史上代价最昂贵的错误之一
Tofloor
poster avatar
说书人
deepin
13 hours ago
Author

作者断言,将AI代理(AI agents)纳入软件开发将是该领域历史上代价最昂贵的错误之一。AI代理并非真正的程序员,而是高度复杂的统计模型,旨在模仿编程代码的分布特征。其产出的代码虽然看似正确,却存在隐蔽的缺陷,且随着模型精度提升,这些缺陷愈发难以察觉。

作者曾试图驳斥这一观点,将其归咎于自身对编程身份的自我价值焦虑,并在过去六个月中积极尝试使用AI代理:包括用其编写tinygrad部分代码、逆向USB转PCIe芯片等。然而实践表明,尽管AI能在初期快速推进,但在细节打磨阶段却如同“老虎机”般不可靠——需要不断拉动拉杆祈求好运,却永远无法真正完成收尾。作者认为,若手动完成,结果往往更好更快。

作者强调,AI并非毫无用处——作为搜索引擎的替代品或快速搭建原型的工具时,它效率极高。但将其视为软件工程师则远未达到合格标准。关键在于区分使用场景:适合快速验证概念,不适合追求质量的工程交付。

在组织层面,AI代理对大型机构的伤害将远大于高绩效个人或小型团队。高绩效者具备自我纠错能力,能够识别AI生成的“垃圾代码”(slop),并会仔细审查每一行。而大型组织反馈循环慢、目标对齐度低,底层绩效者缺乏这种自我检查,反而借助AI产出大量低质代码。这将导致组织平均产出质量下降,世界进入“垃圾代码的黄金时代”与“优质代码的黑暗时代”。

作者指出,人类观察人工制品时会默认其创造者具备人类心智状态,从而通过语法、结构等外在特征判断质量。但AI的生成机制完全不同——它可以在统计上精妙却在逻辑上崩溃,使传统的质量判断基准失效。当人类试图以自然方式与之交互或在其基础上构建时,这种差异就会暴露无遗。

作者最终认同LeCun和Marcus的观点:当前的LLM永远无法真正掌握编程,因为编程需要世界模型(world models)而非单纯的强化学习验证(RLVR)。真正的编程代理需要理解世界运作机制,而非仅学习统计模式。这个时代真正的故事,将是看谁能避免在“AI狂热”(AI psychosis)中自我伤害。

The Eternal Sloptember | the singularity is nearer

编程 Agent 可能是软件开发史上最昂贵的错误之一

Reply Favorite View the author
All Replies
avatar
wlly-lzh
deepin
11 hours ago
#1

Agree With George Hotz!

Reply View the author
avatar
(τ)
deepin
11 hours ago
#2

滥用AI编程,会放大技术债务

Reply View the author
avatar
Feelup
deepin
10 hours ago
#3
(τ)

滥用AI编程,会放大技术债务

需要还的才叫债务😏

Reply View the author
avatar
lon
deepin
3 hours ago
#4
Feelup

需要还的才叫债务😏

精辟

Reply View the author