[Topic DIscussion] 智谱开源的GLM-5.1到底有没有这么猛?
Tofloor
poster avatar
流星追月
deepin
7 hours ago
Author

智谱开源的GLM-5.1以744B参数和40B激活规模,零人工介入构建完整Linux桌面系统,性能超越GPT-5.4和Claude Opus 4.6。

核心内容:

  1. GLM-5.1自主构建4.8MB完整Linux桌面系统
  2. 655轮优化实现向量数据库6.9倍性能提升
  3. 1000多轮迭代为50个AI模型实现3.6倍加速。
  4. GLM-5.1并非只能跑跑简单的Vibe Coding小案例,它专门面向长程任务设计,能持续地自主规划、执行并迭代,最终交付完整的工程结果。

两个官方演示,直接把“长程任务”的能力具象化了:

在向量数据库的调优任务中,GLM-5.1没有人类手把手教,自己跑了655轮迭代——测试、分析、改代码、再测试……最终把性能硬生生提升至3.6倍。

它还靠着一张架构草图,连续自主工作了超过8小时,执行了1200多个步骤,最终输出了一套功能完备的Linux桌面系统。官方测算,这相当于一个4人小团队连轴转一周的工作量。

这个“8小时不间断工作”的纪录,让它成为了全球首个在真实工程任务中验证这一能力的开源模型。

这意味着,那些过去只属于人类团队的复杂、长周期工程级任务,现在对逐渐AI也敞开了大门。

看了最近的资讯,我都好奇上天了,这么伟大的AI智能体,是不是deepin开发组最有发言权?让AI构建treeland框架渲染不就完了?顺带把DDE也跑顺了,设置参数和规范要求、目的,让智能体跑出一个完美的treeland框架出来不就完了吗?还能证明智谱有没有吹牛X?你们是最好的证明者。

会编码的,大家可以聊聊,有这么神奇吗?

Reply Favorite View the author
All Replies
135******60
deepin
4 hours ago
#1

我的观点是:

目前所有的大模型都不是真正的agi,存在能力边界,在翻译、分类、识别这些方面比较强,但是逻辑推理能力是比较欠缺的。目前表现出来的智能,更多的是一种拷贝,本质上是根据现有的解决方案(预训练的数据集)中找出最合适的。

当然,这种抄袭能力已经比大部分人类要强了,但是它无法解决真正的问题。

比如,所有的大模型都吹嘘自己能力如何强大,但是给出的示例都是目前解决方案的,比如Linux、向量数据库等等,而训练大模型本身还是需要人的智慧,因为这是真正的创新,而这是大模型所无法做到的。

Reply View the author
流星追月
deepin
4 hours ago
#2
135******60

我的观点是:

目前所有的大模型都不是真正的agi,存在能力边界,在翻译、分类、识别这些方面比较强,但是逻辑推理能力是比较欠缺的。目前表现出来的智能,更多的是一种拷贝,本质上是根据现有的解决方案(预训练的数据集)中找出最合适的。

当然,这种抄袭能力已经比大部分人类要强了,但是它无法解决真正的问题。

比如,所有的大模型都吹嘘自己能力如何强大,但是给出的示例都是目前解决方案的,比如Linux、向量数据库等等,而训练大模型本身还是需要人的智慧,因为这是真正的创新,而这是大模型所无法做到的。

我不会编程,来问问会编程的,说的很中肯,茅塞顿开的感觉,谢谢!

Reply View the author
WangZhongyun
deepin
4 hours ago
#3

难道自动把有问题的程序包修改好了?只是选择比较好的包来组装差不多,这些包里的问题还待应用环境中发现后修正

Reply View the author