智谱开源的GLM-5.1到底有没有这么猛？- Community

[Topic DIscussion] 智谱开源的GLM-5.1到底有没有这么猛？

deepin Talks 73 views · 3 replies ·

流星追月

deepin

3 hours ago

Author

智谱开源的GLM-5.1以744B参数和40B激活规模，零人工介入构建完整Linux桌面系统，性能超越GPT-5.4和Claude Opus 4.6。

核心内容：

两个官方演示，直接把“长程任务”的能力具象化了：

在向量数据库的调优任务中，GLM-5.1没有人类手把手教，自己跑了655轮迭代——测试、分析、改代码、再测试……最终把性能硬生生提升至3.6倍。

它还靠着一张架构草图，连续自主工作了超过8小时，执行了1200多个步骤，最终输出了一套功能完备的Linux桌面系统。官方测算，这相当于一个4人小团队连轴转一周的工作量。

这个“8小时不间断工作”的纪录，让它成为了全球首个在真实工程任务中验证这一能力的开源模型。

这意味着，那些过去只属于人类团队的复杂、长周期工程级任务，现在对逐渐AI也敞开了大门。

看了最近的资讯，我都好奇上天了，这么伟大的AI智能体，是不是deepin开发组最有发言权？让AI构建treeland框架渲染不就完了？顺带把DDE也跑顺了，设置参数和规范要求、目的，让智能体跑出一个完美的treeland框架出来不就完了吗？还能证明智谱有没有吹牛X？你们是最好的证明者。

会编码的，大家可以聊聊，有这么神奇吗？

Reply Like 1 Favorite View the author

All Replies

135******60

deepin

an hour ago

我的观点是：

目前所有的大模型都不是真正的agi,存在能力边界，在翻译、分类、识别这些方面比较强，但是逻辑推理能力是比较欠缺的。目前表现出来的智能，更多的是一种拷贝，本质上是根据现有的解决方案（预训练的数据集）中找出最合适的。

当然，这种抄袭能力已经比大部分人类要强了，但是它无法解决真正的问题。

比如，所有的大模型都吹嘘自己能力如何强大，但是给出的示例都是目前解决方案的，比如Linux、向量数据库等等，而训练大模型本身还是需要人的智慧，因为这是真正的创新，而这是大模型所无法做到的。

Reply Like 0 View the author

流星追月

deepin

43 minutes ago

135******60：

我的观点是：

当然，这种抄袭能力已经比大部分人类要强了，但是它无法解决真正的问题。

我不会编程，来问问会编程的，说的很中肯，茅塞顿开的感觉，谢谢！

Reply Like 0 View the author

WangZhongyun

deepin

40 minutes ago

难道自动把有问题的程序包修改好了？只是选择比较好的包来组装差不多，这些包里的问题还待应用环境中发现后修正

Reply Like 0 View the author

Featured Collection

Change

Popular Ranking

Change

Popular Events