135******60
deepin
an hour ago 我的观点是:
目前所有的大模型都不是真正的agi,存在能力边界,在翻译、分类、识别这些方面比较强,但是逻辑推理能力是比较欠缺的。目前表现出来的智能,更多的是一种拷贝,本质上是根据现有的解决方案(预训练的数据集)中找出最合适的。
当然,这种抄袭能力已经比大部分人类要强了,但是它无法解决真正的问题。
比如,所有的大模型都吹嘘自己能力如何强大,但是给出的示例都是目前解决方案的,比如Linux、向量数据库等等,而训练大模型本身还是需要人的智慧,因为这是真正的创新,而这是大模型所无法做到的。
Reply Like 0 View the author


中文 
智谱开源的GLM-5.1以744B参数和40B激活规模,零人工介入构建完整Linux桌面系统,性能超越GPT-5.4和Claude Opus 4.6。
核心内容:
两个官方演示,直接把“长程任务”的能力具象化了:
在向量数据库的调优任务中,GLM-5.1没有人类手把手教,自己跑了655轮迭代——测试、分析、改代码、再测试……最终把性能硬生生提升至3.6倍。
它还靠着一张架构草图,连续自主工作了超过8小时,执行了1200多个步骤,最终输出了一套功能完备的Linux桌面系统。官方测算,这相当于一个4人小团队连轴转一周的工作量。
这个“8小时不间断工作”的纪录,让它成为了全球首个在真实工程任务中验证这一能力的开源模型。
这意味着,那些过去只属于人类团队的复杂、长周期工程级任务,现在对逐渐AI也敞开了大门。
看了最近的资讯,我都好奇上天了,这么伟大的AI智能体,是不是deepin开发组最有发言权?让AI构建treeland框架渲染不就完了?顺带把DDE也跑顺了,设置参数和规范要求、目的,让智能体跑出一个完美的treeland框架出来不就完了吗?还能证明智谱有没有吹牛X?你们是最好的证明者。
会编码的,大家可以聊聊,有这么神奇吗?