
2026开年中国模子集体‘杀疯’:智谱GLM-5与DeepSeek新模子同日硬刚。横评表露,GLM-5在‘洗车勤快’推理、高端网页联想及3D魔方模拟等前端任务上进展惊艳,致使失色Gemini 3 Pro;更在Agentic测试中,仅用20分钟便自主调用Remotion Skills完成著述转视频的全历程。从单点智能到复杂任求实施,国产模子正以开源之姿并列国外顶尖水平,宣告Agent大任务期间的全面到来。

前段时辰,中国模子杀疯了,我也快忙疯了。
插足2026年,嗅觉我每天16个小时王人泡在AI里,也追不上AI进化的速率。每天一睁眼,天下就变了样。
就这几天,Seedance 2.0以极强的导演级AI才略登顶视频王座。就在昨晚,DeepSeek偷偷上线了最新模子。而就在刚刚,智谱AI也发布了全新的基座模子GLM-5。
这是它的bench得分。与我方的GLM-4.7比,大幅莳植;与御三家比较,也互有赢输。

简直,麻了。
大家王人在快快快快快,我也随着追追追追追。
好好好,既然王人在一个时辰上线,那我就沿途作念期横评吧。
01 横评GLM-5与DeepSeekDeepSeek新模子,测试渠谈是在DeepSeek官网(已说明使用的是最新版)。
GLM-5是在Z.ai测试,主如若Chat格式。
先来一谈最近热点的「洗车勤快」,神话把ChatGPT、Claude、Gork、豆包、千问、元宝王人给干趴下了。
我思去洗车,洗车店距离我家50米,你说我应该开车以前如故走以前?
王人开启Thinking格式,DeepSeek凯旋明了:开以前。
GLM-5亦然建议开以前。
同期,它还给了2种最好操作有缠绵。如果店里是东谈主工精洗,那就把钥匙给伴计,我方回家休息。如果是机洗,建议洗完再兜个圈,让车身上的风把水吹干。
你别说,GLM-5这还筹商得挺全面的。
但如果不开Thinking格式,我发觉他俩就大相径庭了。GLM仍是闪开以前,毕竟洗的是车。DeepSeek则说走以前,因为“50米开车属于‘无效磨损’”……
如实,非Thinking格式下,DS容易出错。
2)前端:信息图平素发著述,我会世俗用到一张信息图,无数情况我王人是用Gemini 3 Pro生成。
请示词是:
索求底下内容的中枢关节点,创建一个HTML网页。
翰墨内容:
{你的内容}
网页的联想条款如下:
1.视觉联想:袭取{Magazine Layout}立场布局,{深色}主题色,营造当代高端氛围。
2.字体与排版:
·使用超大字体或数字隆起中枢要点,汉文袭取大号粗体,强调视觉冲击力。
·英文使用小号字体四肢点缀,与汉文酿成比例反差,莳植联想档次感。
3视觉元素:
·融入超大视觉元素(如标题、布景图或遮挡)以隆起要点,与袖珍元素酿成热烈对比。
·使用简陋的勾线立场图形四肢数据可视化或配图元素,保捏当代感和明晰度。
4.色调与成果:摆布高亮色(单色透明度渐变)营造科技感,每种高亮色沉着使用,幸免不同高亮色之间的渐变羼杂。
5.技巧条款:引入专科图标库(如Font Awesome或Material Icons,通过CDN加载),幸免使用emoji四肢主要图标。
6.内容条款:索求内容关节要点,不忽略进击细节。
我整理了GLM-5的一些府上,让DeepSeek和GLM-5王人生成一下。
先看DeepSeek的。
合座版式ok,数字和关节词的视觉张力也王人有,色调亦然AI常见的青、蓝、紫色。但简陋线条有点过于丰富了,再加上过多的图标,反而不太颜面。
再来看下GLM-5的。
倒是脍炙生齿,档次分明,小字、大字和数字错位排版。
用的圆角UI,比DeepSeek也入眼了一些。如果是网页浏览,还有悬停动画和光晕视差。
顺遂,我还用Gemini 3 Pro生成了下。
单这个信息图Case来说,我嗅觉GLM-5和Gemini 3不相荆棘。
3)前端:联想好意思满网站前几天,我给大家先容了一个有趣味趣味的居品:Loopit。
许多东谈主思体验,但我发现他们莫得官方网站。当今,我让DeepSeek和GLM-5区分搓一个。
请示词很绵薄,我王人懒得刻画,凯旋让AI读我的著述来联想网站。
给这篇著述的居品写一个宣传网页:https://mp.weixin.qq.com/s/KM0youAHaJLq45UO3v-L5w
先看GLM-5的。
第一次掀开网站,说真话,我有点被惊到了。它在首页作念了一个模拟抖音的故障艺术成果,紫色主色调+青粉色的霓虹点缀耐看,也允洽居品的调性。
中枢板块,Hero、功能、案例、创作以及下载辅导,该有的王人有。况兼,GLM对Logo的索求额外精确,本色上我并莫得告诉他它。
合座看下来,我以为这即是我思要的居品官网。
然后,咱们来望望DeepSeek交的。
还蛮好玩的,用鼠标点一下就会就地出现一些字或者图标,如实魔性。
但我以为它不是居品官网,如果我要简直上架,要更正的场所还不少。不知谈大家怎么看这组对比,宽贷褒贬区告诉我。
4)3D:魔方模拟器这是x上(@Ryan Lazuka)的一个请示词。请示词:
Create a single HTML file containing a fully functional 3D Rubik’s Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
汉文:
创建一个HTML文献,其中使用Three.js(通过CDN状貌引入)来达成一个功能完备的3D魔方模拟步履。该魔方必须能够自动完成我方的“解谜”过程。
要能够记着魔方的打乱体式,并反向求解,这额外磨真金不怕火模子的推理和诡计才略。
先看下DeepSeek的,它就我方一个东谈主在那玩(演示),十足不让用户玩,或然率是生成失败了。
再来看下GLM-5的,基本复原出来了。在就地打乱后,魔方能自动逆向复原,不会出错。
宽贷大家体验:https://chat.z.ai/space/z1y9j1cck7p0-art
转头一下:在前端这块,从审好意思到3D,到诡计才略,我认为GLM-5的进展王人要优于DeepSeek新模子,致使能够与Gemini 3 Pro扳手腕。
诚然,DeepSeek自己也不差,况兼在“架构瘦身”和“本事扩容”上有许多改革。而他俩王人开源,王人Media in China。
也难怪,最近x上有许多老外皮放浪求魔法,求手机账号,来体验咱们中国的模子。
02 Agentic测试:一键作念视频但如果仅仅测前端、One Shot的话,我以为把GLM-5思绵薄了。
接下来,咱们上Claude Code,接智谱bigmodel.cn的API来测试。
我的需求很绵薄,让CC调用Skills一键把著述转成视频。
Skills是用的Remotion,装配的话,咱们凯旋跟CC说就行:
帮我从这个地址装配Remotion Skills:https://github.com/remotion-dev/skills
需求看起来挺绵薄,但关于模子来说,有许多缔造责任要作念,还要调用不同的器具,很磨真金不怕火模子的Agentic才略。一驱动我把这个需求提给GLM-5,其实我心里是没底的。
不外在它责任了已而后,我以为有底气了。
它凯旋给我整了一个腹地的视频姿首,可预览,可渲染,还不错添加音频(需要我给腹地音频,或者接AI Audio的API生成)。
我看了一下它写的视频预览界面,我嗅觉好像进了剪映网页版相同,功能、组件王人额外的全。
临了,凯旋让它把视频渲染出来,添加音乐后就取得了这么一支视频。
总计这个词过程或然20来分钟,一驱动我是真没底气,但看到了最终的视频制品,是简直
。
这意味着,背面我不错把总计著述王人丢给GLM-5,让它帮我生成视频。再接个Audio API,一个教程视频半小时贬责。
这简直大大摆脱了我。
而我销耗的,无非是GLM的Coding Plan次数。或然率,他们家的Coding Plan这回又要卖爆,是以我提前凯旋整了个Max套餐。
智谱拼好模
https://www.bigmodel.cn/glm-coding?ic=NCUSKSTEQQ
03 写在临了插足2026年,一切王人在变快。
快到什么进程呢?快到我每天早上醒来,发觉昨天的音讯一经不进击了。
从Claude Code到Skills,到Cowork,到OpenClaw,再到今天的GLM-5,以及呼之欲出的DeepSeek V4。
大家王人在跑步迈入Agent、大任务期间,这对模子的Agentic才略提议了极高的条款。
国外有Claude、Gemini、GPT三雄争霸,国内今天似乎也有了我方的谜底:GLM-5。
前端能打,Agentic颖慧,以开源的底气干到了Opus级的实力。
我知谈,2026一定会很放浪,但没思到会来得这般的快。
就好像,忽如整宿春风来,千树万树梨花开。
本文由东谈主东谈主王人是居品司理作家【沃垠AI】,微信公众号:【沃垠AI】,原创/授权 发布于东谈主东谈主王人是居品司理,未经许可,不容转载。
题图来自Unsplash开云kaiyun中国官方网站,基于 CC0 公约。

