用了很长时间才觉得自己有一定的资格来写评价。
Coding是一个很复杂的场景,而我本身写代码的场景并不多,缺少对coding agent进行benchmark的需求,也没怎么实际进行过测试。
在我这里,antigravity实际上并不算是一个足够好用的coding agent,它只能算是一个好用的通用助手,只是恰好把它作为coding agent而已。
在我的理解里,它在做的事情同时是两件:1. LLM act in a loop 2. 尽可能地让人类可以理解、观察和调整这个loop
为什么我这么说,首先要看官方的设计哲学
> Antigravity is our first product that brings four key tenets of collaborative development together: trust, autonomy, feedback, and self-improvement.
> Antigravity是我们首个将协作开发四大核心原则融合的产品:信任、自主、反馈和自我提升。
其次是artifacts
> Artifacts allow for the Agent to asynchronously communicate its work to the user, as opposed to requiring the user to carefully monitor every Agent step synchronously.
> Artifacts允许Agent异步向用户传达工作,而不必用户同步监控每一步。
从设计哲学和功能表达上,整个antigravity都是一种基于“规范”的工具,而不是基于“智能”或者“功能”的工具。
这表现在实际的执行中,就不是cursor那样简单的线性todolist,也不是cc或者其他agent一样你要求它做出的plan/claude.md/agent.md,而是
> AI 可以自己干活,但每一步都要留下“人类看得懂”的痕迹,方便审查
那么在实际体验中,我的感受是:丝滑、流畅、完整、可追溯。
这听起来其实并不像一个coding agent对吧,毕竟我只口不提这个流程对coding有多少帮助,至今为止还不讲上下文、不讲RAG、不讲mcp、不讲skills,因为实际是个人体感是不如cc。
但是,它可以轻而易举地,把一个用户描述,拆成有几十个check项的checklist,然后连续地执行。
这很像一个执行长时间工作的实习生,规范决定了实习生的工作范围,而搭载的模型决定了实习生的聪明程度,我只要review它给我提交的周报做出适当的评价就可以了。
你不能期待实习生给你完成一个复杂的算法任务,但你可以要求它搜集资料、整理并研究,在非常长的checklist下,你完全不用担心它像cursor一样为了省token尽早结束任务。
在免费的opus和gemini3 pro下,这表现得很有吸引力,我感觉到了一种token free的自由,这不是超强学习资源吗,让它爬东西下来,组织整理,给我做成文件索引,然后让我"渐进式学习"。
当然也不能说没有缺点,缺点就是:
喜欢把东西放在artifact里,而不落地
任务一多,artifacts就多,也不好管理
写代码完全看模型能力,这个agent框架本身并没有对写代码有额外的帮助
文档组织能力弱,看起来是提示词中的artifact让它对保持良好的文件结构有一些抗拒
再让我想我就想不到什么缺点了,这是免费的欸,还能对人家要求啥。