产品是好产品,但我为什么打差评,因为不透明、不稳定:计费方式不稳定、效果不稳定。
在评价之前,我要先讲讲我用cursor的故事,当然,纯手打,没有AI润色。
我从2024年12月开始用cursor,那时候的sota模型是claude3.5和gpt-4,Gemini还在吊车尾,n8n还对AI兼容得不够好,我还在用dify, 最好用的AI coding工具是github copilot, 我还为此付了六百多块钱。
24年12月的时候忘了因为什么原因用上了cursor,好像是AI coding火起来了,大家都在尝试用AI写项目。当时我有一个需求,是自己的github 点了star的项目太多了缺少管理,有个叫astros的php项目用了一段时间但是停止维护了。有时候完全可以在自己的git stars里去搜索,但是还要去查关键词找项目,看了半天发现是自己点过star的。于是要自己写个github star management,但是不会写前端,也不会js。
在cursor的帮助下,大概2个工作日晚上,用完了免费额度搓了一个原型,前后端都用cursor写的,代码我能读懂逻辑但是改不了一点,一次tab功能都没用过,我很满意,然后付费开了1个月。(图1)
在接下来的一个月(实际是3天) 里饱受vibe coding的折磨,我真傻,真的,我单知道AI 写代码强但是改代码不行,没想到竟然如此多的“you are absolutely right”然后写一坨屎山。
于是我在强忍着恶心修完所有bug之后,结束了vibe coding。(图2)
虽然后半段体验很糟糕,但是不得不说这一套纯AI构建的系统工作得还蛮稳定的,我用了半年多,直到想要前端重构。
这时候是今年八月份,deepseek早已沉寂,gemini 2.5 pro和 sonnet 4 左手长上下文、右手代码生成,打得是风声水起。gpt此时最强模型还是O3和4.5,差点意思。
AI coding江湖也是硝烟四起,主打前端的V0,声名鹊起的claude code,跟风的gemini-code/qwen-code ,号称透明的windsuf,甚至字节的trae,还有各家AI coding vscode插件比如kiro code,以及jetbrains也下场做AI coding了。 我记得好像腾讯的codebuddy也是这段时间的,我还写了个评价。
得益于lenny‘s newsletter的年费订阅,我同时有v0和cursor的pro,还要感谢社区的公益站,让我免费用上了claude code,gemini 大善人更不用说,没在gemini上花过钱,以及注册就送200次使用的kiro code。
这个时候用AI产品用得多的我肯定是涨经验了,用社区评价好的v0来优先做前端设计,然后再优化。
我又犯了一次错误,我单知道AI模型不可同日而语,AI产品也是日新月异,但是我不知道它还是不擅长修bug,v0.dev 5刀做出满意的原型,20刀都没修完1个bug。
于是拖着没修完的bug同时去找cursor和claude code,虽然已经是claude4.0时代了,但是项目也变大了,cursor调了半天才勉强通过引入另一个bug来修这个bug,但是Claude code很快啊,一个左正蹬,一个右鞭腿,它连npm run dev都不执行,就修好了,当时我是惊为天人。
但是由于命令行不好管理文件,我就在cursor的命令行里运行cc,看着cursor来建设,cc来修bug,牛骑着马,也是两三个工作日晚上就完成了。(图3)
从此我爱上了claude code,虽然现在还没折腾明白mcp的配置。
故事讲完了,到评价部分了。
cursor的优点:
1. 先发优势,在AI coding还不火的时候把这方面做到了当时的极致,可以说是vibe coding的奠基者了
2. 模型更新快,新模型上了就猛猛跟进,我记得gpt-4.5刚上的时候还免费提供一个礼拜使用
3. 偶尔大方,比如试用、edu之类的,社区的人薅到了羊毛给大伙送温暖
4. 功能全面,毕竟基于vscode改的,该有的都有。
缺点:
1. 模型的前置提示词过于不透明,更新也不说,有时候降智都不知道是厂商降智(参考claude降智事件),还是模型掺水,还是改了prompt(openai/gemini也有过此类情况),当然这是通病,但是cursor套的层级有点多了就不好说。那个时候4.0/3.7/3.5差别没有特别大,所以掺水也说不准。
2. 功能单一,初始设计就是为了写代码,后来大家要求多了,比如写文档、做研究啥的,但是体验下来让cursor去做非代码类的工作就很糟糕,相比之下claude code却是一个通用助手。(补充一下,现在好很多了,图4 的效果我看起来感觉还行)
3. 计费不透明,我到现在都没有一个月清楚我的计费是怎么记的,只有最开始的按次数计算清楚。现在就是用着用着等它什么时候跟我说费用不够了,根本算不了大概还有多少。
4. 形态变化太大,cursor cli 和 cursor app 差了太多,感觉 prompt完全不一样;web版的cursor agent也是一个纯代码助手,代码以外的活都干不了,完全不如最近用的droid。当然这部分体验比较主观,不能提供一个好的例子。感觉cursor是有点没想明白,市场什么热就做什么,也可能主要还是为了蹭热度拿投资吧
总之,感觉cursor从队伍头部变成一个中游玩家了。