简评:什么都想做就是什么都做不好
AI Browser、Agent OS、Canvas 这些都是被说烂了的概念,但是试用一圈下来没有几个是真正实用的
Flowith 团队我很早就在关注,因为当时做画布的很少,而且分支问答这种形式对我特别有用,因此也用了一段时间,但是一旦问答数量变多,画布就会特别卡顿,而且可能是 Flowith 后台有什么 Bug,发出去的问题经常被卡掉,还扣积分,客服在 Discord 上回了一两次之后就再也不理我了,导致我直接弃用了
最近看见 Flowith 发了 OS,又正好在 B 站上看见 derek 发了视频+邀请码(是的我一直关注他),就下载 OS beta 来体验了一下,结果是令人失望的:
测试了简单任务:“Codex 最新版本是哪个?”,正好是昨天发版,按理说 Google Search 第一页就是,既有官方的 Release Note 又有 Github Release,不应该找不到,结果还是翻车了(图 1)
稍微复杂任务:“调研 codex 两个月以内的 release note 中有哪些功能上的变化(用户可感知)”,有是大翻车,首先,这次他就找到了 10.30 的更新,为啥上一个问题就找不到,其次信息太少了,感觉完全没有跟网页互动(比如点开对应的 release note 看内容)(见图 2),反观 Atlas,信息又全又好,准确的按照 “两个月内” 这个限制搜集并且汇总了信息,只能说差距还是太大了,体验配不上营销
现在这个时代,人人都宣传自家的 Agent 是 SOTA,人人都要自建 workspace 来包揽用户的所有 context, 但是真正能用体验留下用户的有几个?
Flowith OS 上的 Agent Guide 倒是做的很漂亮(他们做 UI 一直不错)(图 4),还提到一个概念叫 “Self-Evolving”,但我想说的是,我是在用产品,而不是养娃,我没空等你 evolve,我也不乐见把一个半成品端上来浪费我的时间。Flowith 团队应该花更多时间在用户体验而不是宣传上(甚至不是 UI 上),不然等潮水褪去,才知道谁在裸泳。
Tips:图 5 声称 Flowith Neo OS 达到了 Near-Perfect 的效果,我只能说咱们的 Benchmark 实在是太局限了
Tips - Tips:图 6 是 Agent Guide 最底下的小字?合着不但营销向 -- 学习,连海报也学?建议再加一句话:“Near-Perfect 是我们的目标”