试图使用 Fellou 给我答降临派的 50 道题,体验拉跨
1. 找不到题目位置。答完两道题,下拉找第三题,向下拉滚轮拉到了 27 题,截图识别,找不到,回到第一题,再识别,再找不到,再滚轮到 27 题。死循环一直到不了位置。
2. 答题会答错。这可能是 agent 里最简单的事情,但还是答错了。
全球首个智能 Agent 浏览器,通过 Deep Action 技术自动化复杂任务,提供免手动研究、工作流自动化的操作体验。
试图使用 Fellou 给我答降临派的 50 道题,体验拉跨
1. 找不到题目位置。答完两道题,下拉找第三题,向下拉滚轮拉到了 27 题,截图识别,找不到,回到第一题,再识别,再找不到,再滚轮到 27 题。死循环一直到不了位置。
2. 答题会答错。这可能是 agent 里最简单的事情,但还是答错了。
刚发布2.0版本时候做了完整的测试,当时正好要做一个场景,快速收集一个领域内的各个岗位薪资信息等HR基本信息,做挖人情报。
基本是对标影刀搭建rpa来看,因为fellou打的点是浏览器的硬核操作。
实测发现几个点
1 对需求可以自动整理为表格级别的爬虫格式
2 可以自动进一步分策略,按照地区,按照行业进行分析,额外的功能不错
3 任务完成度,表格这个场景不太稳定,第一次跑的不错但是只能抓取第一页信息,想再复现发现能抓取的数据信息一下少很多,并且持续出现掉线重登录情况。
4 作为控制浏览器的定位有点尴尬,似乎想要成为浏览器,但是一操作就没法做其他事情,也没有rpa操作更精准
我的产品借鉴
1 如果产品野心大,试图抢占用户的一个完整操作界面,需要在关键能力上满分,比如早期cursor刚出来时候就会平替IDE,因为基础代码在上面写是满分。
2 精细控制这件事不好做,但是垂直领域在每个操作点都可控,就有机会进入专业级产品的平替,比如Claude code 就是生切入了命令行这个最基础的环境,并且对每个文件可操作,可重构。
- 研究场景下,相比于deep research或者其他web内chatbot能快捷登录更多账号,信源增加,但最终output有点形式大于内容的感觉(点赞结构化输出,但是希望信息整合能力再提升一步,Comet这点就做得不错)
- agent执行能力目前边界有限,稍微复杂一些的需求不太能跑完或者不支持
产品我是好评的,包括Fellou还专门联系过我做过产品调研,能感受到它们的热情。但以下视角写于fellou刚发布测试时,主要是吐槽和挑战:
按照 Fellou 创始人的说法,agent 用本地浏览器对比用云端虚拟机的好处是两个:
1.context(各种浏览记录之类的 )
2.需要账号登录的场景,虽然虚拟机也能登录用户账号,但用户肯定会有更高的心理负担。
我实际的体感里第一点目前用 Fellou 和 Manus 没有什么大的体验差别,反而实际体感上 Dia 对网页 tab context 的处理很强;第二点的话,反正 manus 要登录小红书我也是痛快给它扫码登录的。
其实背后可能有两个更深入的判断,一个是 context 的重要性,这点我觉得是毋庸置疑的,但问题是用户到底怎么用 Fellou?是真的会把所有需要浏览器的场景都迁移过去呢?还是只会当一个单纯的 agent 来用?没有数据不好判断,但我自己是后者,因为单纯作为浏览器 Fellou 并没有足够说服我从 Chrome 迁移过去的理由。
另一个问题其实是 通用 agent 到底用来做什么?目前其实真的有 PMF 的在我看来只有 deep research+一些轻度形式化的工作,那么有没有个人账号其实所谓不大。
以下更新于体验了2个月后的某天:
今天用 Fellou 和 Manus, OpenAI deep search 同时跑一个任务的时候突然领悟了:其实 Fellou 好像不应该用来干这个,而是应该去跑那些跟个人信息更相关的工作(比如结合飞书的浏览记录做个日报之类,结合腾讯会议页面把会议记录批量download下来等等)。至于说它不适合 deep research,是因为在本地刷刷刷开网页这个事对我来说没有任何价值增益,反而就是觉得很干扰手头别的事,另外还经常留几个网页下来,这是 AI 开的,我并不需要啊(注:这点最新版已经改了)...
用fellou基本上是做一些研究(横向也会用模型的deepresearch功能,更有优劣),以及翻页重复性质的动作,简单操作步骤的任务可以完成,但是复杂的比如需要持续在一个主页面里点击翻页然后复制到excel里的话,效率会比较低(比如打开excel花的时间就比较长)。个人还是比较期待computer use功能上重复性的简单操作能做的更丝滑
Fellou 的功能非常强大,效果非常哇塞!Agent 规划能力很强,会制定非常高效且详尽的执行计划。能同时开多个网页,并以 视觉 的方式 扫描 网页内容(不是普通的爬虫),所以能获取普通的 AI 搜索引擎无法获取的内容。
产品体验还不错,是一个真正能产生价值的产品,不止是停留在宣传视频里的概念。
做的不错的:
1. 执行一个调研任务时,会先制定出执行的步骤,并让用用户进行 check,提升了任务执行的效果
2.action 能力,能登陆用户自己的账号,进行相关内容的查找。
做的有待改进的:
1.每次调研都默认生成一个网站,网站看起来酷炫,但并不实用,既浪费了我的 token,又让信息的实际内容有减损,可以让生成网站的功能变成一个附加项,不是默认项
2.action 的效率和价值有待提高。一是基于模拟人类行为的 action 行为效率较低,没有充分机器的优势,二是搜索到的信息质量缺少甄别,比如可以考虑预制一些筛选逻辑,比如优先查看近一段时间,热度评论数超过 xx 的内容
让人有一些担心的:当 fellou 登录了我的小红书,淘宝,我的隐私该如何保证,怎么给用户安全感是一个值得思考的问题
文科生生产力工具?️https://mp.weixin.qq.com/s/9gVB_g6ul6b2sya6rbEczg
迭代速度特别快,我参加黑客松全靠fellou,帮助我做了以前很多想但做不到的事,特别推荐创始人谢扬在2025外滩大会上的分享致敬互联网自由精神!Fellou AI:让浏览器从‘浏览’变‘执行’,你做生活的创造者
Dia vs Fellou
从 Edge 切换到 Dia 已经快两个月了,今天也快速使用了一下 Fellou。
** 技术理念上,两者一致 **,都需要为 AI 重构浏览器 Dia 使用了 ADK,Fellou 使用了 Eko(这个框架去年就开源了),从底层让 LLM 能够去无缝的操控浏览器;
** 但是在产品设计理念上,两家相反。** Dia 的一切都很舒服,丝滑,AI 的功能隐藏在了智能光标里,智能藏在隐密处; 而 Fellou 很炫技,AI 执行的时候会有 RGB 光效,在运行 Workflow 的时候会显示 browser use 的定位元素界面,让你知道 AI 在干活;
在新手入门上 Dia 因为在注册登录时候直接同步了 edge、chrome 的数据和 cokkie,所以我的所有信息都很好的被继承,包括常用网站的登录状态,这就让我无缝切换。** 而 Fellou,UI 设计就感觉很锐利 **,上来的新手指导让我无所适从,想把它的用法和理念一下子交给我(再加上大段的英文,算了菜就多练) ;
Dia 也有让我不爽的点,没有垂直标签页。因为工作需要,我会开很多很多网页,对应我的不同线程,而且都是长时任务,可能几天几周都不会关,这就导致我经常找不到网页; Fellou 有 Group 的设计,类似以前 edge 里的工作区、分组(我很喜欢 edge 这个设计),是我会常用的功能 ;
从智能的设计上,Fellou 跑在了 Dia 前面。 Fellou 展示的 Workflow,囊括了 Dia 在宣传片里展示的,但目前 Dia 还没有发布这些功能,Fellou 可以跑了,虽然看着卡卡的,有时还会失败,但已经让我们能感受到,未来一种新的交互方式: ** 在浏览器里给 AI 下指令,AI 在影子浏览器中自动执行完成任务 ;**
** 我很看好 AI 浏览器的未来 ,因为他给 AI 提供了一个重要的组件:环境,而且是有丰富的 context,让它成为了 Agent。 就像为什么 Coding Agent 产品的井喷发展,IDE 是有丰富的环境信息,也有可靠的评价标准:代码能正常运行。 AI 浏览器也将是如此, 只是这个评价标准,就是校验是否完成既定目标 。**
左图 Fellou 右图 Dia
图1:生成一个 3D minecraft 的场景,里面有游乐场。
执行速度非常快,同样的case,ChatGPT Agent 花了 11 分钟,Fellou 只花了不到 2 分半钟,一个游乐场版本的【我的世界】就建好了,动动嘴皮子,世界任你造。
图2:我想买一台折叠屏手机,帮我出一份测评报告,包括但不限于价格、功能对比、最佳推荐等信息。
不光访问了京东、天猫等电商平台,还访问了科技媒体网站获取专业测评数据,甚至手机了用户评价和口碑信息。
最主要的是,报告的颜值美学非常在线。
图3:在 BOSS 直聘上找到最新发布的前端工程师的岗位(AI 方向),结合对应的岗位描述写一段自我介绍,再通过“立即沟通”将自我介绍发送给招聘者,发送 10 次
顺利执行完成,验证码登录时人机交互丝滑,最后亲眼看着自我介绍发出去的时候,真的很爽,有种自由的感觉。
最近逐渐把deep research的功能从各种各样的工具切到了fellou,主要优势:
1)搜索信息源更丰富,尤其是需要账号登陆的社媒信息浏览器作为载体的优势明显;
2) 大部分任务结果比较准确、内容可用;
3)直接生成可视化报告,总结页、分析图表等非常适合一键分享;
4)整个过程(浏览哪些页面、抓取哪些数据)全程可见,心理上更安心
调取其他应用的能力还比较初级,期待更丝滑的体验
在fellou windows版本刚出来之后,就开始使用了,之前的版本完成任务能好点,但使用了下最新的ce版本,虽然交互上和浏览器靠的更近,但在任务执行上遇到几个问题:
1、任务在执行过程中,很正常的执行,忽然就任务失败了,不是积分不够的那种任务失败,就是忽然的任务失败,也没有自动纠正去执行,这种调研类的任务不知道为什么会失败
2、执行的过程相对于之前的版本,执行速度比较慢,感觉比之前慢了一倍
3、输出的结果来看,看不到与上个版本相比更好的结果
也有几个比较好的改动:
1、不会让本地卡,这个能让这个平台在后台运行了
2、终于有了中文版本
3、交互起来更顺畅了点
要积分的!和Genspark浏览器一样难用,从哪里学的坏,用户用他家浏览器还要做任务得积分才可以维持使用,你干脆空气也收费得了,界面指引也是乱七八糟不明所以,找自己还有多少积分也不好找,我上次评价这是一坨?,现在仍要维持原判,不如dia一根毛,浏览器就要方便浏览,这什么玩意给用户添堵,还有什么深度思考和深度行动,这不扯犊子吗?底模用的什么也不知道,基础体验一塌糊涂,浏览器不方便浏览,搞笑呢,发送个官方推荐的快捷任务测试一下,还卡住不干活(图3),积分消耗都不想测了,这不浪费时间嘛,直接卸载!不如dia简洁高效,也不如comet搜索和代理智能,图5又不信邪测了一下,做个任务要用户同意运行,运行过程也比comet慢,长长的思考链太鸡肋,代理能力还行,但是积分必须差评,用一次这个代理56积分没有了,再进行复杂任务岂不是扣的更多,虽然现在做任务又送一些积分,但也不是长久之计啊,积分用完后就是纯一坨了,要积分驱动的才能使用ai功能的浏览器,太他么坑人了,当普通浏览器用我为什么不用edge和谷歌浏览器呢,这就是个圈套啊
记得6/7月的时候,Fellou2.0刚出,企图刷屏,然鹅和1.0一样依旧一堆Bug…..
哈哈 原本以为1.0就很离谱了(特别占电脑运行内存,能卡死的那种
当然这个产品和这个创始人之前是有点火(当然比不上抽象之王明超平),但捧他的估计都没试过产品。
当然,这个没试用到肯定是用户的问题,毕竟之前Fellou1.0的邀请码是真的发不完。
哈哈 Fellou老板的人设也有点意思,走的是95后不善言辞极客风。
本人听过两次,讲真更像是想说但说不好,故而呈现出一种言简意赅云里雾里的感觉。
(最后看到这里的朋友想体验Ai自动化的,推荐阶跃桌面伙伴、豆包超能模式,都比这**玩意好用,还免费)
Fellou这款AI浏览器给我的整体印象就是'勉强可用'的水平,它的能力边界相当明显——只能应对相对简单的需求场景,让我无数次难受的是它的任务拆解能力,面对稍微复杂一点的操作流程时,往往无法准确理解用户意图并将其分解为可执行的步骤序列,就算写的很细在理解意图上也偶尔会出现偏差?麻了。不过,产品设计弥补这个短板,给了大量的二次交互机会,让用户有机会修正AI的理解偏差。这种设计虽然能在一定程度上降低错误率,但也暴露了产品在智能理解方面的不足。在执行层面,Fellou在简单场景下表现还算稳定,基本能够完成预期的操作。但一旦遇到HTML结构复杂、页面元素层级较深或者功能模块较多的网站时,它就会无法准确定位目标元素,对应执行任务上,简单来说就是很多东西没有在浏览器的表面,比如在问他某一栏的细节时,他只停留在表面的简述中,并没有看到旁边还有一个详情按钮,总的来说,Fellou虽然具备了AI浏览器的基本框架,但在核心的智能理解和复杂任务处理能力上还有很大的提升空间,当然毕竟是刚开始做。。也是能理解的
有幸帮助Fellou做海外的推广,同时自己也体验测试了下。
说实话真的觉得2025年下半年会是AI Browser的一波对战。
Fellou整体的体验感还是很丝滑的,不管是帮我做些search调研,还是帮我在Twitter上爬取相关领域的博主并关注,都很完美的搞定。
可能是我的电脑和网速问题,我唯一感受到的问题是速度不是很快,比如twitter做15个达人的搜索和关注,花了我总时长15min+。
期待即将发布的Fellou CE版本!
1253
更新于 2026-05-06