TL,DR: 目前可用性最好的 Agentic Browser 。基于 Chromium 内核保证了浏览器基础功能的完善,同时类似于其他浏览器插件形态的 Sidecar 侧边栏降低了用户初次上手的成本。
Warning: 需要特殊网络环境才可正常使用,否则仅能拥有正常的网页浏览功能。邀请码数量受限,一人仅限两码可分享。
Comet 的其他优点看别的评论应该能了解,作为内嵌 AI 功能的浏览器来说这也都是基础能力了。但 Comet 和其他加入了 AI 侧边栏功能的浏览器有什么区别?区别在两点。第一点就不用说了,深度捆绑 Perplexity 作为其 AI 能力的来源,在不同深度的提问中可以自由切换 Search 和 Research 模式。而第二点很多人其实并没有在意过,那就是 Comet 的 Assistant 模式(或者说 Agent 模式)。
Perplexity 对于 Agent 模式的调用其实很保守,在你没有明确要求使用 Agent 帮你完成任务的情况(或者 AI 认为这个任务并不长,你自己也可以做的情况下),Agent 不会尝试主动接管你的标签页并代你执行操作。这点是非常好的,既能减少误触发带来的用户不适,也能保证用户获得回答的速度。
目前 Perplexity 的 Agent 模式似乎没有视觉能力,更多的是从页面文件分析并决策,所以可能会出现一些“人类看上去很明显,但 AI 读不懂的按钮”。但一般来说,常用网站还是能读懂的,小众网站(或者无障碍支持较差的网站)可能需要手动处理。(Comet 不支持在 Agent 行动的过程中让用户干预标签页内容)。
其他触发 Agent 模式的方式有,但不多。另外一种就是在新建标签页的界面手动提及多个标签页并明确要求行为。比如选中多家不同的电子邮件服务提供商,让 Comet Assistant 去代你浏览并总结近期未读的新邮件,这个时候 Comet 会在后台去浏览,你同样无法干预其行为,只能通过一个偶尔刷新的小窗口来 “观察” AI 的动作。
Agent 模式目前唯一的缺点是在终止 Agent 接管标签页之后,回答也会被一并终止,而不是类似 Cursor 一般提示说我的这个操作被用户终止了,目前我了解了什么信息并继续完成。