我是通过观察评论区得到的邀请码。之前听说“结悦星辰”有一个类似的 Agent 产品,一直很感兴趣;刚好 Kimi 那边给了我邀请码,我在查评里也找到了相关的,就打算试用一下。
我点击安装后,网页端会出现一个小图标,可以进行对话并协助处理网页内容。我写了一个关于“豆报”的评价,并希望小跃(Xiao Yue)在 15 分钟后点击发送按钮。
在使用过程中,我发现了一些需要改进和优化的地方:
1. 授权登录流程:
小跃的 Agent 初始是在沙盒中模拟,需要授权登录。但在授权之前,系统就直接提示任务已完成,只有点进去后才发现需要登录。建议优化这一流程,在执行前明确提示登录状态。
2. 定时任务与提醒功能:
(a) 优点:安装初期会有喝水、久坐提醒,这种关怀健康的设计非常人性化。
(b) 问题:虽然有久坐提醒,但定时执行任务似乎存在 Bug。我设定 15 分钟后发送,结果等了两个 15 分钟(我甚至睡了一觉回来),它还是一直在打圈等待,似乎缺乏一个可靠的时间调用接口。既然能实现久坐提醒,为什么定时任务会卡住,这一点存有疑问。
3. 交互体验:
(a) 输入框位置:一般的 Agent 输入框都在下方,现在调到了上方,连续对话时经常会点错到下方的空白页面,不太方便。
(b) 窗口移动:展开后不好移动,会遮挡正常的页面内容。
(c) 语音输入:在桌面应用上使用时,Typeless 语音输入功能无法正常运行。作为桌面陪伴类产品,语音输入、想法记录和随时唤醒(类似 Siri 或小爱同学)应该是必不可少的核心功能。
4. 网页抓取与任务状态:
我尝试让它抓取网页中点赞数较高的关键词以便分析。结果它一直在不同页面间来回跳转,始终无法成功抓取。页面显示“任务已完成”,但实际上任务一直停留在第二阶段,没有输出任何结果。在现在的 AI 时代,Agent 应该做到直接输出报告,而不仅仅是简单的操作模拟。
目前的体验感觉更像是一个代办事项的雏形,距离真正的“桌面陪伴助手”还有一定的提升空间。 关于桌面 Agent 这种应用的市场空间和产品提升方向,我有几点建议:
1. 提升任务效率与通用化
我觉得首先要做到效率性。系统应该能对通用任务进行总结和分类,尤其在抓取任务中,Agent 应当能根据指令准确识别点击和抓取的位置。
(a) 页面加载、下滑和上传操作需要足够的流畅丝滑,不能影响其他任务的并行执行。
(b) 降低消费成本。无论是 Token 消耗还是时间成本,Agent 应该能真正替代一名实习生的人工,而不是连发送评论这种简单操作都要让人等待半天。
(c) 加强任务拆解。如果 Agent 不能很好地拆解任务、理解意图并定位操作位置,其智能化程度就远远不够。
2. 突破沙盒限制与安全性
目前的沙盒形式导致安全性与可用性之间存在矛盾。
(a) 当抓取行为过多时,容易触发网站的安全警示。
(b) 系统需要解决如何绕过或避免安全拦截的问题,否则任务往往无法产出结果。
3. 回归“桌面陪伴”的本质
可以参考 QQ 宠物这类陪伴型应用,要么提供情绪价值(例如像“元宝”那样幽默的交互方式),要么提供实用的功能辅助。
(a) 情感化交互:支持语音输入/输出和闲聊模式。目前这些功能缺失,甚至切换探索模式、选取上下文对话都需要手动操作,非常不便。
(b) 深度办公辅助:支持随时梳理想法或进行文档处理。目前的任务闭环做得不好,用户本想交付任务后就不再过问,结果点进去才发现还需要二次确认或授权。
(c) 优化文件交互:支持将文件直接拖入,或者由用户指定路径后让 Agent 自行访问,而不是让用户手动上传。
4. 改进交互设计与任务管理
目前的 UI 交互逻辑还需要进一步优化:
(a) 历史记录管理:目前的历史记录只能一直往上翻,缺乏按任务分类的机制。
(b) 新建对话逻辑:不需要在二级菜单点击查看历史后才能开启新对话,建议在主界面直接设置“新建对话”按钮。
(c) 任务提醒功能:目前的任务定时提醒功能做得不够到位,提醒频率和时机都有待优化。
作为一个桌面的助理,不能仅仅停留在整理文件和搜集信息的层面。如何从重重竞品中杀出重围,远不是靠一个悬浮窗就能定义的,关键还是在于产品的人性化和智能化体验。