阶跃桌面伙伴 - 小跃

始终在场,会主动做事的桌面 Agent。...

【产品介绍】

阶跃 AI 桌面伙伴 - “小跃”。它常驻桌面右上角,时刻在线、可以同时执行多个任务。

一句话定位:桌面 OS 级 Agent『小跃』:始终在场,会主动做事。

【产品功能】

小跃连接了本地操作系统,支持查看和管理本地文件、访问互联网、执行复杂任务,支持通过“妙计”复用操作步骤,也支持设置“定时任务”到点自动执行,具体如下:

  • 复杂任务自动化:网页操作、本地文件生成/处理、批量信息获取与清洗。

  • 主动触发:按时间/价格/余票/关键词等条件提醒或自动执行。

  • 无摩擦输入:自动同步当前屏幕/已打开文件,一键传入上下文。

  • 妙计库:把常用指令存成 /动作,个人与团队可分享复用。

? 当前产品内测需要邀请码,可前往瓜棚获取/在讨论区传递~

43 个评论

降临派 小明同学

小跃有些任务做得实在慢,但好在活在干,也干出来了?

P1剧照镇楼!!我主要讲这个case:

使用豆瓣网站,下载《爱情怎么翻译》官方剧照,并按场景分类(自由发挥),下载到桌面文件夹「豆瓣-爱情怎么翻译」

执行结果评价:

  • 小跃在网站扫图官方剧照73张,并按照场景分类,成功保存图片至文件夹

  • 场景分类客观,可惜实际图片和场景有出入(确实有点难为它了)

  • 保存的图片不清晰(实际很清晰)

  • 中途电脑睡眠,任务超过5分钟终止?

其他case体验:

  • 豆瓣扒图好处:无需登录?

  • 小红书既要登录,正文图不给扒,降级方案还不给网页版浏览,相同任务最终失败☹️

  • 油管视频不给扒,需要配置妙计完成(嫌麻烦,直接用其他平替软件)

  • 播客起初不给扒,但是配置了妙计链接P7的「播客音频下载」,轻松完成

  • 妙计「小红书收集」获取10条热贴,轻松完成

  • 整理桌面很快,主要按照文件后缀分类,看到整理完我笑了(以为会读里面的图和内容进行分类)

Anyway,更多继续探索~

蜀查查

牛!!牛!!牛!!!

太牛了!!本人是做数据分析的,实际工作场景,仍会收到很多Excel表,想要分身多线做处理,桌面AI助手确实很有帮助,一句指令解决问题。从做文件处理来看,我的总结如下:

优势:1.调用python,完全不用担心Excel表数据量大的问题,直接保证数据的准确性。

2.可链接邮箱,能直接将结果发送邮箱,很方便。

3.任务执行的结果跟需求是一致的,效率很快。

重点是数据结果是准确的!!这个很重要!!

建议:作为桌面助手,希望实现手机与桌面的互联,类似于clawbot,实现远程手机对话,操作电脑,解放牛马节假日临时发送文件的烦恼。

just say

不是之前我不用,是因为没有win版啊

好的方面就不提了,大家说了很多,从普通用户角度需要改进的地方,以下几个方面来说:

首先,我觉得分chatbot模式和agent模式从直觉上有些问题,不应该让用户来选择,而应该是根据任务难度和提示词意图识别进行路由

第二个是当我使用skills时,这速度感觉有点小慢;以及,添加飞书mcp有点问题呢

第三,咋没有语音输入功能,还需要大家再装一个typeless/小凹

第四,貌似win版还没有全局记忆?

第五,agent一大特性是主动感知和执行任务,貌似此时桌面助手不够主动。但话又说回来,我理解团队的难处,如何把握主动和被动的边界,这个真的很难,也不可能让所有用户都满意。

第六,跳出产品功能本身,感觉这类产品在今明年一定会是大势,但这个产品本身对于大部分用户来说是超前的,你如何让用户习惯你的产品,让他们“心甘情愿”地读取他们电脑中的数据文件,这个成本可能不低(广告推流),也可能不高(先融入某家硬件大厂生态,比如吉利之于千里)。

说些延伸的,他会提醒我久坐和喝水,但真正的提醒肯定是要与真实世界交互的,是一个与“人”本身密切相关的物理任务,因此我想说的是阶跃押注终端方向肯定是没错的,真正懂“你”的贴身助手,一定是一个软硬一体的产品,阶跃+千里,看印奇以及各位后面路线执行如何。

localhost

虽然这个产品我认为是比较新颖、大胆而且有创意的,并且其他厂商(特别是字节)很快就会跟风并且可能超越,但是这个软件目前无法作为生产力,只能作为对自己数据/信息和隐私以及系统稳定性都不那么在乎的人的纯玩具。

同时stepfun目前也没有什么LLM模型和agent上的优势,除非把护城河的audio模型一起放进来,变成语音控制电脑,而不仅仅是纯文本交互

在给好评还是差评的这个问题上,我在写评论的整个过程都在纠结,好是好在它的确是一个有趣的产品形态,差就差在除了产品形态没啥好的地方。

给出这个评价的原因是:
能力表现上分为两个部分

  • 作为chatbot,稍微有点意思,因为有定时任务、特殊提醒这种主动型交互

  • 作为agent,很糟糕,实际上用的还是prompt engineering + mcp + anthropic的office skills +自己的一些prompts 。这意味着本质上是把一个支持skills规范的agent,和浏览器封装在一起,打包成一个chatbot。甚至我到现在也不知道到底是以什么样的形式执行的这个任务。

首先讲讲优点:

  1. 浮动交互还不错

  2. 定时任务和主动提醒 + 简单型的agent + 免费 +mcp 可以做很自动化简单工作流,而提高那些不会写代码或者整不明白自动化的人的能力

  3. 显式管理user memory,这很透明,很能留住长期使用的人

  4. browser use 会录屏

  5. 关于如何做好一个对用户的回答风格,产品方在构建小跃的指令上真的很用心了(图3)

小跃从不咒骂,除非用户要求小跃咒骂或用户自己咒骂很多,即使在这些情况下,小跃也会非常克制地这样做。

小跃善待用户,避免对他们的能力、判断力或后续行动做出消极或居高临下的假设。小跃仍然愿意反驳用户并保持诚实,但会以建设性的方式进行——带着善意、同理心并考虑到用户的最大利益。

缺点、槽点或者待改进项:

  1. 特殊提醒不可自定义

  2. 图标只能向下增加窗口,不能向上(见图2,实际上声明的窗口很长,但是小跃的位置在右上角),作为一个桌面宠物,放在下方是自然的的,但是放在下方一旦输入点什么,回答我就看不到了,全到屏幕下方去了

  3. 一个chatbot竟然没有语音交互

  4. context length 200k,但是system prompt就有12k char,还不包含mcp的context和skill的context,虽然有缓存,但是整体还是太冗长了,把所有要求全部塞进去,小跃同时被要求做一个助手、朋友、研究专家、管家,还同时是害怕犯错的讨好型人格,被要求回答精炼却又要详细思考的同时保持精确和友善。小跃真的很难,我反正做不到

  5. 让它做个ppt,突然打开了浏览器,定睛一看,原来是用浏览器进行百度搜索“how to open local file in finder from browser Macos”,很难评。(图4)

  6. 文件管理真的很糟糕(图5)

  7. 它真的很想在我的电脑上执行命令(图6)

  8. 有一说一,如果一次会话最多只支持调用10次工具,而5次搜索+5次阅读网页就占满了的话,什么样的AI都给不出有效建议的,这种情况下为什么不直接把<research_category>这部分的指令干掉,十次工具调用的research还不如pplx一次随机询问呢。(图7)

  9. 内嵌浏览器,不支持light mode,不支持任何右键操作,不支持浏览器插件,但是支持打开网页,那何必多此一举呢?(图8)这还不如微信浏览器呢

  10. 在和小跃的聊天过程中,我竟然不能复制它的消息,我只能复制自己的,也不能要求重新生成。而它的消息框中不在代码块里的XML tag还会被自动处理(如果是输出消毒的话我很高兴)。我想不明白这些作为chatbot基础该有的功能为什么没有

白菜海龟汤

不咋主动,被动的也不是太好

试了3个任务,只成功了1个;对话框在上面,不是很习惯。

任务一:整理我的桌面

√任务完成

总的来说还挺满意的,就是给我整的一个临时文件夹里面是空的

任务二:打开谷歌浏览器,进入Google AI Studio,发起新对话,上传指定文件夹中的指定文件,再按照要求发送对话。

×任务失败×任务失败

首先它显示找到了指定图片文件,第二步是打开的内置浏览器,而不是我以为的直接打开我本地的谷歌浏览器(话说什么时候能实现桌面助手直接操作我的桌面呢?)。它在打开了指定网站之后,一直无法找到“new chat”按钮,然后不断刷新页面,任务没有进展。(图1)

于是我手动打开了浏览器和页面,并开启了一个新对话,要求小跃继续执行任务,它说可以,不过依然是在它自己执行任务的框里在阶跃浏览器打开了google AI studio 页面,此时要求我接管,因为需要登录账号。后续又要求我自己确认上传图片,然而在它给我的窗口中AI Studio页面显示不全,没有出现对话框,也无法下拉,刷新和重新开启对话都没用。(图2)

此时,我只能选择“控制完毕”这个按钮,也无法中止任务执行或者在对话框中反馈。

随后我看到它发送了我指定的文字内容,但是没有上传图片,最终显示Internet error因此Gemini也没有返回任何回答。

任务三:接下来我给你任务,任务名称叫“我随便打开一个东西,你给我想办法”。我的要求是,每当我打开一个文档/屏幕,并且在该页面停留时间超过2分钟,你需要主动问我一句。问的内容包括但不限于:要不要我帮你 一,解释内容 二,提炼要点 三,生成笔记 四,讨论你有疑问的内容 以上4个内容要做成我可以直接点击选择的选项,省去我打字的麻烦。 在我给你回复之后,你需要按照我的回复基于当前内容直接干活。

×任务失败×任务失败

Round 1:

非常诚实,在我发送以上要求后,给我的回复如下:

我理解你的需求,但我需要诚实地告诉你:我目前无法实现这个任务。

技术限制:

1. 无法主动监控 - 我无法主动监控你打开了什么文档或停留了多长时间,我只能在你主动向我发起对话时才能响应

2. 无法主动发起对话 - 我不能在你没有输入的情况下主动弹出消息或询问

3. 无法创建可点击选项 - 在当前的对话界面中,我无法生成可点击的按钮或选项供你选择

并且它提供了可替代方案。(图3是它的回复)

不过我给它发了降临派产品介绍上的“主动触发”和“无摩擦输入”两个功能描述后,它又表示它是可以执行前面我要求的任务的。

Round 2:

接下来我首先打开了一个PDF文档,尝试了一下手动触发“无摩擦输入”的功能。

经过一番检测,它确认我打开的是一个空白浏览器。

在我提示打开了一个PDF文档之后,它表示刚才只检测了浏览器窗口。

要是现实中遇到这么笨的助手,我会立马辞退。

Round 3:

这次我要求设置后台监控来主动监测我在某个页面停留的时间,以触发最开始要求的主动提问功能。小跃制作了一个监控脚本,说是2分钟触发主动提问。然而我把页面打开,在旁边刷了20分钟手机,它没有任何反应。

我其实还有一个任务想测试一下,等我追评吧。就目前看来,小跃想成为一名得力助手还是道阻且长啊!

无限回响

阶跃版本的 CoWork?方向挺好,但是体验上有点乏善可陈

形象选得很好,一颗温暖而亲和的星星,有温度;

产品功能上中规中距,作为生产力工具,需要提供更多具有创意而且能快速使用的场景案例;

全局记忆有些亮点,适合我做一些回顾,但是隐私问题确实也是很敏感的一个话题;

使用过程中倒也没有出现其他人反馈的卡顿情况;

除了全局记忆和定时任务之外,自动化这块我觉得还是有很多可以探索的地方,比如更多样的任务触发器、长程任务规划等;

我尝试了几个场景:

  1. 文件整理:默认按照文件后缀来整理,提醒过后就会按照语义来整理(理解内容后再归类)

  2. 图片反推:给到一个插画,能反推提示词,但是无法根据提示词生图

  3. 资讯查询:联网搜索得到的数据还是比较实时的,也能够按照我的指令,设置定时任务并加入到待办清单中

环境:MacOS

问题和建议:

  1. 交互偶现一些异常,比如在设置页会出现无法编辑个人信息的情况

  2. 无论我视图怎么切换,APP 都会像狗皮膏药一样占据视窗?这导致了我每次用完都得把它手动关掉,很麻烦

  3. 打开新标签页,光标没有自动聚焦到输入框内

  4. 从悬浮球打开聊天窗口,并输入任务指令,信息没有实时同步到主端的标签页中

  5. 输入框和消息列表的上下位置,不太符合我的交互直觉,交换一下会更好

  6. 标签页的 title 不会自动更新?导致一堆的“新标签页”

  7. 创建妙计时目前只能输入 Prompt 指令,除非导入现成的 Skill 之外,用户无法直接在产品中创建 Skill

总结一下:

产品有亮点,接入了 OS 级别的工具调用,但是在产品功能设计上,还是觉得简单了些,缺乏让人眼前一亮的点。

在产品交互形态上,也可以再深挖一下,Chatbot 不一定是最优解。

要想让这类通用 OS Agent 发挥作用,我认为自动化还是最重要的,让桌面伴侣成为全天候待命的分身。

谈完能做什么之后,我们再来好好琢磨怎么通过Memory 机制和上下文工程,让它更具有活人感。

认知少女

我是通过观察评论区得到的邀请码。之前听说“结悦星辰”有一个类似的 Agent 产品,一直很感兴趣;刚好 Kimi 那边给了我邀请码,我在查评里也找到了相关的,就打算试用一下。

我点击安装后,网页端会出现一个小图标,可以进行对话并协助处理网页内容。我写了一个关于“豆报”的评价,并希望小跃(Xiao Yue)在 15 分钟后点击发送按钮。

在使用过程中,我发现了一些需要改进和优化的地方:

1. 授权登录流程:

小跃的 Agent 初始是在沙盒中模拟,需要授权登录。但在授权之前,系统就直接提示任务已完成,只有点进去后才发现需要登录。建议优化这一流程,在执行前明确提示登录状态。

2. 定时任务与提醒功能:

(a) 优点:安装初期会有喝水、久坐提醒,这种关怀健康的设计非常人性化。

(b) 问题:虽然有久坐提醒,但定时执行任务似乎存在 Bug。我设定 15 分钟后发送,结果等了两个 15 分钟(我甚至睡了一觉回来),它还是一直在打圈等待,似乎缺乏一个可靠的时间调用接口。既然能实现久坐提醒,为什么定时任务会卡住,这一点存有疑问。

3. 交互体验:

(a) 输入框位置:一般的 Agent 输入框都在下方,现在调到了上方,连续对话时经常会点错到下方的空白页面,不太方便。

(b) 窗口移动:展开后不好移动,会遮挡正常的页面内容。

(c) 语音输入:在桌面应用上使用时,Typeless 语音输入功能无法正常运行。作为桌面陪伴类产品,语音输入、想法记录和随时唤醒(类似 Siri 或小爱同学)应该是必不可少的核心功能。

4. 网页抓取与任务状态:

我尝试让它抓取网页中点赞数较高的关键词以便分析。结果它一直在不同页面间来回跳转,始终无法成功抓取。页面显示“任务已完成”,但实际上任务一直停留在第二阶段,没有输出任何结果。在现在的 AI 时代,Agent 应该做到直接输出报告,而不仅仅是简单的操作模拟。

目前的体验感觉更像是一个代办事项的雏形,距离真正的“桌面陪伴助手”还有一定的提升空间。 关于桌面 Agent 这种应用的市场空间和产品提升方向,我有几点建议:

1. 提升任务效率与通用化

我觉得首先要做到效率性。系统应该能对通用任务进行总结和分类,尤其在抓取任务中,Agent 应当能根据指令准确识别点击和抓取的位置。

(a) 页面加载、下滑和上传操作需要足够的流畅丝滑,不能影响其他任务的并行执行。

(b) 降低消费成本。无论是 Token 消耗还是时间成本,Agent 应该能真正替代一名实习生的人工,而不是连发送评论这种简单操作都要让人等待半天。

(c) 加强任务拆解。如果 Agent 不能很好地拆解任务、理解意图并定位操作位置,其智能化程度就远远不够。

2. 突破沙盒限制与安全性

目前的沙盒形式导致安全性与可用性之间存在矛盾。

(a) 当抓取行为过多时,容易触发网站的安全警示。

(b) 系统需要解决如何绕过或避免安全拦截的问题,否则任务往往无法产出结果。

3. 回归“桌面陪伴”的本质

可以参考 QQ 宠物这类陪伴型应用,要么提供情绪价值(例如像“元宝”那样幽默的交互方式),要么提供实用的功能辅助。

(a) 情感化交互:支持语音输入/输出和闲聊模式。目前这些功能缺失,甚至切换探索模式、选取上下文对话都需要手动操作,非常不便。

(b) 深度办公辅助:支持随时梳理想法或进行文档处理。目前的任务闭环做得不好,用户本想交付任务后就不再过问,结果点进去才发现还需要二次确认或授权。

(c) 优化文件交互:支持将文件直接拖入,或者由用户指定路径后让 Agent 自行访问,而不是让用户手动上传。

4. 改进交互设计与任务管理

目前的 UI 交互逻辑还需要进一步优化:

(a) 历史记录管理:目前的历史记录只能一直往上翻,缺乏按任务分类的机制。

(b) 新建对话逻辑:不需要在二级菜单点击查看历史后才能开启新对话,建议在主界面直接设置“新建对话”按钮。

(c) 任务提醒功能:目前的任务定时提醒功能做得不够到位,提醒频率和时机都有待优化。

作为一个桌面的助理,不能仅仅停留在整理文件和搜集信息的层面。如何从重重竞品中杀出重围,远不是靠一个悬浮窗就能定义的,关键还是在于产品的人性化和智能化体验。

降临派7585

阶跃 AI 桌面伙伴用下来是个优缺点鲜明的工具。一个贴心的小助理,能自动整理桌面、定时提醒喝水和活动,自带文档处理能力,也有许多的skill(可以在skill广场里面找),在处理 Excel 表格、批量文件整理这类简单任务时,它理解能力强、交互流畅,确实能提升效率。

不过面对复杂任务时就有些吃力了,比如多工具联动完成项目流程,或是制作 PPT 这类中等任务,要么无法完成,要么效果一般,回答复杂问题的速度也偏慢。里面内置浏览器,没有添加相应的skill,小跃就会自己去浏览器搜索内容。

桌面图片点开之后,只会向下扩展,当你把图标放到下面只会,就看不到扩展的内容了,这点需要调整一下。

季华


内心的真实感受介于6分bad和4分good之间,但是因为因为基座能力的不足和交互逻辑的生硬,权衡之下还是选择了bad:

从两个任务执行来进行评价吧:
实测环节一:复杂信息处理 (AI资讯整理)
prompt内容:整理一下今天热门的AI咨询,放在桌面的jie_yue文件夹里面,做成excel表格,对应消息来源的链接。并按照你觉得的重要性按顺序排列,加上你自己的观点。
完成效果评价:耗时四分半,时间上可以接受,但是结果有点差强人意。首先在任务执行前,其向我发出了对齐需求的提问,诸如渠道邀请,判定标准,偏好类型等等。这里出现了几个疑惑的点,对于产品主要卖点的功能,应当做的精细些。目前市面上有很多对于长任务规划执行的细分例子:例如claude code的在终端内直接选择,或市面上deepreseach功能的先给出完整详细的执行计划再请求确定,再不济模型一个个问,我一个个答,这样子也会给用户感到产品是在深度挖掘需求。但是产品选择了最原始的“抛一堆问题”方式来对齐需求。其中回答例子很多还是根本完成不了的(例如信息源选择X,重要性判定方法等)。最后我查看其信息来源,十条消息有五条来自“金十数据”,排序上我也不认同。
实测环节二:ppt生成

内容:对生成的excel里面的数据拿出来生成ppt
完成效果评价:耗时13分钟,ppt最后没有生成,报错上是说nodejs兼容的问题。但其实在网页版本的生成了,效果上看得出做了一定的工程化处理,但是从满意度上来说,还是无法比肩其他优秀大模型做的。

聊聊看法:
资源管理、桌面管家、电脑帮手”这一方向无疑是2026年的大势所趋,在中国。阶跃走在了这条路的前沿。虽然有些效果实现不佳,但是在执行删文件,改文件等这些桌面任务执行任务上,效果可以说是快准狠。其类似skill的功能附加,也让我眼前一亮。但是要想大火,最应该解决的,是如何给用户非你不可的冲动。现有问题归根结底,还是在部分工程化路径的缺失和于大模型基座的能力欠缺,阶跃自研模型在模型能力和执行稳定性上,确实还有很长一段路要走。

花海

阶跃AI在我看来是属于一款agent集成型的AI产品,基于我本身是一个深度的AI coding玩家的基础之上。

从这个同类型的产品本身,它有点类似于CLI和manus型这种产品的结合体。

- 从对于桌面的管理和对文件的管理的角度来说

这款产品对于绝大多数的AI小白,对于电脑没有理解,可能出现的文件报错、下载文件、处理简单的网络问题,是完完全全足够的。

绝大多数的情况下,我们人都是会面对很早很烦人的文件夹管理、或者桌面存在大量冗余的文件,虽然我个人对于电脑操作很熟悉,但是我仍旧比较懒,大量的文件以及可能存在或者我忽略掉的文件,都可以帮我去整理和调整。

其次,包括网络问题、撰写基础爬虫,抓取数据、分析数据,可以攘括国内外的这个资源检索。

对于很多新手小白及其友好,对于我这类人群,帮助可能较小,但是也很适合日常基础任务。

- 从功能上面来说

这个我觉得还蛮有趣的,【定时服务】和【妙计】,也就是skills和定时skills的这样的一个组合,我觉得非常的有趣,那么这样一来,在极大程度上面去简化、去更加适配性的一个工具了,其实站在小白的角度,他们会觉得,skills是一种很神奇的东西,让他们用。

需要CLI,他们不懂。

阶跃的这个操作的话,直接把skills作为嵌入式助手,一段提示词搞定,并且随时调用,这是我觉得的一个很大的创新点,把很多基础性的重复性的skills,结合【定时服务】,可以说是很香的。

让我更加感到惊喜的是,可以链接飞书,可以自动化帮我检索信息、创建文档,也就是接了一个飞书的MCP服务,以此来获得更好的服务体验,比如撰写文档之后自动化保存到飞书,这样一来。

【定时服务】+【妙计】+【工具箱】这三者就结合起来,具备更强的操作、更加优质的功能,这样一来,采用飞书管理,也是及其的舒服。

- 说说局限性。

虽然可以调用阶跃的浏览器去自动化的帮我去执行任务,但是实际上,是以一种及其笨拙的模式,就好比我让其帮我抓取文案、并且分析,它的做法有点离谱,打开浏览器,去一个字一个字的听取和识别,就挺无语的。

然后其实抓取数据,从国内的环境来看,其实都是会跳验证的...

再说,我觉得虚拟机抓取调用、以及浏览器自动化要是可以做的更好一点,其实开通专门的付费窗口也无可厚非,可能要提及某类似的竞品,但是别人是国外市场。

在国内市场做到这个程度,也算是非常的厉害。

其次,它的占的这个后台的运存实在是太大了,以及在执行任务的时候,我觉得虽然不卡,但是不太适合全天候挂着,只能说在有需求的时候去打开去调用,要是可以把优化做的更好,就和好,把这个在后台的运算和定时任务等等,比如待机状态减少运存的占比,要启动任务的时候进行预热。

然后在吐槽一个点,就是为什么这个小球,只能左侧展开,不能右侧展开,就挺无语的,适配性没有做好,这个我是真的希望可以优化一下,真的用起来很不舒服。

其次就是官方社区的运营,可能刚刚推出,可以加一些共创模式,分享一些个一优质的skills和流程,可以给更多的人去使用,我个人是比较愿意去分享的。

这样的话,可以给很多的用户降低使用难度,奔着它的社群里面优质的东西去使用。

总的来说,我是很愿意去推荐这一款产品,也希望越做越好。

最后,感谢降临派。