首先,还是要感谢 降临派 的 ShellAgent 2.0 邀请码 ?~
简单体验下来,2.0 核心卖点是一句话生成应用,通过对话聊天,自动完成工作流开发,简单几步就能构建完整的 AI 应用。
与 Coze、Dify 等通用应用搭建平台不同,ShellAgent 的工作流更具有针对性。
从节点列表中可以看到,除了基础的逻辑节点之外,Shell Agent 还提供了 LLM、图像处理、图像生成、音频生成、Web3,以及一些小工具(比如 Twitter Search),所以基本上做出来的 Agent 也是围绕这些能力展开。
在这个基础上,进一步产生出来了 2.0,让 Agent 承担更多任务,用户只需要给到 idea,就会主动拆解目标并执行 Agent 应用构建。如果任务比较简单,涉及到的节点较少,构建速度就会比较快,比如像是风格转绘。相反,如果是较为复杂或者有多样性的任务,涉及的节点较多,ShellAgent 2.0 就需要拆解步骤并串联相关节点,消耗的时间就会更长,比如让它为我实现图像理解+艺术风格化,或者创作一个由 AI 驱动的小说应用。
有意思的是,制作出来的应用,不仅仅是对话,还类似 midjourney 提供了一些选项,引导用户执行下一步的操作。这些控件也是由 ShellAgent2.0 来动态生成,可以和应用配合得比较好。
效果上,ShellAgent2.0 的效果只能说乏善可陈,就好比普通人想绕过代码学习就制作出一个能够 AppStore 推荐的高质量应用,ShellAgent2.0 的能力其实还是比较有限的。以生图为例,通过我自己构建的ShellAgent2.0 应用创作得到的图,和我用ChatGPT、即梦得到的图,能感觉到明显的一些差异。这里的差异点我想不仅来自于模型,也来自于背后对生图Flow的调校。
所以对于大部分普通的使用者,去探索页找一些自己感兴趣的应用去对话或者 Remix 就足够了,在首页推荐的一些应用在生成和效果上都会更稳定,创作工坊更适合极客类型的玩家去不断炼丹。
ShellAgent 2.0 的推出,能窥见 ShellAgent 团队构建全民 Agent 创作平台的野心,但距离这个目标,依旧还有很长一段路要走。