Tbox「超级智能体」

是会思考、能动⼿的智能体天团。...

Tbox 是会思考、能动⼿的智能体天团。

  • 做 PPT? 他们能⾃动搜集资料、设计排版,为你⽣成⼀份内容丰富且精美的演示⽂稿。

  • 写报告/论⽂? 告诉他们主题,它能⾃动整理资料、分析数据,⽣成⼀份完整的报告。

  • 做⽹⻚? 只需描述想法,他们就能帮你设计并写好代码,做出⼀个 可交互的⽹⻚。

  • 学习⾏业热点? 抛出问题,他们会帮你搜集信息,产出专业的解析和洞察。

在 Tbox,你不只有⼀个 AI 智能体,⽽是⼀个为你服务的AI天团。

你可以让全⽹搜索助⼿、PPT 助⼿、⽹⻚研发 ⼯程师等专家⾃动分⼯合作,像⼀个真实团队那样,⼀站式搞定复杂流程。

你还可以把⾃⼰创造智能体加⼊协作流程,从⽽⽣成更契合你需求的成果。不同智能体之间的协作与创新,实现⼀个更复杂、更⾼效的智能系统⽣态。

22 个评论

志云

这个不难评,就是很直接的 bad,还是贼差劲的那种

请原谅我有点不礼貌了,直接在微信上搜 Tbox,第一页没找到~至少广子是不多的 ?

还有开局积分送很多,这个可以给个好评

第一个 case,之前我对象喜欢让 AI 扮演角色,给她一些建议。那我就说,让我来手搓一些智能体吧~

Tbox 上面有一个智能体小组的概念,创建个人智能体,其实就是搭几个提示词应用,那我就整了几个:小董、肖庄,还有天真

好家伙,我本来是让你们群策群力的,但奈何听不懂大白话,必须一个一个 @你们才肯发言,感觉智能了个寂寞

第二个 case,开发个应用吧,掏出之前给秒哒没完成的需求说明书

这个智能体在后台工作,可以设置消息通知,这个指引还挺贴心~

然而,你们的作品一出来,我血压都高了…… 怎么是个校园招聘软件?难道是我给错需求了吗,认真翻看记录,我的就是要求做个 “降临派” 的导出助手,然后你的产品设计专家出 PRD 文档的时候,就给我直接改需求啦,服气!

回过头来好好看看首页,这个排行榜是想做模型盲测吗?还有开放平台和百灵大模型,是什么鬼?

所以Tbox 百宝箱的定位是什么呢,啥都想要啥都不精吗?

阿里系的产品体验一圈下来,一个很直观的感觉就是产品力在下降,曾经那些好用的产品,要么变得越发臃肿,要么被收编为底层小弟;曾经 BAT 的老大都知耻后勇了,那你呢?不如省点广告费,好好打磨一下产品和场景,做点真正能用、好用的东西

最后给个建议:Vibe Agent 好像还没人做

降临派 小明同学

百宝箱真丰富,然而暂时无法平替

玩了一下 “多邻国、瑞幸咖啡” 营销策略报告,报告内容符合我的期望,配合报告主题,瑞幸蓝、小鸟绿倒是抽象有趣。

制作小组根据需求自由组装:重点尝试了播客小组,内容整合过程体验,高于最终生成的播客质量(内容短),AI 主播交流顺畅。

报告、PPT、播客、网页、文档、智能体等样样行。过了几天再回来,一下子找不到我的作品历史记录...(我再找找)?

落叶

蚂蚁集团的Agent产品,名字起的也挺有意思,自家底层大模型叫“百灵”,所以这个“百宝箱”还是挺贴切的。

和灵光类似,这个产品也颇有些不走寻常路的意思,因为国内大厂太卷了,而蚂蚁家发力又相对比较晚,所以走这种路线倒也不失为一种好的策略。

灵光走的是“图文并茂”、一句话生成应用的个性化输出;TBox感觉走的有点类似于“赛博打工人”的交流方式

例如,每个任务会给你一个对应的工作组,每个工作组都包含不同岗位的一名“专员”,和你对话的风格也非常“接地气”,完成任务的流程也是先把任务分配个不同岗位的专员再去干活……

体验下来还挺有新鲜感的。

几个亮点:

1、初始送10000积分,每天登陆送3000,开始我看到这个额度,还以为是一个任务要花掉2000起步,上不封顶的那种,结果发现还可以。图像生成的任务,改了几轮消耗500点,PPT任务一串流程下来,消耗是1000点。

2、图片生成的还真的挺好,给了一长段内容比较复杂的提示词,用来生成一个年终总结图,结果连续跑了三张,结果居然都还不错。中文显示一点没崩,提示词里描述的元素也基本都覆盖到了。有点好奇背后是哪家的图片模型,难道是Wan2.6?

再说两个问题:

1、还是有不小的概率听不懂指令,比如都贴上了原图让他改,还是给我改了另外一张,反复多次。

2、PPT生成的质量,只能说中规中矩,勉强可以作为一个初稿来用,但是细节问题还是挺多的,比如很多图片没有出来、图表的选择逻辑有待商榷,等等。

通用Agent赛道还是很卷,希望蚂蚁能走出一条不同的路。

乐在其中

体验了一遍下来,说说我的感受。

1. 界面设计一般,和市面上大部分产品都很相像。

2. 虽然界面一般,但是干活很棒啊,输入了一句生成蔡徐坤九宫格写真,Tbox会一步一步拆分任务,就是要争取做到最好的那种态度,最后生成的写真也是真的超级好。

3. 爱了爱了

卧查!

想给个中评的,好用不至于,难用也不至于。5/10

原来就是蚂蚁百宝箱,很久之前就在用了,当时的竞品是扣子,搭建工作流的模式。

现在改版了,还是对标扣子空间是吧,设计、ppt、数据分析、写代码、写文档这些似曾相识。

进入就给了10000积分,还以为很大方。结果做了一个图就花了500积分。你这搞积分通胀啊。

ok,进入测试。使用设计智能体,woc,试了一下我的提示词,做出来的效果堪比nano banana pro。

字体保持很清楚,字多了也没崩。设计感也有。

我不敢相信。

继续测试,内容一多(5000多字提示词),视觉效果依旧不错。

但是幻觉nm真严重啊。

生成的图内容跟我的指令内容完全不一样啊。

啊?

降低幻觉,我觉得是可用的。呈现效果其实挺好的。

认知少女

这不就是百宝箱吗?以前的时候还做过活动获过奖的,但是现在怎么完全不一样呢?叫t box,还以为我还以为是什么其他的一些网站的。结实果点进去去,我发现是百宝箱,你这个还是很明显的问题啊。你们的命名以及对应的一个方式是不一致的,没有什么可以留下印象的东西啊,。
第二就是你也不跟我确认需求,然后直接说这个需求做不了,或者无法胜任。我是觉得是有问题的。尤其是我真想让你抓取这个网站对应的一个评论区的内容都抓取不了,好奇怪,我就感觉我我觉得到底是要做扣s,还是要做通用A整的,还是要跟其他的阿里子公司去抢产品,我觉得是不名气的。我觉得资源是重复以前浪费的。而且最主要的是现在的这个整个的内容,什么的形式也不好看啊,就很网页很丑的。
我觉得比较好的一点是关于他的一个消息的通知啊,尤其是可以在支付宝或者微信里通知。这一点的话实际上是不错的。我要它生成一个关于AI产品,从1月份到12月份的一个年度盘点,它生成的一个内容是不能遵循上下文的一个统一性。然后结束任务之后,它不能进行一个继续更改对应的内容,而是要从新生成任务,绝得是不太方便了吧。
然后又重新让他生成了一遍,然后生成了一遍,又发现了他本来我选的是播客,但是的话他生成的是一曲文件或者是内容就很奇怪因为我是觉得他的指令不是很遵循。而且他的网页给的内容,我让他梳理1月到12月的这个产品,然后他给的内容也很奇怪,。
比如说AIagent不是年初话稽予后啊,年初的话是deep C和火了。后来的直到meons发布了agent一种模式,之后,AIAent才火,然后一直到年底的一个视频的一个内容。你看这个上面说全部都是不对的,很奇怪。我觉得整个的一个模型的一个水准,以及包括啊推理模式什么的都不太行。

elli

跑了一次“AI Agent 行业现状分析PPT”,整体略失望。虽然系统里展示了三个 agent 的任务拆分(全网搜索、结构整理、PPT 生成),拆分逻辑本身是合理的,过程也相对透明、可追溯,全网搜索助手抓取的文章数量也足够多,但这些优势并没有转化为一个高质量的最终结果。短板出现在交付层面,最终生成的 PPT 存在明显的图片排版错误、图片区域缺失、icon未加载等基础问题,视觉完成度偏低,影响正常使用。同时内容几乎全部是 bullet point 形式,偏概念罗列,观点空泛,缺少重点、结论和真正可用的洞察,更像是“资料汇总”,而不是一份可以直接拿去汇报的成品。对比z.ai的PPT生成功能,两者差异更加明显。z.ai虽然在内容深度和研究过程上相对简单,但成品稳定性和视觉完整度更高,基本不会出现图片或 icon 缺失的问题,生成后可以直接使用;而Tbox 更强调过程和多智能体协作展示,却在质量控制上明显不足。整体来看,如果只是想快速得到一份“能用的PPT”,z.ai的完成度更高;而Tbox目前更像一个概念验证型产品,而非成熟的PPT生产工具。

查理一世

主要测评了PPT、报告、应用三个场景

1、PPT场景

最近刚好需要做个汇报,之前有个AI PPT专项,测评下来genspark最好,百宝箱这个没有目录,没有章节的区分,排版上面稍稍有点素,不过逻辑是可以的,然后也有一些数字的凸显

2、报告场景

这个我觉得整个报告的UI我还是很满意的,看着还挺舒服。然后我觉得还是有一些信息的,这个感觉不错

3、应用场景

第一轮改bug并没有改对,但是吧我感觉整体页面还是比较简洁的,导航可以直接跳转高德,而且提炼了历史背景、特色亮点、最佳机位、最佳时段,这些信息还是对用户挺友好的

wy

蚂蚁将百宝箱作为一个综合应用和智能体的开发平台,用起来感觉有点别扭。

百宝箱在应用使用之后,它会把所有菜单收起来,进入对话页面。在对话页面,它会类似豆包,可以把相关的应用都收起来。这样的话,智能体相关的配置页面都会被收起来,导致用户找不到入口。如果想要找,就得重新退回到首页,操作起来感觉很不便利。

第二个问题是,应用里面虽然支持很多功能,比如生成PPT、生成报告、做一些查询,但感觉每个效果都不太好。

首先是做Deep Research这块,它虽然有这个功能,但查找的资源很有限。从当前来看,给了一个主题,它只查了10个来源,这对于Deep Research来说是相对很少的。其次,因为看不到它的执行过程,所以不确定它是否会对搜索结果进行判断,然后再重新搜索,这是一个未知的情况。

第三个问题是它的输出。输出报告里的配图是先输出报告,然后再去配图。配图会从网上找一些图片,这就导致配图和内容可能会不相似。

第三个问题是,报告生成后,它不会在右侧直接把报告打开,而是必须用户手动去打开。这样会多一步操作,让人感觉不太舒服。

除了报告的功能,我也测了其他的,比如像PPT生成。这些感觉和其他的PPT生成功能会弱很多。那蚂蚁推出来这种和竞品有一定差距的产品,它的目的是为了抢占市场还是其他的目的呢?这个就不得而知了。

其实就想查一查

1、PPT模式:上传了PDF文档,之前做过很多PPT测评,做得好的可以保留原文,但是实际测试中,2次,都要求保留原文,但是均强制进行了精简

2、应用模式:做一个上传截图识别的记账工具,做了2次识别金额、时间、类目均失败

3、设计模式:图片生成效果还可以,没有测特别深入

4、播客模式:声音很一般,内容也是拆的比较乱
测试结果来说目前工具是很多,但是特别厉害的并没有,大水桶,感觉什么都可以做,但是都不是最强项。