打差评是因为我觉得工程化的结果还不够好,有非常多非常明显的工程化内容没有去处理/优化。
但不妨碍我对这个产品的前景看好
2023 年的时候,我就对 AI+桌宠这个事非常感兴趣,当时还下载了 VPet:虚拟桌宠模拟器,准备二开。因为传统桌宠并没有一定的智能,更多的只是固定交互。
而 AI 加持的桌宠可以做三个非常有潜力的事
1. 虚拟陪伴(这很显然)
2. 个性化助手(相比于 Web 应用,客户端能获得更多更持续的行为数据,从而打造更专属的个性化助手)
3. 全局效率工具(客户端能够在全局调起,从而实现在各个软件里提升生产力)
因此,我对 AI 加持后的桌宠这样的概念很认可,桌宠的形态既能承载生产力,又能提供虚拟陪伴,情绪价值。
再说回逗逗 AI,我拿它打了几款游戏,英雄联盟、无畏契约、我的世界、原神,这里以英雄联盟为例,自己平常玩的最久,单纯游戏陪玩角度,我个人觉得很差。
用几个词来描述的话,大概是:“超级云的云玩家”,“烂梗密集”,“过度废话”,“游戏理解很片面很差”“幻觉相当严重”...
具体来说,一把游戏下来,一开始的时候会识别错我是什么英雄,我玩辅助老鼠,它说我玩 ad ez,对线时也会搞错对方的英雄和位置信息。
其次他不断的在根据片面的战局信息在给我云指导,比如虽然我们人头多一点,但实际上是明显的劣势,却不断让我报团推进(这不是逼我快速结束吗)。
还有就是我打 lol 有时不时按下 tab 的习惯,但每次按 tab 的时候就像触发 npc 固定剧情一样,说我的补刀,说对面情况,虽然这个逻辑我觉得没啥问题,但是由于识别错各种数据和对位情况,加上几乎每次按 Tab 都会触发,导致我后面都不敢按 Tab了。而且非常神秘的是,这个语音语调会因为这个固定触发导致变得很奇怪,本来好好说着话,突然就变了。
在游戏理解上,特别是出装上,完美诠释了什么叫云玩家,不仅出装思路古板,给的装备还有许多已经被下架的。
还有一些其他细节问题,比如里面的角色多少带点擦边属性,讲话很 sao(特指 死盖),有点过度了(当然可能是我本人不喜欢这种导致的),以及各种数字的识别错误,延迟较大等。
整体来说我觉得涉及到几个问题
1. 工程化细节不够,对于一些数据的识别,特别是在固定的游戏里面,战绩、补刀什么的总不能识别错吧,这块传统 cv 工程就足够。
2. 游戏相关数据更新不及时,靠搜索 api 并不能解决问题。这点在云顶里尤为明显,搜索 api 即便搜到了内容,但由于预训练数据和当下数据的时空不匹配,即便搜到了正确的答案也难以回答出正确的结果。(这个坎很难,涉及到的问题非常根本,特别是在反应时间有约束的情况下)
期待后续做好细节的工程化,在一些小的地方做体验提升,多增加传统的方式,去给到 Agent 更准确更优秀的上下文内容。
认知基座不对,行动也就难以正确。如果继续深耕游戏陪玩,基于通用大模型+搜索等方案是很难达到要求的,模型是真的需要相关数据的沉淀与训练,需要训练出模型的优秀认知基座,对游戏有专门的理解能力,再考虑具体场景的推理分析
以及不要光顾住模型训练和 Agent 开发,多去实际体验体验,让真正的老玩家去试试,相信随机的一把游戏就能暴露出很多问题。
游戏陪玩很难做,但看好这个赛道和场景,加油,3个月后再来体验,期待到时候能眼前一亮,而不是两眼一黑。