可以说纳米做视频是不错的,可是后边开始不会用了,有点复杂
集成了多种顶尖 AI 模型,支持文字、语音等多种输入方式,提供搜索、答疑、分析、写作、创作等功能。...
纳米 AI 搜索是 360 集团推出的新一代智能搜索产品,开创了全新的问答交互方式。作为一款多模态搜索引擎,它支持文字、语音、拍照和视频等多种搜索方式,让用户获取信息更加便捷自然。
产品集成了包括豆包、文心一言在内的 16 款大模型能力,并配备数十种智能工具,可应用于写作、分析、翻译和旅游规划等多样化场景。基于超级智能体技术,纳米搜索能够准确理解用户意图,突破平台间的信息壁垒,为用户提供直接且有效的答案,让搜索过程更加简单直观。
V8turbo版生成视频智能体有几大问题,由于这几个问题,我决定第一次评价给差评。
(1)不能保持人物一致性,视频前后人物服装、头发、长相等因素都有变化。
(2)不能保持视频风格一致性,画面风格常常与预设不符,要求是写实,结果有时候给我生成动漫风格。
(3)不能设定音效、多个人物对话音色,选择minimax提供的音色困难并且经常审核不通过其生成的AI配音,导致视频不能添加个别AI配音,视频完整性差。
(4)视频不遵守物理规律、时空规律。如“主体在夜晚和别人打电话,别人的画面是白天”。
(5)生成视频时间短、画质和帧率都低。
(6)选择预设的BGM跟抽卡一样,不能更换。只能自己上传BGM。
今天测评了一下智能体一键生成视频
他的视频生成逻辑不是所谓的文生视频和图升视频,而是把视频制作过程拆解成工作流,然后按顺序执行。
简单梳理下视频制作过程,拆解需求-查找资料-构思分镜-调用MCP生成分镜图-调用minimaxMCP生成音频-调用分镜图图生视频-合成文音画
1.整体速度很慢,一个一个单线在运行,可能是区别对待了非充值用户。
2.整体逻辑没问题,但是生成出的成本还是有一些无法忽视的瑕疵,主要是在视频画面上。
3.工作流思路很好,充分调用其他厂商的优秀资源做整合很好。
优化建议:
1.文案方面,需要教会智能体辨别优质资料,直接忽略搜狐 网易等水贴多的垃圾资料
2.整理工作流方面,应该在全局有一个审核结果的智能体,就像一线员工与项目主管,每个智能体给出的结果不符合要求的可以直接让返工重做,比如生成的图片明显是外国人的,不符合要求,可以打回重做,比如生成的视频不符合现实物理逻辑,穿模等等,打回重做。
以上两点改进后,这个产品才不是只能跑起来炫酷,而是能给用户交付满意的结果。