Flova AI

面向创作者和叙事者的 AI 视频创作 Agent。...

【产品介绍】

flova.ai 是一款主打AI协作共创的通用视频创作Agent,创作者通过“对话”和“故事板”即可完成从故事 → 分镜 → 镜头 → 视频 → 剪辑 → 配音 → 音乐的全流程制作。

【核心功能】

对话式创作:通过自然语言交互,无需专业提示词,flova可以智能理解并响应

故事板创作:通过故事板而非画布的方式,按照脚本组织中间产物并支持手动编辑,让用户专注判断镜头是否符合完整剧情的需要

一键回溯和撤回:保留所有历史版本,支持一键brunch回溯到任意创作节点,同时支持“回到此刻”减轻长上下文冗余问题

多模型支持:集成 Veo3.1、Suno2、Nano-Banana Pro 等业界领先的生成模型

多模态输入:支持从完整剧本、图片、音频开始智能创作,视频拉片功能在快速开发中

27 个评论

查理一世

一些感受;

1、我特别喜欢回车之后发送视频。然后他这个要Ctrl+Enter发送,导致好几次,我以为我已经布置任务了,结果没发出去emmm

2、我感觉生成的有点慢,逻辑是它会一步步执行,然后每一步和你确认,但是我觉得太磨叽了,对我来讲,能不能先给我展示效果,然后我再去告诉你我觉得哪里哪里不对,或者我觉得可以多产出一点再和用户做确认

3、画面的一致性不太好,比如分镜1和2还都是查,到分镜3和4就变成狗了,不过通过对话,我和他说清楚问题,改的效果还是不错的

4、后面让他改这句话应该由A说出,而不是B,结果他把后面的部分也改了,导致后面的部分听不清楚了哈哈哈哈,这个调教小累,后来越改越离谱,跪了

5、整个画面的过渡还是比较生硬,就是串联不起来,单看小视频还是不错的

神奇小喷菇AIGC

我用5个生图模型做了一个另类玩法:做表情包

给我买的小查做表情包,提示词都一样:人物主体形象不变生成8张表情包

这5个模型一起比赛,谁做更好呢?flux直接淘汰,即梦和MJ全都GG(图1flux,图2即梦,图3 mj7)

只剩下banana 和GPT 1.5难分伯仲

你认为谁更好?(GPT-1.5图4,banana图5)

即梦4.5这个成绩不应该呀,我又试了一下,所以在图6它又复活了

它这个画图模型,有几个是内侧期间限量免积分

这个flova 最近用的频率很高,agent走一套流程下来时间很漫长,灵活性也不够,在一些简单任务上也会走很复杂的流程,它需要优化很慢这个问题

我希望它能增加一个为剧本细化的章节做具体分镜图和通过对话详细探讨修改某部分分镜的功能,要支持风格的一致性和角色形象的一致性,要提供一些具体的人物动作参考方便修改分镜图,最好还要有智能提示词功能来方便一个镜头和下一个镜头的过渡,确保用户提示词能力不够的情况下能起到一定生成质量上的帮助,实现更好的控制效果

我对flova的要求就是做视频的具体分镜编辑的细化这块,非常看好这款产品,希望能在2026年做的更专业

liz

我昨晚用Flova的第一反应不是震惊,而是嫉妒。就是余华看莫言写书那种“吗的 这么牛逼东西怎么做出来的”。

然后我用了一天一夜(真一天一夜,20美元积分用的干干净净),总算做出来一个还凑合的产品。

我的感悟就是,好的作品需要极致的打磨, Flova 极大缩短了打磨的时间。



因为有oiioii这款优秀的产品珠玉在前,所以我用Flova的时候总是不自觉和oiioii对比。

首先是交互形态上,Flova没有采用比较流行的画布形态。而是使用了线形故事板。针对用户输入的情节,划分为很多个片段。每个片段可以看做一个独立的模块,每个cut又包含多个分镜。形成一个比较有结构层次的划分。每个cut按照先脚本再图片再视频再音频再配音,每个都是独立的,哪里不满改哪里。减少了用户满意视频不满意配乐那种困扰。

Flova有一个很天才的设计,就是会根据脚本来在最开头确立主要人物角色的形象。 这样的设置保证了在多个cut中主体人物的一致性。 也确保了单独修改某一个cut 其他部分不受影响。

其次我很满意的一点是Flova的模型有的极强的语意理解。完全可以通过和模型对话删除故事线(P6)的某一cut 或者重新拼接,或者给出建议(怎么做的能不能教教俺....)。cut引用机制让模型在我已经拥有了极长的对话历史的情况下,依旧可以准确的定位到我要修改的那部分。

同时在每一轮操作完成之后,Flova会给出建议指导我下一步应该去做些什么,是推进还是修改。GPT5也会出现伪执行的情况,但我在flova中没有看见。 对于小白来说上手也十分简单。

相较于oiioii的一键式生成,Flova无疑在细节把控上更胜一筹。

但是也有做的不好的地方:

1.图片生成质量没的说,顶尖,但是视频生成的质量一般般。 我看到Flova集成了Sora2、Veo3.1(fast)、Seedance 1.0 Pro等等。 但是视频需要大量的抽卡。 我个人认为可能是视频提示词的调优不过关,或者是生成的方式不对。

前面说了 为了确保 任务一致性 Flova采用了先图后视频,打开看了下采用的方式是通过首帧来生成视频。

这样操作下其实有两个缺点:一是生成视频的末尾人物会变形。 二是人物太死板 缺少那种灵动性。 给人的感觉是那种动态漫画。 只是一个原本静止的人物增加了一点动态效果,而非是激烈的动画。(P7 大量抽卡导致积分消耗巨大)

2.配音配乐拉垮。 是个减分项。AI味道配音减消除漫画的热血感。虽然支持音轨调节(P8)但我不理解的是,既然脚本识别可以判断出创作的这个视频的主旋律,为什么音频识别不了呢。 我创作JOJO这样的热血漫配一个软绵绵的声音很奇怪。 同时为什么配音为什么不能自己设定内容呢,从完整性来说, CV本身就是一个视频很重要的一项(尤其对于动漫来说)。而且音频卡点也不太对。

3.有一些cut 会莫名其妙出现日本描述。叽里咕噜说啥呢看不懂。

总体评价真的很不错,如果可以优化视频生成质量这一步,绝对是一个顶级优秀的产品。

闪电查

Flova ai是目前我感觉花得积分不多,而且也能做出较好效果成品的一个ai视频工具。

输入视频描述的时候,有模型可以选,同时会弹出辅助生产的脚本,这点优化得很不错,另外对话也是很容易理解到用户的话,我第一次尝试,只需要一直对话,请继续,视频最后也会自动拼接起来,这个可能不想drimo,全部分镜摆出来,而是一幕幕生成,直到用户满意继续往下执行,最后让它合并起来,可以直接导出,当然会员才能无水印。

也许有个是ai视频行业的共同难题,每次如果有小瑕疵,那么做一个精美视频下来,就会重复生成无数次,如果能把这个概率性问题给显性成可预估就好了。

认知少女

感谢志云在查评圈提供的接力邀请码,让我终于可以使用上这款产品了。

总体来说,这款产品的 UI 界面做得非常不错:

1. 具有那种透明玻璃感的交互设计

2. 整体给人一种不断加分的惊喜感

3. 引导流程设计得非常到位 而且每周登录的话也会有对应的积分。我感觉相比于一些其他视频 Agent 抠搜的表现,这一点是比较能够养成用户持续登录习惯和产出内容的吧
4. 存在的问题是:

它必须按照步骤一步步地制作内容(比如制作分镜和制作角色),但其实我已经提供了角色,它本应直接生成分镜图。然而,即使我提出了这个意见,它还是要按部就班地慢慢生成。我觉得这一点可能不太智能吧而且形象跟我提供的图片、画风以及人物其实是有些不同的 通过生成的分镜图片可以看出整体的风格,美术效果是比较强的。

但目前存在一个问题:由于前面角色的形象出现了偏差,导致整个分镜其实并不符合目标的场景。除此之外,其他的倒没什么问题。 而且比较好的一点是,它赠送的积分足够我去生成一个完整的视频内容,并且扣除的积分也比较少。这也是它的一个优点。 而且最主要的是它能够 get 到整个主题以及音乐表达。它的音乐丰富且完整,而且这是我唯一的在有限的几分钟内生成出来的、快接近一分钟的长视频。

这个视频非常完整,既有故事性,又有画面感。只是这一分钟的视频暂时上传不了,要不然我都想发在查品馆了。

小槐花

1.目前还需要邀请码。

2.界面设计的还不错

3.前期我交互的流程:先上传一张参考图片,说出自己的想法,系统会根据图片和想法生成一个初步的草稿 ,我可以对草稿进行修改,确认好再开始,而且完善想法的这个交互过程并不消耗积分。(不是一步到位和给试错机会这点不错)

4.本来是为了测评,选择了一个形象图试着做一些视频,没想到效果还不错。

我要重点夸奖的是,它分了两个模块:

①. 第一个模块是常见的交互模式:给它素材,它返回一个生成结果。

②. 第二个模块是预剪辑(预览)功能:在素材基本确定后,它会提供一个类似于剪辑窗口的地方(就像我第三张配图里展示的那样),这个点设计得非常妙。这个设计的巧妙之处在于,它不是那种输入素材后就完全固定、只能按部就班往下走的模式,而是可以灵活替换。灵活的素材替换:比如我曾经处理第一个素材,也就是倒计时第10秒的场景。我原本是用一段4秒的原视频,让它配合每个视频剪辑1秒进来。但我发现第一个素材的声音其实出现在0.5秒到1.5秒之间,于是我让它单独去替换这一段。没想到它真的能领会我的意思,单独重新剪辑并替换了进来。这点我觉得非常妙!还有单个素材的重新生成:如果从单个素材的角度来看,后面有部分素材如果需要单独重新生成并替换,它同样可以做到。

5.讲一下目前有待提高的地方,我觉得主要在于预览部分: 我不明白为什么,可能是我替换得太频繁了,或者上下文太长,它后面重新生成,在替换了其中一个场景之后,预览的声音就没有了。但我导出之后又恢复正常了。我不太清楚这是哪里出了问题,但好在导出后的结果还是成功的。

所以总的来说,这依旧是一个非常良好的体验。

久久

我是两周前使用flova做的视频,在使用过程中发现了一些优缺点。

我做的case是张靓颖《野心家》的音乐动画MV。

从使用流程来说:

1.它首先询问了我音乐视频的整体愿景、风格、情感基调,以及相应的创意构想。

2.接着它生成了主角视觉形象,可以进行调整。

3.生成形象之后,它生成了前几个镜头的静态画面。如果有问题,也可以在此时进行调整。

4.可以接着生成之后的镜头也可以将前面的镜头制作成动画。

5.每个单独镜头生成的动画可以进行拼接。

直到最后生成一整个完整视频,使用起来都比较流畅的。

优点:

1.细节确认,当用户输入的指令不够清晰时,它会主动询问确认。

2.因为调用了各家模型接口,所以图片和视频片段生成效果总体不错。

缺点:

1.视频部分内容动作迟缓、不够流畅,缺乏连续性,存在动作重复的问题。

2.部分时候语义理解能力有待提高,比如无法对应歌词内容生成对应画面,需要进行调整。

3.最后整个视频内容的衔接存在问题,单个视频片段有连续性,但拼接在一起时部分内容存在空缺,后半段内容直接静止不动,需要想办法解决(后来我是把每个视频片段都下载下来,在剪映里完成的拼接)。

4.它的积分消耗较快,最开始有1000分,但是分数消耗到只剩200多积分的时候,也只做出了半个视频,没有完成整首MV。

总的来说,我还是愿意给good,因为当时想生成MV的时候,同时还使用了oiioii,非拉踩,但确实生成的效果不如flova。

降临派3190

非常丝滑的体验!夸夸!

优点:

1、agent使用丝滑,沟通方便(prompt咋写的求教。。。),真正实现了一键式的创作。

2、“引用”功能,在与agent对话过程中,方便精准修改

不足:

对一致性要求比较高的复杂场景及剧集(类似前后需要接戏的视频内容)可能还不太好实现,怎么创作摸索中。。。。

落叶

又是一个令人期待的视频Agent,最近优秀的视频领域产品也是越来越多了。

用它测了两个例子:一个是之前做的动漫项目;一个是前阵子比较火的知名IP角色唱歌的MV。

Flova首先会基于用户的输入总结内容概要、制定创作的流程。然后把流程做成故事线的形式,可以理解成后需要执行的计划。

与其他Agent不同的是,Flova似乎更倾向于把Agent和用户定位成协作关系,几乎每个节点都会停下来让用户确认是否要修改,在确认后才会执行下一个步骤。这一点算是见仁见智吧,可能有的人会觉得既然要用Agent,为什么还要人来确认每一个环节?不过在当下AI多模态领域还比较不可控、需要多次抽卡的阶段,个人认为这种环节确认还是有必要的。不过再优化一些的话,也许可以做成可选的模式?类似OiiOii中的托管模式/对话模式。(另外,实测在对话里直接告诉它后续动作可以不经过我确认直接生成也是可以的)

视频制作流程还是挺标准的,而且每个环节都集成了当前最强的模型(视频Sora2、图像Nano Banana Pro、音乐Suno、配音ElevenLabs),这个也算是当下Agent类的一个趋势了。不过这里有个小瑕疵,在做IP角色MV的例子中,正常应当先创作音乐,再基于音乐的节奏去匹配镜头长度等,但是默认的流程里直接就要给我生成分镜了,在我的提醒下调整了流程。

这两个测试最终的结果来说,都生成了比较完整且能看的视频(这已经很不容易了),但受限于我不是专业的AIGC玩家/模型自身能力限制/积分限制不能抽太多次卡等因素,最终的效果也各自有些遗憾。

具体来说——
动漫:严格来说对风格的识别不是很准确,我期望的风格应当是比较标准的赛璐璐,但是似乎出来的风格会有一些变动(偏硬朗漫改风?这里我也不专业),另外有个问题就是默认会把镜头切的有些过于碎了,导致节奏显得有些拖沓,我理解可能是希望运用自己相对专业的分镜方式去做一个拆分,但是Sora2出来以后其实是可以选择相信Sora2自身带有的一些分镜能力,去直接用多分镜生成单条视频的。
MV:这里的问题有两个方面,一是不支持数字人对口型(我问了它,回答是暂不支持);二是也无法精准分析音乐中的句子对应的时间段,也就无法在拼接的时候进行很好的音画匹配。

当然,视频类Agent都会受限于模型能力,以及使用者的专业度。不过从我这种非专业用户的视角来说,总体感受就是通用任务的思路、流程和执行都是OK的,但是会欠缺一些垂直领域需要的东西。

以及补充几个使用过程中其他的小建议:

一个小bug:在首页输入文本时,如果输入过长(比如我把生成好的剧本都贴了进去),后面在文本框里打字,页面会始终往下跳,导致我看不到文本框;

优化点1:在故事线中,每个节点的名字可以让用户更容易懂一些,现在看起来都像是代码里用的字段名字,普通用户可能不太容易理解;

优化点2:目前看好像没有存角色资产的功能。可以考虑增加“角色”的沉淀,满足用户做类似短剧的需求,有助于保持角色的一致性。

glq

1、产品支持很多图片、视频模型,可以自动选择对应的模型

2、内置视频的生成过程,并可一步步的生成,即使没有做过视频的制作或处理,也基本知道下一步要如何做

3、对于一些没版权的IP,可提供多个选项,让用户选择

4、因为视频的过程比较耗时,所以为了保证效果,在每一步都会增加用户确认,感觉这个确认是有价值的

5、感觉对于中文的支持不那么友好,在生成过程中,有一部分是英文

6、生成的视频感觉整体的连贯性相对差一些,感觉分段的有点割裂