我昨晚用Flova的第一反应不是震惊,而是嫉妒。就是余华看莫言写书那种“吗的 这么牛逼东西怎么做出来的”。
然后我用了一天一夜(真一天一夜,20美元积分用的干干净净),总算做出来一个还凑合的产品。
我的感悟就是,好的作品需要极致的打磨, Flova 极大缩短了打磨的时间。
因为有oiioii这款优秀的产品珠玉在前,所以我用Flova的时候总是不自觉和oiioii对比。
首先是交互形态上,Flova没有采用比较流行的画布形态。而是使用了线形故事板。针对用户输入的情节,划分为很多个片段。每个片段可以看做一个独立的模块,每个cut又包含多个分镜。形成一个比较有结构层次的划分。每个cut按照先脚本再图片再视频再音频再配音,每个都是独立的,哪里不满改哪里。减少了用户满意视频不满意配乐那种困扰。
Flova有一个很天才的设计,就是会根据脚本来在最开头确立主要人物角色的形象。 这样的设置保证了在多个cut中主体人物的一致性。 也确保了单独修改某一个cut 其他部分不受影响。
其次我很满意的一点是Flova的模型有的极强的语意理解。完全可以通过和模型对话删除故事线(P6)的某一cut 或者重新拼接,或者给出建议(怎么做的能不能教教俺....)。cut引用机制让模型在我已经拥有了极长的对话历史的情况下,依旧可以准确的定位到我要修改的那部分。
同时在每一轮操作完成之后,Flova会给出建议指导我下一步应该去做些什么,是推进还是修改。GPT5也会出现伪执行的情况,但我在flova中没有看见。 对于小白来说上手也十分简单。
相较于oiioii的一键式生成,Flova无疑在细节把控上更胜一筹。
但是也有做的不好的地方:
1.图片生成质量没的说,顶尖,但是视频生成的质量一般般。 我看到Flova集成了Sora2、Veo3.1(fast)、Seedance 1.0 Pro等等。 但是视频需要大量的抽卡。 我个人认为可能是视频提示词的调优不过关,或者是生成的方式不对。
前面说了 为了确保 任务一致性 Flova采用了先图后视频,打开看了下采用的方式是通过首帧来生成视频。
这样操作下其实有两个缺点:一是生成视频的末尾人物会变形。 二是人物太死板 缺少那种灵动性。 给人的感觉是那种动态漫画。 只是一个原本静止的人物增加了一点动态效果,而非是激烈的动画。(P7 大量抽卡导致积分消耗巨大)
2.配音配乐拉垮。 是个减分项。AI味道配音减消除漫画的热血感。虽然支持音轨调节(P8)但我不理解的是,既然脚本识别可以判断出创作的这个视频的主旋律,为什么音频识别不了呢。 我创作JOJO这样的热血漫配一个软绵绵的声音很奇怪。 同时为什么配音为什么不能自己设定内容呢,从完整性来说, CV本身就是一个视频很重要的一项(尤其对于动漫来说)。而且音频卡点也不太对。
3.有一些cut 会莫名其妙出现日本描述。叽里咕噜说啥呢看不懂。
总体评价真的很不错,如果可以优化视频生成质量这一步,绝对是一个顶级优秀的产品。