先说结论:
1.默认语音是英文的,没有字幕,对中文用户不友好。我用中文写的提示词,也会先转成英文再生成视频,中间翻译可能导致歧义。
2.视频生成会有幻觉,连贯性处理得“很有艺术感”,比如我说做的事情是“写作和运动”,可能会生成左手在“写作”,右手在“运动”。
3.生成视频空间错位。比如生成一个人与办公桌的画面,人可能是从办公桌上面穿过来的。
4.说完缺点,再说说优点:界面是比较美观的,编辑工具也比较多,但是工具对非影视剪辑专业的小白用户来说,引导不够清晰。而我认识AI视频工具的作用就是让更多小白用户参与进来,这可能是个可以改进的方向。
生成提示词:
“请帮我做一个年度总结视频,bgm是宏大激昂的,比较燃和卡点。内容是总结我2025做的事情和2026要做的事情。我2025的事情是阅读、写作、运动,2026要做的事情是阅读、写作、运动、工作提升。”
生成效果:
整体上理解了意思,生成了几段分镜。其中有段分镜空间错位,单独编辑之后,重新生成了,但是重新生成的片段引入了较多的幻觉问题,还是不能使用。bgm比较符合我的描述,还可以。数字细节比较模糊,比如“00:00:00”的时间卡点,中间多了一竖。
其他:
上次是听了梁巍老师上的播客,知道了这个产品的,抱了很高的期待进来,生成结果差强人意吧,不过感觉这个方向确实是很好了,以后模型能力提升之后,应该会有较好体验。