Medeo

AI 视频生成平台。...

Medeo 是全球首个全品类对话式 AI 视频创作工具,通过口语对话即可完成从创意 ➡️ 成片的完整视频制作流程。让视频创作像聊天一样简单,让每个人都能成为视频导演。

核心功能

  1. 智能聊天:用自然语言对话,它会各个环节给你灵感、修改内容,或者通过语言自定义工作流

  2. 创作规划:撰写脚本、拆分场景、规划节奏

  3. 素材匹配与生成:根据脚本和指令,模型匹配媒体素材、语音音色、背景音乐,非常贴合内容(有AI素材、有stock footage)

  4. AI 剪辑:输出工程化文件,将需要的素材在时间轴中编排,除了对话剪辑,还支持轨道编辑

25 个评论

白菜海龟汤

这是一位有脑子的AI导演,但是手底下的人干活有点子偷懒

最近半个月分别使用了Medeo和Flova来制作视频,都是我提前设定好的角色,可以说两位有让我惊喜的地方,也分别有让人觉得遗憾的点。

先来谈谈Medeo。再很多AI视频agent和大模型都在拼画质和物理规律的时候,Medeo已经进化成一个正儿八经的AI视频导演了。

1/ 反直觉的制作逻辑

最开始用 Medeo 做视频时,我下意识以为它和大多数视频制作AI一样:我给 Prompt,它给我做图,然后吐视频,再配音乐。

但是我发现它居然是先做音频,再反推画面!

也就是说,它并不是传统的先生成素材,而是先生成叙事。当我输入提示词后,它没有急着去生图,而是先制作了所有的旁白配音。它精准计算了这句话要读 4 秒,然后才转头去指挥底层的视频模型:“给我生成一个 4 秒的画面”。这个逻辑有种言出法随的感觉。

我查了一下,这在专业的剪辑领域叫“Audio-Driven Editing”(音频驱动剪辑) 或者“A-roll First”,对于包含解说或对话的视频,这是目前最科学的流程。这么做的好处显而易见:音画完美同步。

以前用 AI 做视频,最痛苦的就是画面生成了 3 秒,配音有 5 秒,或者反过来,只能在剪辑软件里各种花式拼接。Medeo 这种“先定时间锚点”的策略,直接把这个坑给填了。

这种策略的另外一个好处,我猜是不是Medeo的团队都很精啊,音频生成的成本比视频低,音频就像是更便宜的草稿。先生成音频就可以把视频消耗的成本控制住。如果先做画面,万一做多了要删减,做少了要重生,都是在浪费钱。

最后一点,我还没有测试过,不知道是不是真的如此。那就是如果先做音频,配音的语速、停顿等会呈现不同的波形,那么Agent是否就可以通过波形来指导哪里有停顿,适合切镜头,哪里语速快,画面要紧凑。

2/ 它居然还会看碟下菜

还没完,正当我以为这就是 Medeo 的固定套路时,我又丢给了它一个公司年会开场视频的需求。

这次它变了。

它是按我的分镜要求直接生成视频片段的。

这时候我才觉得这个 Agent 是真的有点东西。它似乎能识别任务属性:

  • 做科普/公司介绍:这是听觉逻辑,叙事优先,画面跟着旁白走。

  • 做年会/MV:这是视觉逻辑,视觉优先,画面怎么酷怎么来,音乐只是氛围组。

至此,Medeo的工作流优势很明显了,叙事清晰,节奏完整,自动化程度高,像科普视频,公司宣传介绍这类视频,几乎一次出来就能用。我想在这种灵活的逻辑之下,AI视频的专业化工业化商业化是不是指日可待了。

3/ 理想很丰满,现实...还是有点bug

虽然 Medeo 的脑子很好用,但在高强度的实战中,我还是发现这位AI导演在手艺上的一些硬伤。

首先是那个让人又爱又恨的全自动。

除非你在一开始就按着它的头说每一步都停下来问我,否则它真的会一键把脚本、配音、分镜全干完。虽然它在左侧资产库里贴心地保存了所有中间素材(这点好评,方便复用),但一开始爽了,后面要修改的时候头就大了。

其次是可以自由拖动的分镜。

Medeo 的 UI 设计得很好,就像剪辑软件一样,直接把分镜、时间轴、字幕和配音严丝合缝对应起来,而且我可以直接在上面拖动分镜条来延长视频——但是!画面是延长了,旁白并不会自动续写。这就导致视频还在动,旁白已经没了。这让这个功能好像看起来很人性化,灵活程度很高,但实际上我拉了好几个分镜,延长的效果也就是镜头的远近推拉,是硬凑时长,并没有实际的增效作用。所以这个功能就是有点并没有什么x用的感觉。

最要命的是商业视频的死穴——Logo 和文字。

做一个公司宣传片时,我上传了一个logo图片,要求在视频中出现这个logo。这时候Medeo就有点死脑筋了,就是原封不动把原图展示了一下,甚至连抠图都不会。于是我原本16:9尺寸的视频在开头和结尾都非常不和谐的出现了正方形尺寸的画面(因为原图就是一个正方形的白底图片),像是ppt展示。

更要命的是,在我要求在某个分镜中出现的电脑屏幕里嵌上这个logo,Medeo 的逻辑不是贴图,而是重新画了一个。同理,场景里的文字也经常是乱码。

还有那个薛定谔的“人物一致性”。

做年会视频用了 4 个角色,虽然喂了参考图,但是一开始是完全直接生成了不相关的四个人。这个视频我唯一的要求一开始就是直接使用我上传的四个角色形象,但就是这一点就这么难。动态效果还不错的时候,人物就是完全不相干;人物稍微有点对了的时候,动效又很崩,要不是这里没法上传视频,真的很想让大家伙儿看看那个稀烂的效果。

想维持住人设,还是得疯狂抽卡重试。关键是Medeo似乎跟oiioii一样顽固,不听话程度也就是比oiioii稍微好一点吧。在我使用过的AI视频产品中,目前我认为人物一致性和画面效果相对最好的事Flova,当然Flova也有很大的问题,下次单独写一篇再说。

此外,Medeo的画面效果很多时候做出来有点之前在网络上很火的在新东方学动画3年后做的动效的感觉,人物呆板僵硬,也有好的时候,但是我发现它经常就有一种为了努力保持住人物一致性,只能让人物尽量少动。按理说现在这些视频Agent应该都用的目前最流行效果最好的哪些视频模型,但是这效果真的也挺难绷的。

最后,Medeo这个工作逻辑如果能够再灵活一些就更好了。比如说我的年会视频,实际上是强叙事+强视觉的融合,如果能够根据我的分镜设定来选择不同的工作逻辑完成不同的分镜段落设计是不是最终的效果就会更好。

本想不做任何限定要求再做个动画试试会不会好一点,奈何做了3个视频,积分耗尽了。这里也建议每一次执行动作最好能像Flova一样显示消耗了多少积分。

写在最后

用完 Medeo,我最大的感受是:它的产品哲学是领先于它背后的模型能力的。它现在就像一个刚从电影学院毕业的导演,有才华,理论满分,分镜逻辑无敌,但是手底下的人技术不够硬。如果你是做强叙事的科普视频,它是神器;但如果你要是做对一些细节和人脸要求极高的商业硬广,可能还是得自己上手修修补补。但是不管怎么样,我觉得Medeo都像是AI视频从玩具走向工具的一个分界线,也许真正的AI视频时代就要到了。

AI吃瓜爱降临派

总体来说体验中等偏上,给个good

优点:

(1) 页面上剪辑的模块很明显,可以比较方便地一站式出视频,不需要再去其他软件。

(2) 图片和视频的质量很高,只有一张图片小猫的取景是不全的,有3个视频是合格的,我会继续做下一段。

缺点:

(1) 最开始可以生成6张图片,但是并没有给到一个挑选的停顿,而是继续自动做下去。感觉如果这里可以提供一个选项的设计会比较好,可以节省一些积分。因为生成5个6s的视频以后我就没积分了......

(2) 好像不可以单独提取音频。

Micheal024

卧槽效果真的不错

仅需要一句话就和我预期想要的差不多,虽然有点音画不一致加对文本处理的幻觉,但是画面效果这个不错

虽然我不太懂剪辑,但是他的这个剪辑的模块完全可以让我微调,我觉得这种形式非常的好,这种把我需要的素材无脑创建好剩下的留给用户的模式,真的抓到了当下用户真的会『懒』的心理,原本以前的AI视频都是自己在类似于海螺、万相、即梦等平台生成的视频片段加suno等生成的音频放到剪映上面去一点一点的剪很浪费时间加很折磨,我觉得这种形态很牛逼,他真的知道用户最需要的是什么!

除了稍微有点小贵(确实有点小贵了,但是相比于之前做视频的成本来讲已经便宜非常多了)加我想开发票官网的人工客服没理我之外没什么我觉得有问题的地方了

海浪

有详细的去看这个软件的介绍说明。首先看到许多其他的产品,更多是动漫与漫画或者油画的风格。看其他成品的效果还是十分的惊艳的。首先画面优良,并且画面的逻辑是成立的。比较流畅,转场的话也没有违和的感觉。

其次,登录这个软件注册之后,我想创造一个也是动漫风格的视频。但是在我经过一段时间的等待之后,他直接提示我积分不足,需要充值,这个让我感觉就非常的尴尬。首先我有没有体会到自己去做出一个成品的效果,其次,在没有生成自己想要的成品之后,就开始收费。这点我肯定是抗拒的。

希望这个软件改善的可以让用户先进行体验,这是软件最基本的原则点~希望这个软件在现有的风格上越做越好。

洪秉文Marvin

体验这款短片生成工具的第一下,给我的感觉是 “快剪”+“一键导演” 的结合体!

既有在一分钟内快速成片的爽感,还有 “配音 + 台词 + BGM” 齐备的完整度。

每当我把一个灵感一句话丢进去,它就能产出一支完整的小短片;BGM 衔接到位,台词和配音也贴合主题,成片观感让人有点惊艳。更重要的是,这是一种 “随心而动” 的创作方式:没有门槛,没有负担,想到就做,像在朋友圈或社区里分享生活的即时表达,带来很鲜活的情绪价值。

从人群来看,它更偏向广大的 C 端创作者。对于专业的 B 端用户,现阶段依然需要更重、更体系化的生产工具去做长内容和多文本的复杂编排。但在 “短平快” 的场景里,这款产品非常合适:拿来做 demo、做尝试、做灵感速写,都很对路。降低视频创作门槛之后,社区里会冒出很多开发者都没预料到的点子 —— 像OiiOii那样,灵感和同人作品会层出不穷,这块市场我是乐观的。

值得优化的地方:

一是长内容的能力还不够。

目前Medeo更擅长一分钟内的短片,尚不支持长视频、长剧集或多场景的连续表达。建议逐步强化长篇结构的支持:例如多镜头脚本编排、分场景时间线、段落级过场与转场逻辑、节奏控制工具等。



二是素材与计算成本偏高。

成片完整度高的背后,是不低的生成与素材成本。建议未来在商业模式上做更友好的设计。

三是商业化路径尚待验证。

总的来说,我对它当前的使用场景与方法是乐观的:拿来做灵感速写与短内容表达,门槛极低、完成度很高、观感令人满意;但对后续的商业化路径我保存疑虑。

期待创作团队在下一阶段明确产品的方向,把这份 “随心而动、即刻成片” 的愉悦感,带到更多用户与更多内容形态里!