Medeo 1.0 终于上线了,这是我认为第一个真正意义上的视频 Agent

试了一下相当惊艳,具体的特点有:

- 支持非常灵活的通过自然语言进行修改
- 支持超过上千字的超长提示词
- 提供非常好的泛化性,各种风格和垂类都可以做。

写了基础教程,并探索了三套非常好的提示词:https://mp.weixin.qq.com/s/ltoRVzX-6MHkRw8hl3qyNQ

由于篇幅所限这里先分享一下 Medeo 的基础教学和使用技巧以及他们关于视频 Agent 的思考

学一下基础操作

1️⃣第一个部分是他们的一些模板,这里不是只有画面风格,他包含了画面、台词、剪辑方式以及音乐等一系列优质视频的必要要求,你可以选择一个你喜欢的直接套用。

2️⃣第二个部分很好理解了,你可以选择生成横版或者竖版视频,这里目前只支持 16:9 以及 9:16 两个常见比例。

3️⃣第三个部分,里面支持超多的自定义设置,如果你对细节要求较高可以选择,比如视频时长、具体生成的类型只生成图片或者是视频、画面风格、配音的声音。

4️⃣最后一个部分是素材上传,支持直接从 URL 里面拉取其中的文本和图片作为素材,也可以自己上传对应的文本和图片。

基本上,你在输入框直接描述你的视频生成需求,就可以开始创作。

而且这里你也不需要过于详细地描述需求,因为 Medeo 是支持后续通过自然语言对生成的视频进行修改的。

比如,这里前面有两段素材重复了,你就可以告诉它这两段素材的位置,然后让它重新生成,并且替换。它可以很完美地执行这些操作。

当然,更简单的是让他自己找出重复的素材然后替换也行。

Medeo 几乎支持市面上常见的所有图像和视频模型

由于非常强的泛化性,你可以通过提示词指定他具体使用哪些模型生成图片或者视频,再或者直接用 Sora 这种模型直接生成完整视频。

他甚至非常聪明地自己在决定什么时候该用文生图,什么时候该用图生图。

除了支持自然语言编辑,Medeo 依然支持在左侧使用你熟悉的剪辑页面编辑,这个也是独一份的体验。

你可以拖动每个分镜的边界线去控制分镜的时长,也可以直接在 Audio script 部分编辑对应文案,还能具体定义每个音频的音量和时间。

他们为什么可以做好

从官号和跟他们日常聊天了解了一下,他们为了实现质量和灵活度都兼顾的 Agent 架构做了哪些事情。
 
 
Back to Top