Genmo AI 通过推出 Mochi 1 这一强大的 开源AI视频生成器,彻底革新了整个行业。无论你是寻找模型权重的开发者,还是想要找一款 Runway 替代品 的创作者,这篇 Genmo AI 评测 将深入探讨它的性能、功能特点,以及如何将其整合到你的 万兴喵影视频编辑工作流.

第一部分:什么是 Genmo AI?
Genmo AI 是一个以研究为导向的 AI 视频生成平台,由 Ajay 和 Paras Jain 于 2022 年创立。该 公司的使命 是"解锁通用人工智能的右脑"。它本质上是在构建能够以 任何形式 创造性地模拟视频内容的 AI。
与其他顶级 AI 视频生成器 一样,Genmo AI 在 文本生成视频 和 图片生成视频 方面表现出色。通过使用 Mochi 1 模型,用户可以在几秒钟内将描述性的 文本提示词 转化为高质量的 电影级 AI 视频 该平台使用自己的旗舰模型 Mochi 1,为 AI 视频生成领域带来了又一个强有力的竞争者。

认识 Mochi 1:Genmo 的旗舰模型
Mochi 1 基于 100 亿参数的扩散架构 构建,采用了一种名为非对称扩散变换器(AsymmDiT)的专有设计。"非对称"部分意味着该模型用于处理视频数据的参数 大约是文本的四倍,这就是为什么它在处理动态效果方面往往优于大多数工具。
第二部分:Genmo AI 的核心功能:Mochi 1 的独特之处是什么?
Genmo AI 完全基于网页端。它目前的功能涵盖了大多数创作者开始生成 AI 视频所需的全部范围。
1. 文本生成视频
首先,你可以通过书面提示词生成视频片段。Genmo AI 文本生成视频功能简单直接,就像其他任何工具一样。输入你想制作的内容,选择 AI 模型,然后开始创作。除了 Mochi,Genmo 还提供 Replay 作为替代模型。它消耗的积分更少,但输出质量无法与 Mochi 相提并论。

2. 图片生成视频
使用 Replay 模型创建视频时,你可以上传图片并将其动画化为动态片段。因此,Genmo AI 图片生成视频功能并没有自己的专用标签页。它被整合在主创建界面中。也没有 AI 特效或模板来帮助你更快上手。你需要从零开始。

3. 相机运动和特效控制
大多数工具要求你通过提示词设置相机运动,这听起来很简单,但当你盯着空白文本框不知道该写什么时就不是那么回事了。这就是为什么初学者通常会跳过这一步。但 Genmo 通过其 Replay 模型的专用相机运动和特效控制解决了这个问题,包括平移、缩放、倾斜和旋转。特效预设库包括:
- 花朵
- 忍者
- 星星旋转
- 螺旋等更多效果

4. 社区中心
Genmo AI 不仅可以让你生成视频。你还可以在社区中心看到其他人正在制作什么以及他们是如何编写提示词的。重新混合他们的作品,保存任何值得回顾的内容,或者在需要灵感时浏览热门内容。

开源 AI 视频生成模型
Mochi 1 在 Apache 2.0 许可下发布,任何人都可以下载权重、微调模型,甚至无需支付版税就可商业使用。该公司获得了由美国风险投资公司 NEA 领投的 2840 万美元 A 轮融资 支持,这为他们持续开发模型提供了充足的"资金跑道"。
第三部分:分步指南 - 如何在项目中使用 Genmo AI
Genmo AI 免费吗?在 Genmo AI Playground 上创建 AI 视频需要账号和每次生成的积分。定价方案可以查看下方。
|
免费版 |
轻量版 |
标准版 |
|
|
价格 |
$0 |
10 美元/月 或 96 美元/年 |
30 美元/月 或 300 美元/年 |
|
月度积分 |
50 |
1,200 |
5,000 |
|
水印 |
|||
|
商业使用 |
|||
|
速度 |
标准版 |
快速 |
优先 |
|
显示更多
收起
|
|||
需要注意的是,使用 Mochi AI 视频生成模型 每次生成需要 100 积分。如果你免费使用 Genmo AI,只能使用它的 Replay 模型,因为它每次生成只需 10 积分。
如何使用 Genmo AI 视频生成器


注意:要使用 Genmo AI 图片生成视频功能并添加图片作为参考,请将模型设置为 Replay,然后点击上传按钮添加你的参考图片。

获得更好效果的提示词技巧
如果视频效果不理想,请检查并优化你的提示词。输出质量在很大程度上取决于你描述的具体程度。以下这些技巧往往能带来真正的改善:
- 描述光照。使用"黄金时刻光照"、"阴天漫射光"和"霓虹灯照亮的小巷"等术语为模型提供有用的上下文。
- 清楚地描述主体的动作。不要只说"一个女人在走路"。而要说"一个穿红色外套的女人在雾蒙蒙的街道上缓慢行走,低着头看"。
- 保持提示词在 150 个词元以内。 超过这个长度的提示词生成失败率更高。在提示词过载的压力测试中,失败率约为 12%。
第四部分:Genmo AI 评测 - 优缺点
那么,Genmo AI 视频生成器实际表现如何?纸面上的平台往往与实际交付的结果大相径庭,反之亦然。我们对它进行了测试,以下是我们的发现。
动态质量不错,但并不完美
Mochi 1 生成的结果就其成本而言相当不错,尤其是在照片级真实感方面。动态流畅,镜头运动也不错。片段的整体效果足以满足大多数使用场景。另一方面,Replay 很难推荐用于快速测试以外的任何用途。

值得注意的是,Mochi 1 在物理和现实模拟方面仍可能感觉不太对劲。布料逆风移动、身体动作僵硬、手部弯曲方式不太正确——诸如此类。缺乏音频也很难忽视,你需要在后期制作中单独添加声音。
视觉风格也往往偏向过度抛光,这通常是最先暴露其为 AI 生成的地方。另一方面,风格化或动画内容的输出效果往往也显得不自然。如果那是你的使用场景,这可能不是适合的模型。

提示词遵循度和输出质量
只要你清楚地指定相机运动、光照和主体行为,Mochi 1 遵循详细提示词的可靠性比大多数开源替代品更高。480p 的分辨率限制和偶尔的变形问题使其尚未达到可用于正式制作的水平。在将视频发布到 YouTube 等平台之前,你可能需要先对视频进行升级。
Genmo AI 的优缺点
总结来说,以下是 Genmo AI 视频做得好的方面以及仍存在不足的地方。
- 与大多数开源模型相比,具有出色的动态质量和时序连贯性
- 专用的相机运动控制
- Mochi 1 在 Apache 2.0 下完全开源,具有商业使用权
- 提供免费套餐,每月赠送免费积分
- 社区中心可让你直接从其他用户的提示词中学习
- 视频分辨率上限为 480p
- 无音频;生成的片段完全静音
- 免费套餐限制你只能在 Genmo Playground 上使用 Replay 模型;Mochi 1 需要更多积分
- 在特定场景下物理准确性仍可能崩溃
- 没有与主流编辑软件的原生集成
- 视频中的文本渲染仍然较弱
- 片段很短,目前每次生成最长约 6 秒
- 不适合风格化作品
第五部分:Genmo AI 与竞品对比 - 表现如何?
在 Genmo AI 之前,我们已经熟悉了 Runway、Kling 和 Sora 等工具。既然 Mochi 1 据说可以与这些高级 AI 生成模型竞争,让我们看看这一说法在实践中是否站得住脚。
|
Genmo AI |
Runway |
Kling |
Sora |
|
|
分辨率 |
480p |
1080p |
1080p |
720p–1080p |
|
最大片段长度 |
6 秒 |
16 秒 |
15 秒 |
25 秒(专业版用户) |
|
免费版本 |
||||
|
定价 |
10 – 30 美元/月 |
15 – 95 美元/月 |
100 单位起价 9.79 美元 |
通过 ChatGPT Plus(20 美元/月)或 Pro(200 美元/月) |
|
原生音频 |
||||
|
最适合 |
开发者、实验 |
专业制作、品牌内容 |
具有角色一致性的多镜头叙事 |
电影级视频 |
|
显示更多
收起
|
||||
基于 ELO 评分,Mochi 1 可以与这些成熟工具竞争,其得分使其位于基准测试的顶端。它在所有评估模型中的动态流畅度和空间真实感方面排名最高。

但根据我们的测试和观察,我们可以得出结论:
- Genmo AI 适合想要功能强大的开源模型并进行商业构建的开发者. 它的动态质量表现良好,但短片段长度和低分辨率仍使其本身尚未完全达到可用于制作的水平。
- Runway Gen-4.5 提供更清晰的细节、更强的时序一致性和更好的提示词遵循度。权衡之处在于成本。你的积分消耗很快,而且它完全是专有的。
- Kling 3.0 的视频输出仍然是消费级 AI 视频类别中的佼佼者,具有逼真的物理效果和角色一致性,最适合多镜头项目。
- Sora 仍然是照片级真实感和电影级 AI 视频的基准,但访问权限仍是问题。Sora 2 仍仅限于少数几个国家,这使得全球大多数创作者无法使用。
与其他先进的 AI 模型相比,Genmo AI 的 Mochi 1 仍有需要改进的地方。但考虑到该模型还处于早期阶段,随着开发的继续,有充分的理由保持乐观。
第六部分:整合工作流 - Genmo AI + 万兴喵影
你在 Genmo AI 中生成的 6 秒片段本身几乎不足以完成一个真实项目。片段是静音的,分辨率需要提升,色彩分级也很平淡。你需要完成后期制作才能完成完整视频。
由于 Genmo 缺乏原生编辑器,最佳工作流程是将片段导入 万兴喵影。作为专业的 AI 视频编辑器,万兴喵影可以 升级 Genmo 视频、添加 AI 生成的音乐,并应用 专业级色彩分级,使你的 AI 片段达到可用于制作的水平。
万兴喵影是一款既能生成 AI 视频又能在多轨时间线中编辑它们的 AI 视频编辑器,因此你无需在五个工具之间切换即可完成一个项目。
在时间线中生成和拼接片段
万兴喵影还包含由 Sora 2 和 Veo 3.1 等模型驱动的内置 文本生成视频 和 图片生成视频 工具。当你需要更多素材时,可以直接在万兴喵影内生成额外的片段,并在其多轨时间线中组合所有内容。
延长你的 AI 片段
你的 Genmo AI 视频结束得太突然?万兴喵影的 AI 延长 功能可以分析你的片段并生成前一个或下一个场景,使其自然融合。对于声音,你可以使用 AI 音频拉伸功能使音频长度与视频匹配。
添加音频和旁白
由于 Genmo AI 输出的是静音片段,你可以使用万兴喵影的 文字转语音 功能直接添加声音。有大量自然发声的声音可供旁白选择。对于背景音乐,可以浏览内置音频库或使用 AI 音乐生成器.
生成自定义曲目
使用特效、滤镜和色彩分级增强片段平淡的 AI 素材在万兴喵影中很容易修复。应用滤镜或手动调整 色彩分级
以获得你想要的效果。如果你想在片段上添加视觉特效,可以浏览、下载和使用万兴喵影的特效库,无需依赖外部平台。
总结
Genmo AI 作为一个以研究为导向的平台,正在突破开源视频生成的边界。在大多数情况下,它实现了这一承诺。但由于该模型仍然相对较新,在使用之前你应该了解一些局限性。
常见问题
-
Genmo AI 导出哪些文件格式?
Genmo AI 以 MP4 格式导出生成的视频,该格式兼容大多数编辑软件和社交媒体平台。
-
在 Genmo AI 上生成一个视频需要多长时间?
时间不等。生成一个 Genmo AI 视频的等待时间通常不长,除非您的网络连接不稳定。
-
Genmo AI 可以在移动端使用吗?
Genmo AI 完全基于网页运行,因此您可以通过手机浏览器访问,无需下载应用。

