语音转文字 / 文字转语音 / SRT | 万兴喵影 Windows
语音转文字 / 文字转语音 / SRT 这些功能旨在提升配音与字幕编辑的效率,为用户提供更便捷、精准的创作体验。
语音转文字 (STT)
语音转文字应用场景
- Vlog 博主:在录制语音视频后,快速将视频转换为文本,并自动生成字幕。
- 教培行业:录制课程后,可将音频转换为文本,并将其附加到视频中以供学生参考。
- 播客主播:将音频转换为文本,方便听众查看内容摘要或获取文字版。
- 记者:将采访音频转化为文本,便于后期编辑、引用或撰写文章。
- 商务人士:会议记录转换为文本,确保记录的准确性,并能便捷地与团队共享。
语音转文字功能入口
- 方法 1:从启动页进入(最高效方式)新
- 方法 2:在时间轴中选择音视频素材,点击工具栏中的【语音转文字】图标。如果时间轴中没有对应的文件类型,该图标将不会显示。
- 方法 3:右键点击时间轴中的音频素材,选择【语音转文字】。
- 方法 4:右键点击项目媒体中选择音频素材,并选择【语音转文字】。
- 方法 5:在项目媒体中选择音频素材,点击顶部菜单栏中的【文字】,选择【智能字幕 > 语音转文字】。
通过全新的简化操作,你可以在打开万兴喵影后立即使用 AI 字幕功能,轻松生成字幕,大幅提升创作效率。这是当前最快速的启动方式。
1. 在万兴喵影启动界面,【新建项目】区域下方找到快捷工具栏,点击【添加字幕】按钮。如未找到,可前往【工具箱】进行操作。
2. 弹出导入窗口后,从电脑中选择需要进行转录的视频或音频文件。
语音转文字参数设置
在 STT 参数设置栏中,选择音频文件的语言,并勾选【自动匹配】。该功能支持双语字幕的直接翻译转写。
注意:
在语言选项中,选择待转写音频的语言类型。任务列表
任务列表展示文件的转码与转写进度,按导入顺序排列,并支持上下滑动查看。用户可以实时查看任务状态。
文件生成
完成的转写内容将以 SRT 格式或文字片段生成并显示。
文字转语音 (TTS)
文字转语音应用场景
- 新闻播报:满足无法配音或不愿使用自己声音进行配音的需求,例如新闻报告。
- 游戏开发:为游戏角色提供对话配音,支持快速测试与版本迭代。
- 内容创作者:通过 TTS 将视频翻译成多种语言,并生成相应的语音配音。
- 教培行业:在不录制自己声音的情况下,使用 TTS 生成在线课程的语音配音。
文字转语音功能入口
- 方法 1:在时间轴中选择标题素材,点击工具栏中的【文字转语音】图标。如果时间轴中没有支持的文件类型,该图标将不显示。
- 方法 2:右键点击时间轴中的标题素材,选择【文字转语音】。
- 方法 3:点击时间轴中的标题素材,再选择右边顶部菜单栏中的【文字转语音】。
文字转语音参数设置
在 TTS 参数设置栏中,选择文本语言和配音语音。您还可以通过拖动滑动条调整语速与音调,定制语音效果。
注意:
如果需要自动匹配时间轴的转写内容,请勾选【自动匹配】。文字转语音任务列表
双击任务列表中的已完成项,生成的语音文件将被高亮显示。
文字转语音文件生成
生成的语音文件将以 MP3 格式保存,且会自动存储在【媒体】库中,文件存储路径与万兴喵影的默认文件路径相同。
SRT 导入/编辑/文字转语音
万兴喵影支持导入其他工具导出的 SRT 字幕文件,用户可以在万兴喵影中进行更为便捷的编辑与处理。
SRT 导入与编辑流程
- 从【媒体资源区】直接导入 SRT 字幕文件。
- 在时间轴中右键点击 SRT 文件,选择【高级编辑】或双击文件进行编辑。
可进行以下编辑操作:
- 编辑时间码。
- 修改字幕文本内容。
- 添加、删除或合并字幕条。
- 调整字幕样式(与万兴喵影高级文本编辑功能相同)。
文件导出
在时间轴中选择 SRT 文件,右键点击并选择【导出字幕文件】进行保存。
SRT 文件转语音
若不喜欢视频中的配音,用户可以通过万兴喵影将 SRT 字幕文件一键转换所选语言。
在设置窗口中,选择所需的语音并调整音频设置,点击【生成】开始转换。
📌注意事项:
为确保您在使用万兴喵影 AI 功能时的操作透明与合规,请仔细阅读以下提示:
- 软件界面会明确标识所有由 AI 技术生成的内容,方便您清晰区分。
- 为保障内容的可追溯性,导出或下载的 AI 生成素材可能附带可见或隐藏的水印信息。
语音转文字 / 文字转语音 / SRT | 万兴喵影 Mac
语音转文字 / 文字转语音 / SRT 这些功能旨在提升配音与字幕编辑的效率,为用户提供更便捷、精准的创作体验。
语音转文字 (STT)
语音转文字应用场景
- Vlog 博主:在录制语音视频后,快速将视频转换为文本,并自动生成字幕。
- 教培行业:录制课程后,可将音频转换为文本,并将其附加到视频中以供学生参考。
- 播客主播:将音频转换为文本,方便听众查看内容摘要或获取文字版。
- 记者:将采访音频转化为文本,便于后期编辑、引用或撰写文章。
- 商务人士:会议记录转换为文本,确保记录的准确性,并能便捷地与团队共享。
语音转文字功能入口
- 方法 1:从启动页进入(最高效方式)新
通过全新的简化操作,你可以在打开万兴喵影后立即使用 AI 字幕功能,轻松生成字幕,大幅提升创作效率。这是当前最快速的启动方式。
1. 在万兴喵影启动界面,【新建项目】区域下方找到快捷工具栏,点击【添加字幕】按钮。如未找到,可前往【工具箱】进行操作。
2. 弹出导入窗口后,从电脑中选择需要进行转录的视频或音频文件。 - 方法 2:在时间轴中选择音视频素材,点击工具栏中的【语音转文字】图标。如果时间轴中没有对应的文件类型,该图标将不会显示。
- 方法 3:按Control键+点按时间轴中的音频素材,选择【语音转文字】。
- 方法 4:按Control键+点按项目媒体中选择音频素材,并选择【语音转文字】。
- 方法 5:在项目媒体中选择音频素材,点击顶部菜单栏中的【文字】,选择【智能字幕 > 语音转文字】。
语音转文字参数设置
在 STT 参数设置栏中,选择音频文件的语言,并勾选【自动匹配】。该功能支持双语字幕的直接翻译转写。
注意:
在语言选项中,选择待转写音频的语言类型。任务列表
任务列表展示文件的转码与转写进度,按导入顺序排列,并支持上下滑动查看。用户可以实时查看任务状态。
文件生成
完成的转写内容将以 SRT 格式或文字片段生成并显示。
文字转语音 (TTS)
文字转语音应用场景
- 新闻播报:满足无法配音或不愿使用自己声音进行配音的需求,例如新闻报告。
- 游戏开发:为游戏角色提供对话配音,支持快速测试与版本迭代。
- 内容创作者:通过 TTS 将视频翻译成多种语言,并生成相应的语音配音。
- 教培行业:在不录制自己声音的情况下,使用 TTS 生成在线课程的语音配音。
文字转语音功能入口
- 方法 1:在时间轴中选择标题素材,点击工具栏中的【文字转语音】图标。如果时间轴中没有支持的文件类型,该图标将不显示。
- 方法 2:按Control键+点按时间轴中的标题素材,选择【文字转语音】。
- 方法 3:点击时间轴中的标题素材,再选择右边顶部菜单栏中的【文字转语音】。
文字转语音参数设置
在 TTS 参数设置栏中,选择文本语言和配音语音。您还可以通过拖动滑动条调整语速与音调,定制语音效果。
注意:
如果需要自动匹配时间轴的转写内容,请勾选【自动匹配】。文字转语音任务列表
双击任务列表中的已完成项,生成的语音文件将被高亮显示。
文字转语音文件生成
生成的语音文件将以 MP3 格式保存,且会自动存储在【媒体】库中,文件存储路径与万兴喵影的默认文件路径相同。
SRT 导入/编辑/文字转语音
万兴喵影支持导入其他工具导出的 SRT 字幕文件,用户可以在万兴喵影中进行更为便捷的编辑与处理。
SRT 导入与编辑流程
- 从【媒体资源区】直接导入 SRT 字幕文件。
- 按Control键+点按在时间轴中 SRT 文件,选择【高级编辑】或双击文件进行编辑。
可进行以下编辑操作:
- 编辑时间码。
- 修改字幕文本内容。
- 添加、删除或合并字幕条。
- 调整字幕样式(与万兴喵影高级文本编辑功能相同)。
文件导出
按Control键+点按在时间轴中的 SRT 文件,并选择【导出字幕文件】进行保存。
SRT 文件转语音
若不喜欢视频中的配音,用户可以通过万兴喵影将 SRT 字幕文件一键转换所选语言。
在弹出的设置窗口中,选择所需的语音并调整音频设置,点击【生成】开始转换。
📌注意事项:
为确保您在使用万兴喵影 AI 功能时的操作透明与合规,请仔细阅读以下提示:
- 软件界面会明确标识所有由 AI 技术生成的内容,方便您清晰区分。
- 为保障内容的可追溯性,导出或下载的 AI 生成素材可能附带可见或隐藏的水印信息。
语音转文字/文字转语音 | 万兴喵影 App
万兴喵影现已将原有的语音转文字功能全面升级为 AI 字幕,不仅能够智能识别视频中的语音内容自动生成字幕,还支持双语字幕、语义优化分段呈现重点词,智能检测说话人等。而其文本朗读功能基础了最新的 AI 文字转语音模型,支持多种语音与音色,还支持语音克隆,用户可将文字内容一键转换为自己的声音。
语音转文字(AI 字幕)
1. 启动 AI 字幕生成功能
打开万兴喵影 App,在首页点击【创建视频】,导入需要添加字幕的视频素材,系统将自动进入视频编辑界面。
在编辑界面底部功能栏中选择【文本】,接着点击【字幕】,即可进入 AI 字幕生成页面。
2. 字幕翻译(可选)
如需生成双语字幕,可点击【双语字幕】并选择目标翻译语言;若无需翻译,保持默认【无】即可。
3. 智能包装与说话人检查
点击【智能包装】,即可启用多种 AI 字幕增强效果,当前支持以下 4 种字幕包装方式:
- 智能重点词:AI 自动识别语句中的关键信息,并在字幕中重点突出显示。
- 智能 Emoji:根据字幕语义智能匹配表情,让字幕更生动有趣。
- 智能运镜:在多说话人场景下,自动进行画面缩放或追踪当前说话人。
- 智能贴纸:依据文本内容或 Emoji 自动匹配贴纸效果,增强视觉表现力。
开启【说话人检测】后,AI 将结合画面与音频信息,智能区分不同说话人,并为每段字幕精准标注对应人物,方便后续针对说话人进行编辑。完成设置后,点击底部【添加字幕】,系统将自动识别音频并生成字幕,快速、准确完成字幕制作。
4. 字幕编辑与导出
字幕生成完成后,您可对字幕的位置、样式、文本、重点词等进行调整。若想了解更多字幕生成参数设置及字幕生成后的编辑技巧,可前往 AI 动感字幕使用指南 >>> 获取更详细的操作说明。
文字转语音(AI 文本朗读)
1. 启动文本朗读功能
打开万兴喵影 App,在首页点击【创建视频】,导入需要编辑的视频素材,进入视频编辑界面。
在时间轴中点击【添加文本】,或前往顶部工具栏选择【文本】>【添加】,新增一个文本片段。
在文本输入框中输入你希望转换为语音的文字内容,完成后点击右上角【✔】进行确认。
你也可以根据需要调整文本的字体样式、颜色以及在画面中的显示位置,让画面与语音呈现更协调。
确认文本后,该文本片段将处于选中状态,此时在底部工具栏中点击【文本朗读】,即可进入音色选择界面。
4. 筛选并选择合适的音色
在音色选择界面中,你可以通过顶部筛选栏,快速按应用场景筛选音色,例如【旁白、新闻、广告、社媒、教育】等。
也可以进一步按音色情绪进行筛选,如【共情、愉快、严肃、忧伤、友好】等,帮助你更精准匹配创作风格。
5. 试听并调整音色参数
点击【播放】按钮即可试听当前音色效果,确认是否符合你的创作需求。
如需微调,可点击【调整
】按钮,自定义设置音色的情绪强度与语速,让语音表达更加自然。
6. 使用 AI 音色克隆(可选)
你还可以切换至【AI 我的声音】,选择已经完成克隆的专属音色进行朗读。若需要创建新的克隆音色,点击【克隆您的 AI 语音】即可开始录制并生成专属声音,具体操作可参考 音色克隆使用指南 >>> 。
7. 生成语音、调整与导出
选择好音色后,点击底部【生成】按钮,即可进入 AI 语音生成流程。
生成完成后,语音将自动添加至时间轴中,并与对应的文本位置精准对齐。点击【播放】按钮试听生成的语音效果,如需调整,可选中语音片段,自由设置【音量】、【淡入淡出】、【播放速度】等参数。
确认无误后,点击右上角【导出】,设置导出分辨率与格式,最后点击【导出视频】,即可将成品保存至手机。
