利用人工智能生成字幕srt文件,在剪辑中批量配音的方法。

可见使用过剪贴板版,它提供了几十种声音的朗读生成,而且都是自然的声音。 但是,至今为止没能直接朗读大部分的文本,这是一个很大的打击。 必须一字一句地剪掉添加文本,然后朗读,效率太低了

但是,剪切提供了导入srt字幕文件,字幕文件可以一次生成所有视频文本。 如果选择全部,则可以进行所有阅读。 这是一种间接而高效的方法。

现在的问题是如何找到将长文本转换为srt字幕文件的方法。 如果是人工转换的话,直接在影像中一句一句地插入字幕比较快。 但是,随着人工智能对话工具chatGPT的出现,除了生成程序代码外,还可以生成常见的不同的文本文件,而srt正好是文本格式。

SRT文本格式SRT的全称是SubRip Text,每个字幕段或一个字幕由四个部分组成。

序列号字幕显示开始时间字幕内容(可多行)空白行(表示本字幕段的结束)以下对字幕样本说一句话

100:00:00,000– 00:00:06,000用chatGPT写代码已经不少见了. 2

因此,我们只需要让ai在这个格式中生成大片段文本。

虽然是生成srt字幕的关键词,但是要让chatGPT理解生成srt字幕,必须告诉它。 每行都有“时间”标记。 否则,他将生成格式化文本和srt。 而且,每个字幕无论长度都是固定的5秒,所以可以开始教你设定别的间隔。 因此,字幕的成功生成从以下说明开始。

& #039; 以人类正常说话的速度切分以下副本,生成SubRip Text格式的字幕文本。 在每行的前一行之前包括srt时间标记,每个语句6秒& #039;

这样,我理解chatGPT会生成srt。 请注意,它必须是SubRip Text的全名。 接下来请生成文本内容

以下是chatGPT生成的srt文本

100:00:00,000– 00:00:06,000用chatGPT写代码并不少见。

突然想到,能不能直接用文本说明一下200:00:06,000– 00:00:12,000的生成日程

300:00:12,000– 00:00:18,000例如这一段:“明天10:30在深圳北站乘坐G2303次列车前往长沙”。

400:00:18,000– 00:00:24,000刚刚生成失败。

500:00:24,000– 00:00:30,000 chatgpt表示无法生成文件。

600:00:30,000– 00:00:36,000建议使用日历软件生成。

700:00:36,000– 00:00:42,000最后我改变了提问方法。 “提供了iCalendar文本的示例”。

800:00:42,000– 00:00:48,000,然后生成标准的iCalendar调度文本。

900:00:48,000– 00:00:54,000将此代码文本另存为ics文件。

1000:00:54,000– 00:01:00,000可以导入到各种计划文件中。

100:01:00,000– 00:01:06,000当然手动操作这个过程很麻烦。

1200:01:06,000– 00:01:12,000但是如果APP用它的api自动进行这个步骤的话

1300:01:12,000– 00:01:18,000这一直是我使用日程安排软件的痛点。

1400:01:18,000– 00:01:24,000简单的事情需要在日历app或软件控件上写很多文字才能使用。

1500:01:24,000– 00:01:30,000将输出结果按语言复制并保存到文本文件中。 可以使用srt扩展名导入和操作字幕文件

字幕生成问题和解决注意如果文本过长,可能导致chatGPT生成不完整,请单击& #039; continue& #039; 或继续. chatGPT并打印其馀内容

在实践中发现,ai对于字幕片段是句号或等效的, 等换行标记,但由于单个字幕经常太长,因此可以用句点或句点替换逗号。 也就是说,一个一个的划分变短。 稍后反应过来,那是智能工具啊。 在对话中只要向他解释,就说“逗号也要分开”,然后执行你的命令。

如果对结果不满意,可以继续对话,要求重新排版。 例如,调整时间等。 chatGPT也照做。 当然,现在最大的问题是如果文本太长,整个对话就会停止。 现象是输出光标闪烁,但如果没有输出,就无法输入对话框。 在没有找到原因之前,我的解决只能委托chatGPT了

以人类正常说话的速度分隔以下副本,并生成SubRip Text格式的字幕文本。 每一行的前一行都有序列号,srt时间标记,每个语句需要6秒钟,只需拆分并部分生成逗号,最多可生成5个字符的字幕

执行chatGPT后,我继续通知他“生成第6句以后的字幕”,这是理解并照做的。 即便如此,如果太长的话,用9句话生成1次也没有问题。

生成时发现最后一句的字幕太长,通知是将其再分割成3句还是执行了

最后在剪辑中导入字幕一并生成就可以了,这里发现了一个问题。 字幕时间间隔固定,但里面的文字长度不同。 这样生成的语音会重叠,必须手工调整很长时间。

后来我想起来,我直接命令他用文字的长度调整时间呢。 于是我输入了以下对话

由文字的长度决定各字幕的长度

兴奋到出现了有点可怕的结果,chatGPT照做了!

执行起来,chatGPT是一个聪明的助手,感觉我理解了你的意思,反复调整。 这样的话,如果可以的话,以前经常用脚本或者程序做文本处理部分,直接用chatGPT代替就可以了,有其他的玩法吗?

其他教程

时间碎片化时代的影视短片——娱乐神器混合剪辑再加工

2022-12-20 19:07:00

其他教程

什么是免费模式?免费模式的16款!

2022-12-20 19:09:02

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索