【懒人必备】花式提取Pr烧在画面中的对白字幕
在Pr中使用「旧版字幕」工具制作的唱词,将会无法导出软字幕或可编辑使用的XML。在这种情况下我们如果一句句复制粘贴将会花费大量的时间,也非常枯燥,还容易出错。本文尽量结合大家手里应该都现有的软件,将剪辑给的小样画面上的唱词转换为可编辑的文本信息
我们需要
带对白字幕的画面:本例中,画面对白字幕的位置处于遮幅内,为我们后续做识别提供了方便
Pr导出的“对白字幕轨”xml:这里不需要xml携带文字信息,只要xml能有每一句话的出入点即可
获取每一句台词
在达芬奇中我们倒入Pr导出的“对白字幕轨”xml后,我们可以看到每一句话都能有出入点信息。随后将画面导入至第二轨,对齐头部,检查好是否与第一轨的“字幕”是否一致
在页面中,我们可以看到每一句话都对应一个无法连接的Clip
此时即可用批量截取每条Clip头部静帧的功能来将每句台词截取静帧
处理序列帧
导出为Jpeg,达芬奇会按顺序为每个静帧单独命名,此时再给他们批量重命名即可让它们成为序列帧
在Ae中我们将序列帧导入,为了方便起见我们将序列帧解释为1帧/秒
此时建立一个宽度为1920(小样的宽度)高度为256(为了只保留字幕所在的区域)的合成,时长为序列长度(此前设置为1帧/秒的话,有100句话就是100秒,是不是很好算?)这里我为它取名为「」
再新建一个合成,宽度同上,高度尽可能地高,时长同上
将「」放进去,新建一个空对象为它的父级,y轴运动写一个表达式来控制移动的速度,也就是接下来将产生的行距
time*50
将序列合并到一个画面上
此时再新建一个调整图层,给调整图层添加一个【时间】>【残影】效果
残影时间:即为序列帧的1fps的时间
残影数量:可以拉一个很大的值
其余参数保持默认即可
随后大家就能看到每一行台词规规矩矩地展开了
如果行距不合适,调整上述表达式即可
“如果截取的序列帧高度合适,我们也可以尝试用批量导入图片的方式将每行字的依次排列,并整合导出为图片送至OCR”
识别
最后我们就可以得到一个台词的长图,我们可以将其导入OCR软件进行文字识别
由于PC/MAC端专业的OCR软件购买安装都较为复杂,而且我们也是测试/偶尔需要,所以我选择了在手机上有OCR功能的app来做识别,具体使用大家就自行判断吧
检查
前面我们用到的xml可以导出一个edl,就可以将每句话的出入点时间码提取出来
再配合刚刚识别出的可编辑的文本与小样一起核对检查
总结一下
得到每一句台词的出入点信息
截取每一句台词的画面
得到序列帧
将序列帧展开到同一个画面上
借助OCR识别图中的文字
检查核对
想了解自己更想知道的内容
长按识别以下二维码
帮助我们更加懂你
懒人必备系列本来旨在帮助大家减少重复机械操作操作
可能简单但思路并不简单噢
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。