ArcTime自动打轴功能详解
自动打轴功能,又叫做“自动对轴”、“自动音文对齐”或“自动对齐字幕”,就是把字幕稿自动匹配到音频并生成时间轴的过程。它适用于已经同时具备音视频文件和字幕稿的情况,字幕稿需为每句一行的格式,将素材导入Arctime Pro后,即可使用自动打轴功能。Arctime会将素材压缩优化并上传至强大的云端服务器,待云端处理完毕后,会自动将结果返回至软件中,并且自动添加到时间轴中,仅需部分调整即可。
但是在很多情况下,素材还包含了片头或片尾,如果一起传到云端,很容易引起打轴错位。如果能够仅上传有对白的部分,那么自动打轴的效果就不会受到片头片尾的影响了。
自Arctime Pro 2.2起,可以设定“内容入点”和“内容出点”,来达到控制音频范围的目的。在时间轴中按快捷键I或O键可以设定内容的入点和出点,按住Alt按下I或O可以取消入点出点。在设定了内容入点后,可以在入点处看到有条标识线,在时间轴底部滚动条处也能看到入点出点的标识。
要使用自动打轴,首先要登录Arctime账号,并确保积分充足。导入视频和文稿后,在“语音识别”菜单选择“智能音文对齐”,在弹出的对话框中,选择当前视频讲话使用的语言,点击开始识别就可以了。如果当前服务器繁忙,则需要排队执行任务,可以在这里看到排队的长度。
*从Pro 2.3开始,我们为自动打轴配置了多服务器节点,可以从服务器列表中选择延迟更低的节点。中国用户使用全球节点可能出现网络错误或者无法获取结果,推荐使用大陆节点。
自动打轴是付费功能,为了避免积分的浪费,我们要先明确下自动打轴适用的场景。建议使用:素材为清晰、连贯的纯人声音频,男女不限。
不适用于以下情形的素材:
带有穿插配乐、背景音乐、后期音效的(如电影、动画片、综艺节目)
人声音量过小,字句听不清楚的(如远距离录制的讲座或课堂)
人声经过较大变音或变速处理的
含有较多噪音,或明显失真的
纯音乐、MTV、戏曲、歌剧
多个人同时讲话的(如讨论、辩论、娱乐节目)
时长超过3小时的
音频的语言与文稿不一致的(如英文音频与中文文稿)