配音效果确定方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:37232730 阅读:16 留言:0更新日期:2023-04-20 23:15
本申请提供了一种配音效果确定方法、装置、电子设备及可读存储介质,属于音频处理技术领域。本申请通过,获取影视作品对应的配音数据和配音文本,其中,所述配音文本包含多个分句文本;基于多个所述分句文本对所述配音数据进行划分,得到每个所述分句文本对应的分句配音;对每个所述分句配音进行识别,得到每个所述分句配音对应的配音识别文本;基于每个所述分句配音对应的所述分句文本和所述配音识别文本,确定每个所述分句配音的配音效果。由此,实现了对配音效果(如漏配和错配等)的自动检查,相对于人工检查,提高了检查效率,避免了人工检查容易出现漏检的情况,并且可以节省人工成本。工成本。工成本。

【技术实现步骤摘要】
配音效果确定方法、装置、电子设备及可读存储介质


[0001]本申请涉及音频处理
,尤其涉及一种配音效果确定方法、装置、电子设备及可读存储介质。

技术介绍

[0002]配音是完成一部影视剧作品的重要环节,配音环节中由配音演员根据台词本或字幕对影片进行相应的配音。正常情况下,配音的音频内容应该与台词本或字幕相同。但实际配音过程中,存在配音演员漏配(如遗漏某句台词)或者错配(如念错某句台词)的情况,为了保证配音的完整性和准确性,后期制作过程中需要对配音的音频进行检查,找出漏配或错配的内容进行补录。目前,一般依靠人工方式实现对配音音频进行检查找出漏配或错配内容的过程,不仅效率低,人工成本高,还容易出现漏检的情况。

技术实现思路

[0003]为了解决上述依靠人工方式实现对配音音频进行检查找出漏配或错配内容的过程,不仅效率低,人工成本高,还容易出现漏检情况的技术问题,本申请提供了一种配音效果确定方法、装置、电子设备及可读存储介质。
[0004]第一方面,提供了一种配音效果确定方法,所述方法包括:
[0005]获取影视作品对应的配音数据和配音文本,其中,所述配音文本包含多个分句文本;
[0006]基于多个所述分句文本对所述配音数据进行划分,得到每个所述分句文本对应的分句配音;
[0007]对每个所述分句配音进行识别,得到每个所述分句配音对应的配音识别文本;
[0008]基于每个所述分句配音对应的所述分句文本和所述配音识别文本,确定每个所述分句配音的配音效果。
[0009]在一个可能的实施方式中,所述对每个所述分句配音进行识别,得到每个所述分句配音对应的配音识别文本,包括:
[0010]将所述分句配音输入至预先构建的第一解码图中得到第一识别文本,以及,将所述分句配音输入至预先构建的第二解码图中得到第二识别文本,并将所述第一识别文本和所述第二识别文本作为所述配音识别文本;
[0011]其中,用于构建所述第一解码图的第一语言模型是以预设文本为训练数据训练得到的,用于构建所述第二解码图的第二语言模型是以所述配音文本为训练数据训练得到的,所述预设文本与所述配音文本不同。
[0012]在一个可能的实施方式中,所述基于每个所述分句配音对应的所述分句文本和所述配音识别文本,确定每个所述分句配音的配音效果,包括:
[0013]针对每个所述分句配音,确定所述分句配音对应的所述分句文本和所述第一识别文本的第一相似度,以及,确定所述分句配音对应的所述分句文本和所述第二识别文本的
第二相似度;
[0014]在所述第一相似度不大于预设阈值,且,所述第二相似度不大于所述预设阈值的情况下,确定所述分句配音为正确配音;
[0015]在所述第一相似度大于预设阈值,或,所述第二相似度大于所述预设阈值的情况下,确定所述分句配音为错误配音。
[0016]在一个可能的实施方式中,所述第一解码图通过以下步骤构建得到:
[0017]基于所述第一语言模型、预先训练好的声学模型、音素的上下文信息及发音词典,构建所述第一解码图。
[0018]在一个可能的实施方式中,所述第二解码图通过以下步骤构建得到:
[0019]基于所述第二语言模型、预先训练好的声学模型、音素的上下文信息及发音词典,构建所述第二解码图。
[0020]在一个可能的实施方式中,通过以下步骤获取所述配音文本:
[0021]获取所述影视作品对应的视频数据,并在所述视频数据中提取字幕文本作为所述配音文本。
[0022]在一个可能的实施方式中,通过以下步骤获取所述配音文本:
[0023]获取所述影视作品对应的台词本,并将所述台词本中的台词文本确定为所述配音文本。
[0024]第二方面,提供了一种配音效果确定装置,所述装置包括:
[0025]获取模块,用于获取影视作品对应的配音数据和配音文本,其中,所述配音文本包含多个分句文本;
[0026]划分模块,用于基于多个所述分句文本对所述配音数据进行划分,得到每个所述分句文本对应的分句配音;
[0027]识别模块,用于对每个所述分句配音进行识别,得到每个所述分句配音对应的配音识别文本;
[0028]确定模块,用于基于每个所述分句配音对应的所述分句文本和所述配音识别文本,确定每个所述分句配音的配音效果。
[0029]在一个可能的实施方式中,所述识别模块,具体用于:
[0030]将所述分句配音输入至预先构建的第一解码图中得到第一识别文本,以及,将所述分句配音输入至预先构建的第二解码图中得到第二识别文本,并将所述第一识别文本和所述第二识别文本作为所述配音识别文本;
[0031]其中,用于构建所述第一解码图的第一语言模型是以预设文本为训练数据训练得到的,用于构建所述第二解码图的第二语言模型是以所述配音文本为训练数据训练得到的,所述预设文本与所述配音文本不同。
[0032]在一个可能的实施方式中,所述确定模块,具体用于:
[0033]针对每个所述分句配音,确定所述分句配音对应的所述分句文本和所述第一识别文本的第一相似度,以及,确定所述分句配音对应的所述分句文本和所述第二识别文本的第二相似度;
[0034]在所述第一相似度不大于预设阈值,且,所述第二相似度不大于所述预设阈值的情况下,确定所述分句配音为正确配音;
[0035]在所述第一相似度大于预设阈值,或,所述第二相似度大于所述预设阈值的情况下,确定所述分句配音为错误配音。
[0036]在一个可能的实施方式中,所述装置还包括第一解码图构建模块,所述第一解码图构建模块,用于:
[0037]基于所述第一语言模型、预先训练好的声学模型、音素的上下文信息及发音词典,构建所述第一解码图。
[0038]在一个可能的实施方式中,所述装置还包括第二解码图构建模块,所述第二解码图构建模块,用于:
[0039]基于所述第二语言模型、预先训练好的声学模型、音素的上下文信息及发音词典,构建所述第二解码图。
[0040]在一个可能的实施方式中,所述获取模块,具体用于:
[0041]获取所述影视作品对应的视频数据,并在所述视频数据中提取字幕文本作为所述配音文本。
[0042]在一个可能的实施方式中,所述获取模块,还用于:
[0043]获取所述影视作品对应的台词本,并将所述台词本中的台词文本确定为所述配音文本。
[0044]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0045]存储器,用于存放计算机程序;
[0046]处理器,用于执行存储器上所存放的程序时,实现第一方面任一所述的方法步骤。
[0047]第四方面,提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面任一所述的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种配音效果确定方法,其特征在于,所述方法包括:获取影视作品对应的配音数据和配音文本,其中,所述配音文本包含多个分句文本;基于多个所述分句文本对所述配音数据进行划分,得到每个所述分句文本对应的分句配音;对每个所述分句配音进行识别,得到每个所述分句配音对应的配音识别文本;基于每个所述分句配音对应的所述分句文本和所述配音识别文本,确定每个所述分句配音的配音效果。2.根据权利要求1所述的方法,其特征在于,所述对每个所述分句配音进行识别,得到每个所述分句配音对应的配音识别文本,包括:将所述分句配音输入至预先构建的第一解码图中得到第一识别文本,以及,将所述分句配音输入至预先构建的第二解码图中得到第二识别文本,并将所述第一识别文本和所述第二识别文本作为所述配音识别文本;其中,用于构建所述第一解码图的第一语言模型是以预设文本为训练数据训练得到的,用于构建所述第二解码图的第二语言模型是以所述配音文本为训练数据训练得到的,所述预设文本与所述配音文本不同。3.根据权利要求2所述的方法,其特征在于,所述基于每个所述分句配音对应的所述分句文本和所述配音识别文本,确定每个所述分句配音的配音效果,包括:针对每个所述分句配音,确定所述分句配音对应的所述分句文本和所述第一识别文本的第一相似度,以及,确定所述分句配音对应的所述分句文本和所述第二识别文本的第二相似度;在所述第一相似度不大于预设阈值,且,所述第二相似度不大于所述预设阈值的情况下,确定所述分句配音为正确配音;在所述第一相似度大于预设阈值,或,所述第二相似度大于所述预设阈值的情况下,确定所述分句配音为错误配音。4.根据权利要求2所述的方法,其特征在于,所述第一解码图通过以下步骤构建得到:基于所...

【专利技术属性】
技术研发人员:徐雪萍陈海涛李海文博龙李娜闫影
申请(专利权)人:北京爱奇艺科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1