一种可供比对音素选取方法和装置制造方法及图纸

技术编号:24105744 阅读:37 留言:0更新日期:2020-05-09 16:57
本申请公开了一种可供比对音素选取方法和装置,其中方法包括:获取样本语音的语谱图;在样本语音的语谱图中标注出5个以上的第一目标音素;计算样本语音中的每个第一目标音素与检材语音的语谱图中标注的每个第一目标音素的共振峰频率偏差,生成偏差值矩阵;当偏差值矩阵中的偏差值小于预置偏差阈值时,将小于预置偏差阈值的偏差值对应的一对第一目标音素作为可供比对音素,解决了现有技术中通过1:1测量选取可供比对音素方法存在速度慢和效率低的技术问题。

A method and device for selecting comparative phonemes

【技术实现步骤摘要】
【国外来华专利技术】一种可供比对音素选取方法和装置
本专利技术涉及声纹鉴定
,尤其涉及一种可供比对音素选取方法和装置。
技术介绍
声纹鉴定又称语音同一性鉴定,同一性鉴定是指通过未知说话人或不确定说话人的语音声学特征与已知说话人的语音声学特征进行综合分析比对,做出两者是否同一的结论的过程。在侦查初期,未知说话人或不确定说话人一般是身份不明或者身份不能确定的,已知说话人通常指的是被怀疑者或被指认者,利用二者的声学特征作比对来确定是否同一。音素是语音中的最小单位,依据音节里的发音动作来分析,一个动作构成一个音素。同一性鉴定中一般是通过对检材和样本中的相同的音素作比对。现有技术中最相近似的可供比对音素是通过1:1测量比对选取得到的,该方法通过在检材和样本中分别各标注出一对相同音素,进而判断这两个音素是否属于可供比对音素,由于相同音素在不同词句中存在着非零偏差,尤其是在录音设备不同或者情绪不同的情况下,在检材和样本进行1:1测量比对时,往往难以一次性准确的标注出可供比对的一对音素,往往需要多次人工1:1测量比对,存在速度慢和效率低的问题。
技术实现思路
本申请提供了一种可供比对音素选取方法和装置,用于解决现有技术中通过1:1测量选取可供比对音素方法存在速度慢和效率低的技术问题。有鉴于此,本申请第一方面提供了一种可供比对音素选取方法,包括:获取样本语音的语谱图;在所述样本语音的语谱图中标注出5个以上的第一目标音素;计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵;当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素。优选地,所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵,之后还包括:当所述偏差值矩阵中不存在小于所述预置偏差阈值的偏差值时,在所述样本语音的语谱图中标注出第二目标音素,将所述第二目标音素作为新的第一目标音素,返回所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵的步骤。优选地,所述当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素,之后还包括:根据所述可供比对音素进行同一性鉴定。优选地,所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵,之前还包括:获取所述检材语音的语谱图;在所述检材语音的语谱图中标注出5个以上的所述第一目标音素。优选地,所述获取样本语音的语谱图之后,所述在所述样本语音的语谱图中标注出5个以上的第一目标音素之前,还包括:调整所述样本语音的语谱图的带宽动态范围。本申请第二方面提供了一种可供比对音素选取装置,包括:第一获取模块,用于获取样本语音的语谱图;第一标注模块,用于在所述样本语音的语谱图中标注出5个以上的第一目标音素;计算模块,用于计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵;比较模块,用于当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素。优选地,还包括:触发模块,用于当所述偏差值矩阵中不存在小于所述预置偏差阈值的偏差值时,在所述样本语音的语谱图中标注出第二目标音素,将所述第二目标音素作为新的第一目标音素,触发所述计算模块。优选地,还包括:鉴定模块,用于根据所述可供比对音素进行同一性鉴定。优选地,还包括:第二获取模块,用于获取所述检材语音的语谱图;第三标注模块,用于在所述检材语音的语谱图中标注出5个以上的所述第一目标音素。优选地,还包括:调整模块,用于调整所述样本语音的语谱图的带宽动态范围。从以上技术方案可以看出,本申请具有以下优点:本申请提供了一种可供比对音素选取方法,包括:获取样本语音的语谱图;在样本语音的语谱图中标注出5个以上的第一目标音素;计算样本语音中的每个第一目标音素与检材语音的语谱图中标注的每个第一目标音素的共振峰频率偏差,生成偏差值矩阵;当偏差值矩阵中的偏差值小于预置偏差阈值时,将小于预置偏差阈值的偏差值对应的一对第一目标音素作为可供比对音素。本申请中的可供比对音素选取方法,在获取的样本语音的语谱图中标注第一目标音素,并且,第一目标音素的数量不少于5个,计算样本语音中的每个第一目标音素与检材语音语谱图中标注的相同的第一目标音素的共振峰频率偏差,得到若干个偏差值,生成偏差值矩阵;将满足预置偏差阈值的偏差值对应的第一目标音素作为可供比对音素,本申请通过n:N进行批量比对,可以更快捷、更高效地选取出可供比对音素,避免了检材和样本进行1:1测量比对时,难以一次性准确的标注出可供比对的一对音素,需要多次人工1:1测量比对所存在的速度慢和效率低的问题,从而解决了现有技术中通过1:1测量选取可供比对音素方法存在速度慢和效率低的技术问题。附图说明图1为本申请提供的一种可供比对音素选取方法的一个实施例的流程示意图;图2为本申请提供的一种可供比对音素选取方法的另一个实施例的流程示意图;图3为本申请提供的一种可供比对音素选取装置的一个实施例的结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了便于理解,请参阅图1,本申请提供的一种可供比对音素选取方法的一个实施例,包括:步骤101、获取样本语音的语谱图。需要说明的是,语谱图即语音频谱分析图,显示的是声纹图谱,所有的声纹特性都可以直观的在图谱上显示出来,语谱图的横坐标是时间,纵坐标是频率,坐标点的浓淡表示音强,在声纹鉴定中最常用的是宽带声纹图,它是用带宽为300HZ的带通滤波器分析出来的声纹,每一字的声纹前部是清辅音的频谱,后部是元音频谱;元音频谱中由加强的纵线条构成的水平方向的黑带为共振峰。共振峰的数量、走向及其频率是声纹分析的重要特征。可以通过将样本语音导入到声纹鉴定工作站得到语谱图,也可以采用其他的设备得到样本语音的语谱图,在此不做具体的限定。步骤102、在样本语音的语谱图中标注出5个以上的第一目标音素。需要说明的是,可以通过听辨样本语音和视辨样本语音的语谱图相结合的方式标注出样本语音的语谱图本文档来自技高网
...

【技术保护点】
1.一种可供比对音素选取方法,其特征在于,包括:/n获取样本语音的语谱图;/n在所述样本语音的语谱图中标注出5个以上的第一目标音素;/n计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵;/n当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素。/n

【技术特征摘要】
【国外来华专利技术】1.一种可供比对音素选取方法,其特征在于,包括:
获取样本语音的语谱图;
在所述样本语音的语谱图中标注出5个以上的第一目标音素;
计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵;
当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素。


2.根据权利要求1所述的可供比对音素选取方法,其特征在于,所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵,之后还包括:
当所述偏差值矩阵中不存在小于所述预置偏差阈值的偏差值时,在所述样本语音的语谱图中标注出第二目标音素,将所述第二目标音素作为新的第一目标音素,返回所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵的步骤。


3.根据权利要求1所述的可供比对音素选取方法,其特征在于,所述当所述偏差值矩阵中的偏差值小于预置偏差阈值时,将小于所述预置偏差阈值的所述偏差值对应的一对所述第一目标音素作为可供比对音素,之后还包括:
根据所述可供比对音素进行同一性鉴定。


4.根据权利要求1所述的可供比对音素选取方法,其特征在于,所述计算所述样本语音中的每个所述第一目标音素与检材语音的语谱图中标注的每个所述第一目标音素的共振峰频率偏差,生成偏差值矩阵,之前还包括:
获取所述检材语音的语谱图;
在所述检材语音的语谱图中标注出5个以上的所述第一目标音素。

...

【专利技术属性】
技术研发人员:卢剑锋
申请(专利权)人:广州国音智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1