语音对比方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:25552196 阅读:25 留言:0更新日期:2020-09-08 18:52
本发明专利技术公开了一种语音对比方法,该方法包括:当接收到语音对比指令时,获取语音对比指令对应的待检的目标语谱图,和预设的标准语谱图;当接收到音段查看指令时,获取音段查看指令对应的操作信息,根据操作信息从目标语谱图中选择目标音段,根据目标音段从标准语谱图中选择标准音段;提取操作信息中的目标频率,并获取目标音段中目标频率对应的目标能量值,和标准音段中目标频率对应的标准能量值;根据目标能量值与标准能量值的对比结果,确定目标语谱图和标准语谱图的对比结果。本发明专利技术还公开了一种语音对比装置、设备及计算机可读存储介质。本发明专利技术实现了更加简便、准确且节约人力成本的语音对比方法。

【技术实现步骤摘要】
语音对比方法、装置、设备及计算机可读存储介质
本专利技术涉及语音识别领域,尤其涉及语音对比方法、装置、设备及计算机可读存储介质。
技术介绍
随着语音识别技术的快速发展,语音识别已应用于越来越多的行业和系统,例如公安系统,可知地,语谱图(语音频谱图)中能量比较集中的区域所表现出来的语音信息(例如频率和能量值),可以作为语音识别结果的依据。在现有的语音识别中,对包含很多复杂信息的语音文件进行识别对比往往需要专业的人员来操作,繁杂冗长的操作过程不仅限制了其他人员(例如普通警员)的理解和使用,邀请专业人员的支持也无疑增加了人力成本,而且,专业人员在进行语音识别对比的操作时,也常常包含个人主观音素的判断,这也使得语音对比的结果不够准确。
技术实现思路
本专利技术的主要目的在于提供一种语音对比方法,旨在解决现有技术中语音对比过程复杂,增加人力成本,且语音对比结果不准确的技术问题。此外,为实现上述目的,本专利技术还提供一种语音对比方法,所述语音对比方法包括以下步骤:当接收到音段查看指令时,获取所述音段查看指令对应的操作信息,根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段;提取所述操作信息中的目标频率,并获取所述目标音段中所述目标频率对应的目标能量值,和所述标准音段中所述目标频率对应的标准能量值;根据所述目标能量值与所述标准能量值的对比结果,确定所述目标语谱图和所述标准语谱图的对比结果。可选地,所述根据所述目标音段从所述标准语谱图中选择标准音段的步骤包括:获取目标音段的目标上边缘线和目标下边缘线,获取标准语谱图中与所述目标音段具有相似上边缘线的音段,形成音段集合;判断所述音段集合中是否存在与所述目标音段具有相同下边缘线的第一音段;若存在所述第一音段,则将所述第一音段作为标准音段。可选地,所述获取标准语谱图中与所述目标音段具有相似上边缘线的音段的步骤包括:获取标准语谱图中所有音段的上边缘线,形成上边缘线集合;从所述上边缘线集合中选取标准上边缘线,将所述目标上边缘线和所述标准上边缘线划分成多个线段,并获取线段总数;将所述目标上边缘线的每个线段与所述标准上边缘线的每个线段对应地进行重叠对比,并获取重叠率;若所述重叠率大于第一预设阈值,则判定所述标准上边缘线与目标上边缘线相同。可选地,所述根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段的步骤之后,包括:查看所述目标音段的目标时间长度和所述标准音段的标准时间长度,并根据所述目标时间长度和所述标准时间长度,确定时间比例;查找所述操作信息中的目标音频和目标时间点,确定由所述目标音频和所述目标时间点组成的第一坐标点,并获取所述第一坐标点对应的目标能量值;根据所述时间比例和所述目标时间点,确定标准时间点,由所述目标音频和所述标准时间点组成第二坐标点,并获取所述第二坐标点对应的标准能量值。可选地,所述根据所述时间比例和所述目标时间点,确定标准时间点的步骤包括:获取目标音段沿时间轴方向上的左临点和右临点,和所述标准音段沿时间轴方向上的左临点和右临点;计算目标时间点与所述目标音段的左临点的差值,并将所述差值与实践比例相乘,得到时间长度差;将所述时间长度差与所述标准音段的左临点相加,得到标准时间点。可选地,所述根据所述目标能量值与所述标准能量值的对比结果,确定所述目标语谱图和所述标准语谱图的对比结果的步骤包括:计算目标能量值与标准能量值的绝对差值,并判断所述绝对差值是否小于第二预设阈值;若所述绝对差值小于所述第二预设阈值,则确定所述目标语谱图和所述标准语谱图的对比结果为高度相似。可选地,所述根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段的步骤之后,还包括:若所述标准音段的数量大于一,则获取所述标准音段中与目标频率对应的所有标准能量值;依次计算所述所有标准能量值与所述目标能量值的所有绝对差值,和所述所有绝对差值的平均绝对差值,并判断所述平均绝对差值是否小于第三预设阈值;若所述平均绝对差值小于所述第三预设阈值,则确定所述待检语音与所述预设样本语音的对比结果为高度相似。此外,为实现上述目的,本专利技术还提供一种语音对比装置,所述语音对比装置包括:接收模块,用于当接收到语音对比指令时,获取所述语音对比指令对应的待检的目标语谱图,和预设的标准语谱图;获取模块,用于当接收到音段查看指令时,获取所述音段查看指令对应的操作信息,根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段;查找模块,用于提取所述操作信息中的目标频率,并获取所述目标音段中所述目标频率对应的目标能量值,和所述标准音段中所述目标频率对应的标准能量值;判定模块,用于根据所述目标能量值与所述标准能量值的对比结果,确定所述目标语谱图和所述标准语谱图的对比结果。此外,为实现上述目的,本专利技术还提供一种语音对比设备,所述语音对比设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的语音对比程序,所述语音对比程序被所述处理器执行时实现如上述的语音对比方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有语音对比程序,所述语音对比程序被处理器执行时实现如上述的语音对比方法的步骤。本专利技术实施例提出的一种语音对比方法、装置、设备及可读存储介质。本专利技术实施例中当语音对比程序接收到代表着语音对比开始的语音对比指令时,将获取用于对比的待检语音的目标语谱图,和预先设置的样本语音的标准语谱图,当语音对比程序进一步接收到音段查看指令时,将进一步获取音段查看指令对应的操作信息,并根据操作信息从目标语谱图中选取目标音段,又根据目标音段从标准语谱图中选取标准音段,语音对比程序提取操作信息中的目标频率,并从目标音段中获取目标频率对应的目标能量值,从标准音段中获取目标频率对应的标准能量值,通过将目标能量值和标准能量值进行对比的结果,确定目标语谱图和标准语谱图的对比结果,可知地,目标音段与标准音段是两个相似的音段,在目标频率一致的情况下,通过将目标能量值与标准能量值进行对比,可以得出两个相似音段的对比结果,进而反映目标语谱图和标准语谱图的对比结果。附图说明图1为本专利技术实施例提供的语音对比设备一种实施方式的硬件结构示意图;图2为本专利技术语音对比方法第一实施例的流程示意图;图3为本专利技术语音对比方法第一实施例中语谱图对比的示意图;图4为本专利技术语音对比方法第二实施例的流程示意图;图5为本专利技术语音对比方法第三实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处本文档来自技高网...

【技术保护点】
1.一种语音对比方法,其特征在于,所述语音对比方法包括以下步骤:/n当接收到语音对比指令时,获取所述语音对比指令对应的待检的目标语谱图,和预设的标准语谱图;/n当接收到音段查看指令时,获取所述音段查看指令对应的操作信息,根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段;/n提取所述操作信息中的目标频率,并获取所述目标音段中所述目标频率对应的目标能量值,和所述标准音段中所述目标频率对应的标准能量值;/n根据所述目标能量值与所述标准能量值的对比结果,确定所述目标语谱图和所述标准语谱图的对比结果。/n

【技术特征摘要】
1.一种语音对比方法,其特征在于,所述语音对比方法包括以下步骤:
当接收到语音对比指令时,获取所述语音对比指令对应的待检的目标语谱图,和预设的标准语谱图;
当接收到音段查看指令时,获取所述音段查看指令对应的操作信息,根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段;
提取所述操作信息中的目标频率,并获取所述目标音段中所述目标频率对应的目标能量值,和所述标准音段中所述目标频率对应的标准能量值;
根据所述目标能量值与所述标准能量值的对比结果,确定所述目标语谱图和所述标准语谱图的对比结果。


2.如权利要求1所述的语音对比方法,其特征在于,所述根据所述目标音段从所述标准语谱图中选择标准音段的步骤包括:
获取目标音段的目标上边缘线和目标下边缘线,获取标准语谱图中与所述目标音段具有相似上边缘线的音段,形成音段集合;
判断所述音段集合中是否存在与所述目标音段具有相同下边缘线的第一音段;
若存在所述第一音段,则将所述第一音段作为标准音段。


3.如权利要求2所述的语音对比方法,其特征在于,所述获取标准语谱图中与所述目标音段具有相似上边缘线的音段的步骤包括:
获取标准语谱图中所有音段的上边缘线,形成上边缘线集合;
从所述上边缘线集合中选取标准上边缘线,将所述目标上边缘线和所述标准上边缘线划分成多个线段,并获取线段总数;
将所述目标上边缘线的每个线段与所述标准上边缘线的每个线段对应地进行重叠对比,并获取重叠率;
若所述重叠率大于第一预设阈值,则判定所述标准上边缘线与目标上边缘线相同。


4.如权利要求1所述的语音对比方法,其特征在于,所述根据所述操作信息从所述目标语谱图中选择目标音段,根据所述目标音段从所述标准语谱图中选择标准音段的步骤之后,包括:
查看所述目标音段的目标时间长度和所述标准音段的标准时间长度,并根据所述目标时间长度和所述标准时间长度,确定时间比例;
查找所述操作信息中的目标音频和目标时间点,确定由所述目标音频和所述目标时间点组成的第一坐标点,并获取所述第一坐标点对应的目标能量值;
根据所述时间比例和所述目标时间点,确定标准时间点,由所述目标音频和所述标准时间点组成第二坐标点,并获取所述第二坐标点对应的标准能量值。


5.如权利要求4所述的语音对比方法,其特征在于,所述根据所述时间比例和所述目标时间点,确定标准时间点的步骤包括:
获取目标音段沿时间...

【专利技术属性】
技术研发人员:郑琳琳龙洪锋
申请(专利权)人:广州国音智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1