一种用于语音识别芯片的智能修正方法及系统技术方案

技术编号:36270761 阅读:62 留言:0更新日期:2023-01-07 10:12
本发明专利技术提供了一种用于语音识别芯片的智能修正方法及系统,涉及语音识别技术领域,其方法包括:将第一文本与标准文本进行相似度分析,得到第一相似结果;当第一相似结果大于或等于预设值时,按照预设方式修正语音识别芯片的识别构架;当第一相似结果小于预设值时,获取目标语音的语音场景,并根据场景特征以及两个文本之间的文本差异特征,构建每个文本差异特征的修正特征;预测修正特征对两个文本差异的修正级别,对修正特征进行调整,实现对语音识别芯片的识别构架的修正。通过建立目标语音的场景特征和文本差异特征之间的修正特征以及预测修正特征的修正级别来修正语音识别芯片的识别构架,实现对语音识别芯片的更新,进而有效保证识别精度。而有效保证识别精度。而有效保证识别精度。

【技术实现步骤摘要】
一种用于语音识别芯片的智能修正方法及系统


[0001]本专利技术涉及语音识别
,特别涉及一种用于语音识别芯片的智能修正方法及系统。

技术介绍

[0002]随着科技的不断快速发展,计算机处理能力迅速提高,语音识别技术方面的发展也获得了巨大的飞跃,基于语音识别芯片来进行智能语音识别工作的新型产业不断涌现,促进了社会经济发展。
[0003]然而现有的芯片识别流程比较复杂且识别结果准确度不够高,在不够安静的环境下对语音不能清晰识别,且得到的识别结果往往与真正的语音含义存在偏差或歧义,从而导致一系列的负面影响,所以,修正语音识别芯片,以提高识别语音的精确度就显得尤其重要。
[0004]因此,本专利技术提出一种用于语音识别芯片的智能修正方法及系统。

技术实现思路

[0005]本专利技术提供一种用于语音识别芯片的智能修正方法及系统,用以通过建立目标语音的场景特征和文本差异特征之间的修正特征以及预测修正特征的修正级别来修正语音识别芯片的识别构架,实现对语音芯片的更新,进而有效保证了识别精度。
[0006]本专利技术提供一种用于语音识别芯片的智能修正方法,包括:步骤1:获取目标语音以及目标语音的标准文本;步骤2:采用语音识别芯片识别所述目标语音,获取第一文本,与所述标准文本进行相似度分析,得到第一相似结果;步骤3:当第一相似结果大于或等于预设值时,按照预设方式修正语音识别芯片的识别构架;步骤4:当第一相似结果小于预设值时,获取目标语音的语音场景,并根据语音场景的场景特征以及两个文本之间的文本差异特征,来构建每个文本差异特征的修正特征; 步骤5:预测修正特征对两个文本差异的修正级别,根据修正级别对修正特征进行调整,按照所述修正特征对所述语音识别芯片的识别构架进行修正;否则,按照预设标准对修正特征进行持续优化。
[0007]优选的,所述目标语音是指目标对象在特定环境中发出的语音并由指定录音装置进行存储得到的音频;所述标准文本是通过人为预先识别获取的。
[0008]优选的,采用语音识别芯片识别所述目标语音,获取第一文本,与所述标准文本进行相似度分析,得到第一相似结果,包括:通过语音识别芯片接收目标语音,对所述目标语音进行频谱分析和降噪处理,得到第一处理结果;
对所述第一处理结果进行特征提取,获取得到目标语音特征;调取语音识别芯片中的历史关键词语列表中的关键词语特征与所述目标语音特征进行对比匹配,得到对比结果;分析所述对比结果,确定匹配度最高的关键词语为第一识别结果;按照第一识别结果的识别顺序进行有序组合,构成第一文本;对所述第一文本与标准文本进行相似度对比,得出第一相似结果。
[0009]优选的,对所述第一文本与标准文本进行相似度对比,得出第一相似结果,包括;获取所述标准文本的标准特征向量;获取所述第一文本的第一特征向量;分别对所述标准特征向量和第一特征向量归一化处理,得到标准文本向量和第一文本向量;对所述标准文本向量和第一文本向量进行相似度集合,其中,表示所述标准文本向量和第一文本向量中第i个元素之间的距离;表示所述标准文本向量和第一文本向量中的元素个数;其中,的取值范围[0,];表示第i个元素的元素类型;表示正向影响的元素集合;的取值范围[0,];表示负向影响的元素集合;为标准文本向量中第i个元素的坐标点;表示第一文本向量中第i个元素的坐标点;根据所述相似度集合D,筛选出满足标准距离条件的第一距离;基于所有第一距离,确定出第一相似结果。
[0010]优选的,基于所有第一距离,确定出第一相似结果,包括:计算所有第一距离的累计和:其中,表示距离;m1表示从相似度集合中筛选出来满足标准距离条件的第一距离的总个数;当以及时,将作为第一相似结果;其中,表示相似度集合中所有的累加和;1表示第一常数;2表示第二常数。
[0011]优选的,获取目标语音的语音场景之后,还包括:提取所述目标语音中非语音片段,并依次对每个非语音片段进行第一位置标注;对每个非语音片段进行特征提取,获取对应子场景特征;基于标注结果,集合所有子场景特征,确定所述语音场景的场景特征。
[0012]优选的,确定第一文本与标准文本之间的文本差异特征,并基于所述场景特征、文
本差异特征,构建每个文本差异特征对应的修正特征,包括:将所述标准文本和第一文本输入文本匹配模型中进行匹配预测,得到匹配概率值;当所述匹配概率值小于预设匹配阈值时,确定当前存在的文本差异,并获取得到第一文本差异特征;确定所述标准文本中第一目标差异字词所处的第一位置以及所述第一文本中第二目标差异字词所处的第二位置,根据所述第一位置以及第二位置,确定所述第一文本与标准文本的差异位置特征,其中,所述第二目标差异字词是由语音识别芯片对第一标记片段识别得到的;从场景特征中提取与所述第一文本与标准文本的差异位置特征存在对应关系的第一位置标注,此时,将第一位置标注对应的非语音片段进行第一标记,得到第一标记片段;提取所述第一标记片段对应的第一子场景特征;获取第一子场景特征包含的第一标记片段的音频信号内每个频点对应的第一幅值和第一相位;基于所述第一标记片段的第一位置标注,从所述目标语音中,提取第一目标语音片段,并确定所述第一目标语音片段的音频信号的每个频点对应的第二幅值和第二相位;根据第一相位与第二相位的相位差,对第一标记片段的音频信号内每个频点对应的第一幅值进行修正处理,得到每个第一文本差异特征对应的修正特征。
[0013]优选的,将所述标准文本和第一文本输入文本匹配模型中进行匹配程度预测,得到匹配概率值,包括:获取所述标准文本的标准语义特征向量和第一文本的第一语义特征向量;将所述标准语义特征向量和第一语义特征向量输入到文本匹配模型中进行相减操作,得到文本语义差异特征向量;将所述文本语义差异特征向量输入到差异分析模块中进行语义特征分析,得到若干差异结果值;对若干差异结果值分别进行公式运算,获取得到匹配概率值P,公式如下:
ꢀꢀ
其中,表示为第j个差异结果值对应的匹配概率值,取值范围为;表示为第j个差异结果值;M为差异结果值个数;N表示为差异结果值中的最大值;表示为计算的误差系数,取值范围为(0,0.001);e的取值为2.7。
[0014]优选的,预测所述修正特征的修正级别,并根据预测结果进行修正,包括:调取每个修正特征对应的第一文本差异特征对应的匹配概率值,结合预设标准,对每个修正特征的修正级别进行判断;
若匹配概率值处于取值范围内时,确定修正级别为三级,此时,基于每个频点对应的第二幅值以及修正后第一幅值,确定损失值;根据所述损失值,对修正参数进行更新,并基于更新后修正参数,对修正特征进行优化,并按照优化后修正特征进行修正;若匹配概率值处于取值范围内时,确定修正级别为二级;若匹配概率值处于取值范围内时,确定修正级别为一级,当修正级别为一级时,对此时匹配概率值对应的修正特征设置第一调整参数,对修正特征进行调整,得到第一修正特征;当修正级别为二级时,对此时匹配概率值对应的修正特征设置第二调整参数,对修正特征进行调整,得到第二修正特征。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于语音识别芯片的智能修正方法,其特征在于,包括:步骤1:获取目标语音以及目标语音的标准文本;步骤2:采用语音识别芯片识别所述目标语音,获取第一文本,与所述标准文本进行相似度分析,得到第一相似结果;步骤3:当第一相似结果大于或等于预设值时,按照预设方式修正语音识别芯片的识别构架;步骤4:当第一相似结果小于预设值时,获取目标语音的语音场景,并根据语音场景的场景特征以及两个文本之间的文本差异特征,来构建每个文本差异特征的修正特征;步骤5:预测修正特征对两个文本差异的修正级别,根据修正级别对修正特征进行调整,按照所述修正特征对所述语音识别芯片的识别构架进行修正;否则,按照预设标准对修正特征进行持续优化。2.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,所述目标语音是指目标对象在特定环境中发出的语音并由指定录音装置进行存储得到的音频;所述标准文本是通过人为预先识别获取的。3.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,所述步骤2具体包括:通过语音识别芯片接收目标语音,对所述目标语音进行频谱分析和降噪处理,得到第一处理结果;对所述第一处理结果进行特征提取,获取得到目标语音特征;调取语音识别芯片中的历史关键词语列表中的关键词语特征与所述目标语音特征进行对比匹配,得到对比结果;分析所述对比结果,确定匹配度最高的关键词语为第一识别结果;按照第一识别结果的识别顺序进行有序组合,构成第一文本;对所述第一文本与标准文本进行相似度对比,得出第一相似结果。4.如权利要求3所述的用于语音识别芯片的智能修正方法,其特征在于,对所述第一文本与标准文本进行相似度对比,得出第一相似结果,包括;获取所述标准文本的标准特征向量;获取所述第一文本的第一特征向量;分别对所述标准特征向量和第一特征向量归一化处理,得到标准文本向量和第一文本向量;对所述标准文本向量和第一文本向量进行相似度集合,其中,表示所述标准文本向量和第一文本向量中第i个元素之间的距离;表示所述标准文本向量和第一文本向量中的元素个数;
其中,的取值范围[0,];表示第i个元素的元素类型;表示正向影响的元素集合;的取值范围[0,];表示负向影响的元素集合;为标准文本向量中第i个元素的坐标点;表示第一文本向量中第i个元素的坐标点;根据所述相似度集合D,筛选出满足标准距离条件的第一距离;基于所有第一距离,确定出第一相似结果。5.如权利要求4所述的用于语音识别芯片的智能修正方法,其特征在于,基于所有第一距离,确定出第一相似结果,包括:计算所有第一距离的累计和:其中,表示第j1个第一距离;m1表示从相似度集合中筛选出来满足标准距离条件的第一距离的总个数;当以及时,将作为第一相似结果;其中,表示相似度集合中所有的累加和;1表示第一常数;2表示第二常数。6.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,获取目标语音的语音场景之后,还包括:提取所述目标语音中非语音片段,并依次对每个非语音片段进行第一位置标注;对每个非语音片段进行特征提取,获取对应子场景特征;基于标注结果,集合所有子场景特征,确定所述语音场景的场景特征。7.如权利要求6所述的用于语音识别芯片的智能修正方法,其特征在于,确定第一文本与标准文本之间的文本差异特征,并基于所述场景特征、文本差异特征,构建每个文本差异特征对应的修正特征,包括:将所述标准文本和第一文本输入文本匹配模型中进行匹配预测,得到匹配概率值;当所述匹配概率值小于预设匹配阈值时,确定当前存在的文本差异,并获取得到第...

【专利技术属性】
技术研发人员:王嘉诚张少仲张栩
申请(专利权)人:中诚华隆计算机技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1