【技术实现步骤摘要】
一种用于语音识别芯片的智能修正方法及系统
[0001]本专利技术涉及语音识别
,特别涉及一种用于语音识别芯片的智能修正方法及系统。
技术介绍
[0002]随着科技的不断快速发展,计算机处理能力迅速提高,语音识别技术方面的发展也获得了巨大的飞跃,基于语音识别芯片来进行智能语音识别工作的新型产业不断涌现,促进了社会经济发展。
[0003]然而现有的芯片识别流程比较复杂且识别结果准确度不够高,在不够安静的环境下对语音不能清晰识别,且得到的识别结果往往与真正的语音含义存在偏差或歧义,从而导致一系列的负面影响,所以,修正语音识别芯片,以提高识别语音的精确度就显得尤其重要。
[0004]因此,本专利技术提出一种用于语音识别芯片的智能修正方法及系统。
技术实现思路
[0005]本专利技术提供一种用于语音识别芯片的智能修正方法及系统,用以通过建立目标语音的场景特征和文本差异特征之间的修正特征以及预测修正特征的修正级别来修正语音识别芯片的识别构架,实现对语音芯片的更新,进而有效保证了识别精度。
[0006]本专利技术提供一种用于语音识别芯片的智能修正方法,包括:步骤1:获取目标语音以及目标语音的标准文本;步骤2:采用语音识别芯片识别所述目标语音,获取第一文本,与所述标准文本进行相似度分析,得到第一相似结果;步骤3:当第一相似结果大于或等于预设值时,按照预设方式修正语音识别芯片的识别构架;步骤4:当第一相似结果小于预设值时,获取目标语音的语音场景,并根据语音场景的场景特征以及两个文本之间的文 ...
【技术保护点】
【技术特征摘要】
1.一种用于语音识别芯片的智能修正方法,其特征在于,包括:步骤1:获取目标语音以及目标语音的标准文本;步骤2:采用语音识别芯片识别所述目标语音,获取第一文本,与所述标准文本进行相似度分析,得到第一相似结果;步骤3:当第一相似结果大于或等于预设值时,按照预设方式修正语音识别芯片的识别构架;步骤4:当第一相似结果小于预设值时,获取目标语音的语音场景,并根据语音场景的场景特征以及两个文本之间的文本差异特征,来构建每个文本差异特征的修正特征;步骤5:预测修正特征对两个文本差异的修正级别,根据修正级别对修正特征进行调整,按照所述修正特征对所述语音识别芯片的识别构架进行修正;否则,按照预设标准对修正特征进行持续优化。2.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,所述目标语音是指目标对象在特定环境中发出的语音并由指定录音装置进行存储得到的音频;所述标准文本是通过人为预先识别获取的。3.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,所述步骤2具体包括:通过语音识别芯片接收目标语音,对所述目标语音进行频谱分析和降噪处理,得到第一处理结果;对所述第一处理结果进行特征提取,获取得到目标语音特征;调取语音识别芯片中的历史关键词语列表中的关键词语特征与所述目标语音特征进行对比匹配,得到对比结果;分析所述对比结果,确定匹配度最高的关键词语为第一识别结果;按照第一识别结果的识别顺序进行有序组合,构成第一文本;对所述第一文本与标准文本进行相似度对比,得出第一相似结果。4.如权利要求3所述的用于语音识别芯片的智能修正方法,其特征在于,对所述第一文本与标准文本进行相似度对比,得出第一相似结果,包括;获取所述标准文本的标准特征向量;获取所述第一文本的第一特征向量;分别对所述标准特征向量和第一特征向量归一化处理,得到标准文本向量和第一文本向量;对所述标准文本向量和第一文本向量进行相似度集合,其中,表示所述标准文本向量和第一文本向量中第i个元素之间的距离;表示所述标准文本向量和第一文本向量中的元素个数;
其中,的取值范围[0,];表示第i个元素的元素类型;表示正向影响的元素集合;的取值范围[0,];表示负向影响的元素集合;为标准文本向量中第i个元素的坐标点;表示第一文本向量中第i个元素的坐标点;根据所述相似度集合D,筛选出满足标准距离条件的第一距离;基于所有第一距离,确定出第一相似结果。5.如权利要求4所述的用于语音识别芯片的智能修正方法,其特征在于,基于所有第一距离,确定出第一相似结果,包括:计算所有第一距离的累计和:其中,表示第j1个第一距离;m1表示从相似度集合中筛选出来满足标准距离条件的第一距离的总个数;当以及时,将作为第一相似结果;其中,表示相似度集合中所有的累加和;1表示第一常数;2表示第二常数。6.如权利要求1所述的用于语音识别芯片的智能修正方法,其特征在于,获取目标语音的语音场景之后,还包括:提取所述目标语音中非语音片段,并依次对每个非语音片段进行第一位置标注;对每个非语音片段进行特征提取,获取对应子场景特征;基于标注结果,集合所有子场景特征,确定所述语音场景的场景特征。7.如权利要求6所述的用于语音识别芯片的智能修正方法,其特征在于,确定第一文本与标准文本之间的文本差异特征,并基于所述场景特征、文本差异特征,构建每个文本差异特征对应的修正特征,包括:将所述标准文本和第一文本输入文本匹配模型中进行匹配预测,得到匹配概率值;当所述匹配概率值小于预设匹配阈值时,确定当前存在的文本差异,并获取得到第...
【专利技术属性】
技术研发人员:王嘉诚,张少仲,张栩,
申请(专利权)人:中诚华隆计算机技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。