The invention discloses a speech recognition method comprises the steps of: cleaning, the original speech information acquiring user input; the first voice processing method for speech enhancement and filtering of the original speech information, get voice information processing; acoustic characteristics of speech information processing after the recognition of the second voice processing method according to the acoustics; feature extraction, first identify the speech recognition results; the first speech recognition results for error correction by cleaning the language model, second speech recognition results; second speech recognition results as speech recognition results are output. The invention improves the cleaning and error correcting capability of the computer to each stage of the speech recognition, and makes the processing result of the speech recognition more accurate.
【技术实现步骤摘要】
语音智能识别清洗方法
本专利技术涉及语音识别
,特别涉及语音智能识别清洗方法。
技术介绍
在近年来,语音识别技术取得显著进步,已经从实验室走向市场。在实际应用中,例如智能助理Siri,通过识别用户的语音输入信息,自动完成和用户的交互。目前,进行语音识别时,环境噪声对语音识别的识别率影响很大,同时,对原始语音信息的处理方法也会对识别结果有一定的影响,除此之外,不同的人还有发音习惯上的差别,使用单一声学特征进行识别会是语音识别的识别率受到明显影响。由于语音识别的识别率不够高,导致使用语音进行大数据分析面临较大的困难。
技术实现思路
为解决以上问题,本专利技术提供一种语音智能识别清洗方法,用以解决语音识别的识别率不高的问题,包括步骤:获取用户输入的原始语音信息;利用第一语音处理方法对原始语音信息进行语音增强和滤波,得到处理后的语音信息;利用第二语音处理方法对处理后的语音信息中的声学特征进行识别提取;根据提取的声学特征,识别出第一语音识别结果;通过语言模型对第一语音识别结果进行清洗纠错,得到第二语音识别结果;将第二语音识别结果作为语音识别结果进行输出。优选的,所述第一语音处理方法,包括对原始语音信息进行语音增强,所用增强方法为减谱法,所用减谱公式为:PS(ω)=max{0,Py(ω)-[αPn1(ω)+(1-α)Pn2(ω)]}其中,PS(ω)为输出语音信息的功率谱,Py(ω)为原始语音信息的功率谱,Pn1(ω)为发声前的“寂静段”的功率谱,Pn2(ω)为发声结束后的“寂静段”的功率谱,α为值在0到1之间的权重系数,t1为发声前的“寂静段”结束时的时间点,t2为 ...
【技术保护点】
一种语音智能识别清洗方法,其特征在于,包括如下步骤:获取用户输入的原始语音信息;利用第一语音处理方法对原始语音信息进行语音增强和滤波,得到处理后的语音信息;利用第二语音处理方法对处理后的语音信息中的声学特征进行识别提取;根据提取的声学特征,识别出第一语音识别结果;通过语言模型对第一语音识别结果进行清洗纠错,得到第二语音识别结果;将第二语音识别结果作为语音识别结果进行输出。
【技术特征摘要】
1.一种语音智能识别清洗方法,其特征在于,包括如下步骤:获取用户输入的原始语音信息;利用第一语音处理方法对原始语音信息进行语音增强和滤波,得到处理后的语音信息;利用第二语音处理方法对处理后的语音信息中的声学特征进行识别提取;根据提取的声学特征,识别出第一语音识别结果;通过语言模型对第一语音识别结果进行清洗纠错,得到第二语音识别结果;将第二语音识别结果作为语音识别结果进行输出。2.根据权利要求1所述的方法,其特征在于,包括:所述第一语音处理方法,包括对原始语音信息进行语音增强,所用增强方法为减谱法,所用减谱公式为:PS(ω)=max{0,Py(ω)-[αPn1(ω)+(1-α)Pn2(ω)]}其中,PS(ω)为输出语音信息的功率谱,Py(ω)为原始语音信息的功率谱,Pn1(ω)为发声前的寂静段的功率谱,Pn2(ω)为发声结束后的寂静段的功率谱,α为值在0到1之间的权重系数,t1为发声前的寂静段结束时的时间点,t2为发声结束后的寂静段开始时的时间点,t为当前所要处理的语音信息的时间点。3.根据权利要求1所述的方法,其特征在于,包括:所述第一语音处理方法,包括对语音增强后...
【专利技术属性】
技术研发人员:刘春明,
申请(专利权)人:上海云信留客信息科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。