语音识别装置和语音识别方法制造方法及图纸

技术编号:8705172 阅读:200 留言:0更新日期:2013-05-16 19:22
本发明专利技术提供了一种语音识别装置包括:语音识别单元,识别用户语音生成语音数据;第一查询单元,在第一语音识别库中查询相匹配的第一语音指令;第一判断单元,判断第一语音指令的置信度是否大于第一阈值;第二查询单元,在判定小于的情况下,在第二语音识别库中查询相匹配的第二语音指令;计算单元,计算第一语音指令与第二语音指令的相似性;第二判断单元,判断相似性是否大于第二阈值,若小于,则判定语音数据为噪音数据;指令执行单元,在第一判断单元或第二判断单元大于的情况下,执行第一语音指令。本发明专利技术还提出了一种语音识别方法。通过本发明专利技术的技术方案,通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。

【技术实现步骤摘要】

本专利技术涉及语音识别
,具体而言,涉及一种。
技术介绍
在数据库多维立方体查询时需要各种语音命令(有限的几个命令),但是在嘈杂的环境下通过现有的语音识别,可能把一个不相关的发音(噪音和其他的人的声音)翻译为语首命令。在语音命令识别中,算法只是在语法树中找到发音最相似的问题,但是在现实生活中经常出现不在命令范围内的发音(噪音和其他人的声音)等,这时有相当大的风险会把背景声音识别为命令。因此,需要一种新的语音识别技术,能够通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。
技术实现思路
本专利技术正是基于上述问题,提出了一种语音识别技术,能够通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。有鉴于此,本专利技术提出了一种语音识别装置,包括:语音识别单元,用于识别用户语音生成语音数据;第一查询单元,用于根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;第一判断单元,用于判断所述第一语音指令的置信度是否大于第一阈值;第二查询单元,用于在所述第一判断单元的判断结果为否的情况下,根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;计算单元,用于通过预设算法计算所述第一语音指令与所述第二语音指令的相似性;第二判断单元,用于判断所述相似性是否大于第二阈值,若小于,则判定所述语音数据为噪音数据;指令执行单元,用于在所述第一判断单元或所述第二判断单元的判断结果为是的情况下,执行所述第一语音指令。在该技术方案中,在第一语音识别库中查询到第一语音指令后,可以确定第一语音指令的置信度,即语音数据与第一语音指令的相似度,相似度越高,置信度越高,反之亦然,当置信度低于第一阈值时,则认为语音数据是噪音数据的可能性较大,从而在第二语音识别库中查询第二语音指令,然后计算第一语音指令与第二语音指令的相似性,如果该相似性大于第二阈值,则认为第一语音指令与第二语音指令差距较小,在较大程度上可以判定第一语音指令是准确的,如果该相似性小于第二阈值,说明第一语音指令与第二语音指令差距较大,第一语音指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。通过二次识别语音数据,可以准确地判断语音数据是否是噪音数据,从而降低将噪音识别为语音命令的风险,提高执行命令的准确度。在上述技术方案中,优选地,所述计算单元通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算所述第一语音指令与所述第二语音指令的相似性。在上述技术方案中,优选地,所述第二语音识别库中的词汇数据量大于所述第一语音识别库中的词汇数据量。在该技术方案中,第一语音识别库可以是一个较小的语法库,比如指令语法库,在其中查询语音数据只能僵硬地生成语音指令数据,第二语音识别库可以是一个较大的语法库,比如自然语法库,在其中查询语音数据可以比较准确地生成相应的语音指令。根据一条语音数据在指令语法库中进行查询可以生成一条指令,如果该指令的置信度小于第一阈值,则根据该语音数据在自然语法库中查询可以生成一段语句(不一定是指令),这段语句相对于上述指令更接近于该语音数据,当该语句与该指令的相似性大于第二阈值时,则可以判定该指令接近于语音数据,可以执行,如果小于第二阈值,则指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。在上述任一技术方案中,优选地,还包括:设置单元,用于根据接收到的设置指令设置所述第一阈值和/或所述第二阈值。在该技术方案中,用户可以根据具体情况设置第一阈值和/或第二阈值。在上述任一技术方案中,优选地,还包括:显示单元,用于在所述第二判断单元判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。在该技术方案中,若第一语音指令与第二语音指令的相似度小于第二阈值,则可以显示第一语音指令与第二语音指令,以便用户人工判断语音数据是否的确为噪音。本专利技术还提出了一种语音识别方法,包括:步骤202,识别用户语音生成语音数据,根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;步骤204,判断所述第一语音指令的置信度是否大于第一阈值,若大于,则执行所述第一语音指令,若小于,则根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;步骤206,通过预设算法计算所述第一语音指令与所述第二语音指令的相似性,并判断所述相似性是否大于第二阈值,若大于,则执行所述第一语音指令,若小于,则判定所述语音数据为噪音数据。在该技术方案中,在第一语音识别库中查询到第一语音指令后,可以确定第一语音指令的置信度,即语音数据与第一语音指令的相似度,相似度越高,置信度越高,反之亦然,当置信度低于第一阈值时,则认为语音数据是噪音数据的可能性较大,从而在第二语音识别库中查询第二语音指令,然后计算第一语音指令与第二语音指令的相似性,如果该相似性大于第二阈值,则认为第一语音指令与第二语音指令差距较小,在较大程度上可以判定第一语音指令是准确的,如果该相似性小于第二阈值,说明第一语音指令与第二语音指令差距较大,第一语音指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。通过二次识别语音数据,可以准确地判断语音数据是否是噪音数据,从而降低将噪音识别为语音命令的风险,提高执行命令的准确度。在上述技术方案中,优选地,所述步骤206包括:通过余弦相似性比较算法、修正的余弦相似性比较算法或相关相似性比较算法计算所述第一语音指令与所述第二语音指令的相似性。在上述技术方案中,优选地,所述第二语音识别库中的词汇数据量大于所述第一语音识别库中的词汇数据量。在该技术方案中,第一语音识别库可以是一个较小的语法库,比如指令语法库,在其中查询语音数据只能僵硬地生成语音指令数据,第二语音识别库可以是一个较大的语法库,比如自然语法库,在其中查询语音数据可以比较准确地生成相应的语音指令。根据一条语音数据在指令语法库中进行查询可以生成一条指令,如果该指令的置信度小于第一阈值,则根据该语音数据在自然语法库中查询可以生成一段语句(不一定是指令),这段语句相对于上述指令更接近于该语音数据,当该语句与该指令的相似性大于第二阈值时,则可以判定该指令接近于语音数据,可以执行,如果小于第二阈值,则指令很大可能由噪音数据错误生成,即判定上述语音数据为噪音数据。在上述任一技术方案中,优选地,还包括:根据接收到的设置指令设置所述第一阈值和/或所述第二阈值。在该技术方案中,用户可以根据具体情况设置第一阈值和/或第二阈值。在上述任一技术方案中,优选地,还包括:在判定所述语音数据为噪音数据时,显示所述第一语音指令与所述第二语音指令。在该技术方案中,若第一语音指令与第二语音指令的相似度小于第二阈值,则可以显示第一语音指令与第二语音指令,以便用户人工判断语音数据是否的确为噪音。通过以上技术方案,可以通过二次识别语音数据,减少将噪音识别为语音命令的风险,提高执行命令的准确度。附图说明图1示出了根据本专利技术的实施例的语音识别装置的框图;图2示出了根据本专利技术的实施例的语音识别方法的流程图;图3示出了根据本专利技术的实施例的语音识别方法的具体流程图。具体实施例方式为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说明的是,本文档来自技高网...

【技术保护点】
一种语音识别装置,其特征在于,包括:语音识别单元,用于识别用户语音生成语音数据;第一查询单元,用于根据所述语音数据在第一语音识别库中查询相匹配的第一语音指令;第一判断单元,用于判断所述第一语音指令的置信度是否大于第一阈值;第二查询单元,用于在所述第一判断单元的判断结果为否的情况下,根据所述语音数据在第二语音识别库中查询相匹配的第二语音指令;计算单元,用于通过预设算法计算所述第一语音指令与所述第二语音指令的相似性;第二判断单元,用于判断所述相似性是否大于第二阈值,若小于,则判定所述语音数据为噪音数据;指令执行单元,用于在所述第一判断单元或所述第二判断单元的判断结果为是的情况下,执行所述第一语音指令。

【技术特征摘要】

【专利技术属性】
技术研发人员:王杰
申请(专利权)人:用友软件股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1