The invention discloses a speech recognition error correction method and device in an intelligent hardware device. The method includes: the speech signal will be converted into intelligent hardware devices receive text messages through voice recognition technology; extracting keywords from the text information; matching the extracted keywords and intelligent hardware business related vocabulary, select one or more candidate words matching with the keyword from the glossary of; error correction according to the selected one or more candidate words of the text information in the key words. The technical scheme fully considers the features of intelligent hardware, the use of business related keywords thesaurus preset to speech recognition results in the analysis of intelligent correction, significantly improve the speech recognition accuracy, occupy less resources and meet the demand of intelligent hardware devices with low energy consumption.
【技术实现步骤摘要】
一种智能硬件设备中的语音识别纠错方法和装置
本专利技术涉及语音识别
,具体涉及一种智能硬件设备中的语音识别纠错方法和装置。
技术介绍
语音识别技术的发展使得用户与智能硬件设备(如智能手表、手机、行车记录仪)的交互变得更加便捷。下面给出了现有技术中,用户利用语音识别技术与智能硬件设备进行交互的几种示例:1)通过语音识别技术将用户的指令转化为文字;2)通过语义分析技术理解用户意图;3)通过语音合成技术将找到的文字资源转化成语音,反馈给用户。其中,语义分析的过程很依赖语音识别的准确率,而语音识别准确率难以达到100%,例如用户是儿童时,其吐字不清晰的特点会使语音识别出现各种各样的错误。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的智能硬件设备中的语音识别纠错方法和装置。依据本专利技术的一个方面,提供了一种智能硬件设备中的语音识别纠错方法,包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。可选地,该方法进一步包括:预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式;在每个固定句式中标记关键词的位置;所述从所述文字信息中提取关键词包括:将所述文字信息与所述一个或多个固定句式进行匹配;根据相匹配的固定句式中标记的关键词的位置,从所述文字信息的相应位置提取关键词。可选地,该方法进一步包 ...
【技术保护点】
一种智能硬件设备中的语音识别纠错方法,其中,该方法包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。
【技术特征摘要】
1.一种智能硬件设备中的语音识别纠错方法,其中,该方法包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。2.如权利要求1所述的方法,其中,该方法进一步包括:预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式;在每个固定句式中标记关键词的位置;所述从所述文字信息中提取关键词包括:将所述文字信息与所述一个或多个固定句式进行匹配;根据相匹配的固定句式中标记的关键词的位置,从所述文字信息的相应位置提取关键词。3.如权利要求1或2所述的方法,其中,该方法进一步包括:为每个固定句式中的关键词标记类型信息;确定智能硬件业务相关的词表的类型信息;所述将所提取的关键词与智能硬件业务相关的词表进行匹配包括:根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息,根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。4.如权利要求1-3中任一项所述的方法,其中,所述根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理包括:对所选出的与所述关键词匹配的每个候选词句,根据所提取关键词与该候选词语的匹配度为该候选词语打分;如果所述关键词的最高分候选词的分数高于或等于第一置信度值,则用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值,则与用户进行进一步的语音对话,以确认是否需要用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数低于或等于第二置信度值,不进行纠正。5.如权利要求1-4中任一项所述的方法,其中,所述根据所提取关键词与该候选词语的匹配度为该候选词语打分包括:将分数从高到低划分为高、中、低三个档位范围;如果关键词与该候选词的拼音相同,只是音调不同,则在高档位范围内打分...
【专利技术属性】
技术研发人员:杨英,张倩倩,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。