一种智能硬件设备中的语音识别纠错方法和装置制造方法及图纸

技术编号:15439041 阅读:43 留言:0更新日期:2017-05-26 04:49
本发明专利技术公开了一种智能硬件设备中的语音识别纠错方法和装置。其中方法包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。该技术方案充分考虑了智能硬件的功能特性,利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错,显著提升了语音识别的准确度,并且占用的资源较少,符合智能硬件设备低能耗的需求。

Speech recognition and error correction method and device in intelligent hardware device

The invention discloses a speech recognition error correction method and device in an intelligent hardware device. The method includes: the speech signal will be converted into intelligent hardware devices receive text messages through voice recognition technology; extracting keywords from the text information; matching the extracted keywords and intelligent hardware business related vocabulary, select one or more candidate words matching with the keyword from the glossary of; error correction according to the selected one or more candidate words of the text information in the key words. The technical scheme fully considers the features of intelligent hardware, the use of business related keywords thesaurus preset to speech recognition results in the analysis of intelligent correction, significantly improve the speech recognition accuracy, occupy less resources and meet the demand of intelligent hardware devices with low energy consumption.

【技术实现步骤摘要】
一种智能硬件设备中的语音识别纠错方法和装置
本专利技术涉及语音识别
,具体涉及一种智能硬件设备中的语音识别纠错方法和装置。
技术介绍
语音识别技术的发展使得用户与智能硬件设备(如智能手表、手机、行车记录仪)的交互变得更加便捷。下面给出了现有技术中,用户利用语音识别技术与智能硬件设备进行交互的几种示例:1)通过语音识别技术将用户的指令转化为文字;2)通过语义分析技术理解用户意图;3)通过语音合成技术将找到的文字资源转化成语音,反馈给用户。其中,语义分析的过程很依赖语音识别的准确率,而语音识别准确率难以达到100%,例如用户是儿童时,其吐字不清晰的特点会使语音识别出现各种各样的错误。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的智能硬件设备中的语音识别纠错方法和装置。依据本专利技术的一个方面,提供了一种智能硬件设备中的语音识别纠错方法,包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。可选地,该方法进一步包括:预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式;在每个固定句式中标记关键词的位置;所述从所述文字信息中提取关键词包括:将所述文字信息与所述一个或多个固定句式进行匹配;根据相匹配的固定句式中标记的关键词的位置,从所述文字信息的相应位置提取关键词。可选地,该方法进一步包括:为每个固定句式中的关键词标记类型信息;确定智能硬件业务相关的词表的类型信息;所述将所提取的关键词与智能硬件业务相关的词表进行匹配包括:根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息,根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。可选地,所述根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理包括:对所选出的与所述关键词匹配的每个候选词句,根据所提取关键词与该候选词语的匹配度为该候选词语打分;如果所述关键词的最高分候选词的分数高于或等于第一置信度值,则用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值,则与用户进行进一步的语音对话,以确认是否需要用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数低于或等于第二置信度值,不进行纠正。可选地,所述根据所提取关键词与该候选词语的匹配度为该候选词语打分包括:将分数从高到低划分为高、中、低三个档位范围;如果关键词与该候选词的拼音相同,只是音调不同,则在高档位范围内打分;如果关键词与该候选词的拼音中的声母或韵母部分相同,则在中档位范围内打分;如果关键词与该候选词的拼音中的声母、韵母都不相同,则在低档位范围内打分。可选地,该方法进一步包括:如果从所述文字信息中提取了多个关键词,则将各关键词的最高分候选词的分数相乘,得到该多个关键词的分数;如果多个关键词的分数高于或等于第三置信度值,则用各关键词的最高分候选词纠正所述各关键词;如果多个关键词的分数高于第四置信度值但低于第三置信度值,则与用户进行进一步的语音对话,以确认是否需要各关键词的最高分候选词纠正所述各关键词;如果多个关键词的分数低于或等于第四置信度值,不进行纠正。可选地,该方法进一步包括:根据纠正处理结果输出所述智能硬件设备的相应业务服务。依据本专利技术的另一方面,提供了一种智能硬件设备中的语音识别纠错装置,包括:语音识别单元,适于将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;关键词提取单元,适于从所述文字信息中提取关键词;匹配单元,适于将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;纠错单元,适于根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。可选地,该装置进一步包括:配置单元,适于预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式;在每个固定句式中标记关键词的位置;所述关键词提取单元,适于将所述文字信息与所述一个或多个固定句式进行匹配;根据相匹配的固定句式中标记的关键词的位置,从所述文字信息的相应位置提取关键词。可选地,所述配置单元,进一步适于为每个固定句式中的关键词标记类型信息;确定智能硬件业务相关的词表的类型信息;所述匹配单元,适于根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息,根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。可选地,所述纠错单元,适于对所选出的与所述关键词匹配的每个候选词句,根据所提取关键词与该候选词语的匹配度为该候选词语打分;如果所述关键词的最高分候选词的分数高于或等于第一置信度值,则用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值,则与用户进行进一步的语音对话,以确认是否需要用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数低于或等于第二置信度值,不进行纠正。可选地,所述纠错单元,适于将分数从高到低划分为高、中、低三个档位范围;如果关键词与该候选词的拼音相同,只是音调不同,则在高档位范围内打分;如果关键词与该候选词的拼音中的声母或韵母部分相同,则在中档位范围内打分;如果关键词与该候选词的拼音中的声母、韵母都不相同,则在低档位范围内打分。可选地,所述纠错单元,进一步适于当从所述文字信息中提取了多个关键词时,将各关键词的最高分候选词的分数相乘,得到该多个关键词的分数;如果多个关键词的分数高于或等于第三置信度值,则用各关键词的最高分候选词纠正所述各关键词;如果多个关键词的分数高于第四置信度值但低于第三置信度值,则与用户进行进一步的语音对话,以确认是否需要各关键词的最高分候选词纠正所述各关键词;如果多个关键词的分数低于或等于第四置信度值,不进行纠正。可选地,该装置进一步包括:业务服务单元,适于根据纠正处理结果输出所述智能硬件设备的相应业务服务。由上述可知,本专利技术的技术方案,首先利用语音识别技术对智能硬件设备收到的语音信号进行语音识别,将其转换为文字信息,再进一步解析文字信息得到其中的若干个关键词,将这些关键词通过与智能硬件业务相关的词表进行匹配,确定一个或多个候选词语,最后利用得到的候选词语对关键词进行纠错。该技术方案充分考虑了智能硬件的功能特性,利用预设的业务相关词表对语音识别结果中解析出的关键词进行智能纠错,显著提升了语音识别的准确度,并且占用的资源较少,符合智能硬件设备低能耗的需求。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1本文档来自技高网...
一种智能硬件设备中的语音识别纠错方法和装置

【技术保护点】
一种智能硬件设备中的语音识别纠错方法,其中,该方法包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。

【技术特征摘要】
1.一种智能硬件设备中的语音识别纠错方法,其中,该方法包括:将智能硬件设备收到的语音信号通过语音识别技术转换成文字信息;从所述文字信息中提取关键词;将所提取的关键词与智能硬件业务相关的词表进行匹配,从词表中选出与所述关键词匹配的一个或多个候选词语;根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理。2.如权利要求1所述的方法,其中,该方法进一步包括:预先设置一个或多个与所述智能硬件设备的业务语音交互关联的一个或多个固定句式;在每个固定句式中标记关键词的位置;所述从所述文字信息中提取关键词包括:将所述文字信息与所述一个或多个固定句式进行匹配;根据相匹配的固定句式中标记的关键词的位置,从所述文字信息的相应位置提取关键词。3.如权利要求1或2所述的方法,其中,该方法进一步包括:为每个固定句式中的关键词标记类型信息;确定智能硬件业务相关的词表的类型信息;所述将所提取的关键词与智能硬件业务相关的词表进行匹配包括:根据相匹配的固定句式中的关键词的类型信息确定所提取的关键词的类型信息,根据所提取的关键词的类型信息将所提取的关键词与类型匹配的词表进行匹配。4.如权利要求1-3中任一项所述的方法,其中,所述根据所选出的一个或多个候选词语对所述文字信息中的关键词进行纠错处理包括:对所选出的与所述关键词匹配的每个候选词句,根据所提取关键词与该候选词语的匹配度为该候选词语打分;如果所述关键词的最高分候选词的分数高于或等于第一置信度值,则用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数高于第二置信度值但低于第一置信度值,则与用户进行进一步的语音对话,以确认是否需要用该最高分候选词纠正所述关键词;如果所述关键词的最高分候选词的分数低于或等于第二置信度值,不进行纠正。5.如权利要求1-4中任一项所述的方法,其中,所述根据所提取关键词与该候选词语的匹配度为该候选词语打分包括:将分数从高到低划分为高、中、低三个档位范围;如果关键词与该候选词的拼音相同,只是音调不同,则在高档位范围内打分...

【专利技术属性】
技术研发人员:杨英张倩倩
申请(专利权)人:北京奇虎科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1