语音识别方法、装置及存储介质制造方法及图纸

技术编号:26847555 阅读:26 留言:0更新日期:2020-12-25 13:12
本公开涉及一种语音识别方法、装置及存储介质,以解决语音识别召回率较低的问题,包括:根据采集到的目标语音确定待查询实体;基于数据库的倒排索引查询待查询实体得到候选实体集;对待查询实体对应的汉字的拼音信息与候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到待查询实体对应的归一化拼音信息和每一候选实体的归一化拼音信息;将待查询实体的归一化拼音信息与每一候选实体的归一化拼音信息进行比对;若存在归一化拼音信息与待查询实体的归一化拼音信息一致的候选实体,则将该候选实体作为针对待查询实体的查询结果。这样,可以有效地提高语音识别的召回率,从而保证语音查询的全面性。

【技术实现步骤摘要】
语音识别方法、装置及存储介质
本公开涉及语音识别
,尤其涉及语音识别方法、装置及存储介质。
技术介绍
ASR(AutomaticSpeechRecognition,自动语音识别)是基于人类的语音,通过语音信号处理和模式识别自动识别语音中的内容,进而快速、便捷地根据该语音内容,实现相应的功能,例如声控电话等移动终端,进行信息查询、呼叫家庭服务、呼叫宾馆服务、呼叫医疗服务等,又例如,在银行服务、工业控制中实现相应的功能。尽管ASR在技术上很大的进展,但受限于ASR的算法模型、特征提取、词汇量及环境噪音等的影响,导致在语义解析和实体查询时存在差异,造成查询内容的召回率和准确率较低,因而导致语音识别的准确性较低。比如,“争奇斗艳”可能被识别成“珍奇斗艳”。并且,若对要查询的内容未能完整地表述,例如,表述的内容比实际查询的内容多字或者少字,也会导致语音识别的准确性较低。相关技术中,为了提高查询内容的召回率和全面性,基于倒排索引字词匹配。即倒排索引出与语音内容字面上匹配字数最多的数据,然后基于TF-IDF算法进行打分排序,取分数最高的本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n根据采集到的目标语音确定待查询实体;/n基于数据库的倒排索引查询所述待查询实体,得到候选实体集;/n对所述待查询实体对应的汉字的拼音信息与所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到所述待查询实体对应的归一化拼音信息以及所述每一候选实体的归一化拼音信息,所述归一化处理用于统一所述拼音信息对平舌音和翘舌音、前鼻音和后鼻音、边音和鼻音、声母f和声母h中的一组或多组的表达方式;/n将所述待查询实体的归一化拼音信息与所述每一候选实体的归一化拼音信息进行比对;并且,/n若存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致...

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
根据采集到的目标语音确定待查询实体;
基于数据库的倒排索引查询所述待查询实体,得到候选实体集;
对所述待查询实体对应的汉字的拼音信息与所述候选实体集中每一候选实体对应的汉字的拼音信息进行归一化处理,得到所述待查询实体对应的归一化拼音信息以及所述每一候选实体的归一化拼音信息,所述归一化处理用于统一所述拼音信息对平舌音和翘舌音、前鼻音和后鼻音、边音和鼻音、声母f和声母h中的一组或多组的表达方式;
将所述待查询实体的归一化拼音信息与所述每一候选实体的归一化拼音信息进行比对;并且,
若存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致的候选实体,则将该候选实体作为针对所述待查询实体的查询结果。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若不存在归一化拼音信息与所述待查询实体的所述归一化拼音信息一致的候选实体,则确定候选实体的归一化拼音信息中是否存在包含和/或包含于待查询实体的归一化拼音信息的第二候选实体,其中,所述第二候选实体的归一化拼音信息与所述待查询实体的所述归一化拼音信息的文字长度差小于4;
若确定候选实体的归一化拼音信息中存在包含所述待查询实体的所述归一化拼音信息的第二候选实体,则将该第二候选实体作为针对所述待查询实体的查询结果。


3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若不存在候选实体的归一化拼音信息中包含所述待查询实体的所述归一化拼音信息的第二候选实体,则对所述待查询实体的归一化拼音信息进行单字拼音分割以及对所述每一候选实体的归一化拼音信息进行单字拼音分割;
将单字拼音分割后的所述待查询实体的所述归一化拼音信息进行单字拼音排列组合以及将单字拼音分割后的所述每一候选实体的归一化拼音信息进行单字拼音排列组合;
将单字拼音排列组合后的所述待查询实体的所述归一化拼音信息与单字拼音排列组合后的所述每一候选实体的归一化拼音信息进行比对;并且,
若存在单字拼音排列组合后的归一化拼音信息与单字拼音分割后的所述待查询实体的所述归一化拼音信息一致的第三候选实体,则将该第三候选实体作为针对所述待查询实体的查询结果。


4.根据权利要求3所述的方法,其特征在于,所述若存在单字拼音排列组合后的归一化拼音信息与单字拼音分割后的所述待查询实体的所述归一化拼音信息一致的第三候选实体,则将该第三候选实体作为针对所述待查询实体的查询结果包括:
对所述单字拼音排列组合后的所述待查询实体的所述归一化拼音信息进行分词处理,得到待查询分词元素,以及对所述单字拼音排列组合后的所述每一候选实体的归一化拼音信息进行分词处理,得到对应的实体候选分词元素;
对所述待查询分词元素进行排列组合,得到待查询组合语句,并由所述待查询组合语句构成待查询拼音列表,以及对所述每一候选实体对应的实体候选分词元素进行排列组合,得到对应的候选实体组合语句,并由对应的所述候选实体组合语句构成对应的候选实体拼音列表;
确定所述待查询拼音列表与每一所述候选实体拼音列表的长度关系以及匹配值,并确定所述待查询拼音列表与所述候选实体拼音列表的长度较短的拼音列表为第一列表;
确定每一所述匹配值与对应的第一列表的长度之间的比值;并且,
若存在比值大于预设阈值的第三候选实体,则将该第三候选实体作为针对所述待查询实体的查询结果。


5.根据权利要求4所述的方法,其特征在于,所述确定所述待查询拼音列表与每一所述候选实体拼音列表的匹配值包括:
遍历确定每一所述待查询组合语句的第一个分词元素拼音开头与每一所述候选实体组合语句的拼音开头是否一致...

【专利技术属性】
技术研发人员:陈亮陈帅彭力
申请(专利权)人:北京小米松果电子有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1