【技术实现步骤摘要】
一种语音搜索方法、装置、电子设备及存储介质
本申请涉及语音搜索
,具体而言,涉及一种语音搜索方法、装置、电子设备及存储介质。
技术介绍
随着移动终端技术的飞速发展,移动终端所具备的功能也越来越丰富,如在手机等移动终端上应用十分广泛的语音搜索功能。用户通过语音搜索功能可以搜索包括天气、地图、音乐、联系人等各种类型的数据。现有的语音搜索方法,通常是基于对用户的语音内容的识别结果来进行的,也即,在识别出用户的语音内容后,搜索引擎可以为用户提供与上述语音内容相匹配的搜索内容。以音乐搜索为例,当用户对着移动终端说出:“我想听××歌曲”时,希望该歌曲能够很快被识别并播放。然而,利用现有语音识别技术识别语音内容时,往往无法避免各种语音环境所可能带来的噪声影响,导致语音识别的准确度较差,这将进一步导致返回的搜索内容不准确,甚至是无法返回相应的搜索内容,用户的使用体验度较差。可见,需要一种能够准确推送用户所要搜索的内容的技术方案。
技术实现思路
有鉴于此,本申请实施例的目的在于提供一种语音搜索 ...
【技术保护点】
1.一种语音搜索方法,其特征在于,所述方法包括:/n获取参考文本集;/n针对所述参考文本集中的每个参考文本,基于该参考文本对应的语言种类,对所述参考文本进行处理,得到候选搜索文本库;/n在确定目标语音对应的语音识别文本后,从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库,并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。/n
【技术特征摘要】
1.一种语音搜索方法,其特征在于,所述方法包括:
获取参考文本集;
针对所述参考文本集中的每个参考文本,基于该参考文本对应的语言种类,对所述参考文本进行处理,得到候选搜索文本库;
在确定目标语音对应的语音识别文本后,从所有候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库,并根据查找到的候选搜索文本库确定与所述目标语音对应的参考文本。
2.根据权利要求1所述的方法,其特征在于,所述参考文本包括至少一个汉字,所述至少一个汉字对应的语言种类为汉语类别;基于所述参考文本对应的语言种类,对所述参考文本进行处理,包括:
依次从所述参考文本中提取出各个汉字;
将提取的任意多个汉字进行顺序组合,得到各个汉字组;
将每个所述汉字、以及所述汉字组分别作为处理后的一个候选搜索文本。
3.根据权利要求1所述的方法,其特征在于,所述参考文本包括至少一个拼音,所述至少一个拼音对应的语言种类为汉语类别;基于所述参考文本对应的语言种类,对所述参考文本进行处理,包括:
依次从所述参考文本中提取出各个拼音,并确定每个拼音对应的声母部和韵母部;
将提取的任意多个拼音进行顺序组合,得到各个拼音组;
针对任意两个拼音,确定一个拼音的声母部与另一个拼音的声母部组合后的声母组,以及确定一个拼音的韵母部与另一个拼音的韵母部组合后的韵母组;
将每个所述拼音、所述拼音组、以及所述声母组和所述韵母组分别作为处理后的一个候选搜索文本。
4.根据权利要求1所述的方法,其特征在于,所述参考文本包括至少一个字母,所述至少一个字母对应的语言种类为英语类别;基于所述参考文本对应的语言种类,对所述参考进行处理,包括:
依次从所述参考文本中提取出各个字母;
将提取的任意多个字母进行顺序组合,得到各个字母组;
将每个所述字母组作为处理后的一个候选搜索文本。
5.根据权利要求1所述的方法,其特征在于,在从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库之前,还包括:
基于所述语音识别文本对应的语言种类,对所述语音识别文本进行处理,得到处理后的语音识别文本;
从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库,包括:
从所有候选搜索文本库中查找与处理后的语音识别文本匹配的候选搜索文本库。
6.根据权利要求5所述的方法,其特征在于,从所有所述候选搜索文本库中查找与该语音识别文本对应的语言种类匹配的候选搜索文本库,包括:
针对每个候选搜索文本库,确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度;
按照匹配度由高到低的顺序对所有候选搜索文本库进行排名;
将符合预设名次的候选搜索文本库作为与处理后的语音识别文本匹配的候选搜索文本库。
7.根据权利要求6所述的方法,其特征在于,所述候选搜索文本库中包含多个候选搜索文本;所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度,包括:
针对处理后的每个语音识别文本,确定该语音识别文本是否与所述候选搜索文本库中的任一候选搜索文本相一致;
若一致,则确定该语音识别文本与该候选搜索文本匹配;
针对任一候选搜索文本库,统计与该候选搜索文本库中的候选搜索文本相匹配的语音识别文本的个数;
将统计的个数作为确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度。
8.根据权利要求6所述的方法,其特征在于,在所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度之前,还包括:
针对处理后的每个语音识别文本,为该语音识别文本赋予对应的重要度信息;
所述确定处理后的语音识别文本与该候选搜索文本库中的候选搜索文本之间的匹配度,包括:
确定赋予重要度信息后的语音识别文本与所述候选搜索文本库中的候选搜索文本之间的匹配度。
9.根据权利要求1所述的方法,其特征在于,在基于该参考文本对应的语言种类,对所述参考文本进行处理之前,还包括:
判断所述参考文本是否存在扩展参考文本;
基于该参考文本对应的语言种类,对所述参考文本进行处理,包括:
在判断所述参考文本存在所述扩展参考文本时,基于该参考文本对应的语言种类,对所述参考文本进行处理,以及基于所述扩展参考文本对应的语言种类,对所述扩展参考文本进行处理。
10.根据权利要求1所述的方法,其特征在于,在获取参考文本集之后,还包括:
针对所述参考文本集中的每个参考文本,对该参考文本进行文本转换,得到转换后的参考文本。...
【专利技术属性】
技术研发人员:薄琳,
申请(专利权)人:北京嘀嘀无限科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。