基于用户语音的智能查询方法、装置、设备及存储介质制造方法及图纸

技术编号:36290649 阅读:14 留言:0更新日期:2023-01-13 10:03
本发明专利技术涉及人工智能技术,揭露了一种基于用户语音的智能查询方法、装置、设备及存储介质。所述方法包括:获取用户语音输入的文本语句,通过查询策略与分词阈值,查询文本语句中的待查对象,并将待查对象的拼音进行识别,得到拼音字符;对预构建的数据库中的已存对象集合进行拼音化,得到原始拼音,根据扩展音转换规则进行声韵母转换,得到扩展拼音,并将扩展拼音及原始拼音根据对应关系构建AC树,得到数据库的AC树集合;利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作,对所述精确匹配及所述模糊匹配结果进行交并集计算,得到所述待查对象的公开信息。本发明专利技术可以提高基于用户语音的智能查询的准确性。用户语音的智能查询的准确性。用户语音的智能查询的准确性。

【技术实现步骤摘要】
基于用户语音的智能查询方法、装置、设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于用户语音的智能查询方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着社会的发展,各行各业企业中的人数不断增长,导致企业中人员的数据库不断扩大,人工查询目标对象变得浪费时间且麻烦,由此出现了通信录智能找人、部门、文件的方法。其中,现有的智能查询方法主要是通过命名实体识别的方法,查询人名、地名、机构名等信息进行对象抽取,但所述命名实体识别方法无法对用户的口音进行纠错,导致智能查询的效果不佳。

技术实现思路

[0003]本专利技术提供一种基于用户语音的智能查询方法、装置、设备及存储介质,其主要目的在于提高基于用户语音的智能查询的准确性。
[0004]为实现上述目的,本专利技术提供的一种基于用户语音的智能查询方法,包括:
[0005]获取用户的语音输入,并将所述语音输入进行文字转化,得到文本语句;
[0006]根据预设的查询策略及分词阈值,查询所述文本语句中的待查对象,并从所述语音输入中获取所述待查对象对应的的拼音字符;
[0007]将预构建的数据库中的已存对象集合进行拼音化,得到各已存对象的原始拼音,并根据预设的扩展音转换规则,将各个原始拼音进行声韵母转化,得到扩展拼音;
[0008]根据所述扩展拼音及所述原始拼音的对应关系,构建AC树,得到树集合;
[0009]利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作,分别得到精确匹配结果及模糊匹配结果,并对所述精确匹配及所述模糊匹配结果进行交并集计算,得到所述待查对象的公开信息。
[0010]可选的,所述根据预设的查询策略及分词阈值,查询所述文本语句中的待查对象,包括:
[0011]根据预设的查询策略,判断所述文本语句的长度是否大于预设的分词阈值;
[0012]当所述文本语句的长度大于所述分词阈值时,利用分词工具对所述文本语句进行分词,并从分词结果中得到待查对象;
[0013]当所述文本语句的长度小于或等于所述分词阈值时,根据预设的动词白名单对所述语句文本中的特殊动词进行定位,并获取所述特殊动词关联的待查对象。
[0014]可选的,所述根据所述扩展拼音及所述原始拼音的对应关系,构建AC 树,得到树集合,包括:
[0015]根据所述扩展拼音与所述原始拼音的对应关系,将所述数据库中的已存对象集合对应的扩展拼音及原始拼音进行分组;
[0016]将各组中的已存对象的中文字符作为原始字符串,根据预配置的AC树构建格式,
将各个已存对象对应的扩展拼音、原始拼音及原始字符串进行AC 树结构排列,得到树集合。
[0017]可选的,所述得到所述待查对象的公开信息之后,所述方法还包括:
[0018]判断得到的所述待查对象的数量;
[0019]当得到的所述待查对象没有重名时,将所述待查对象的公开信息进行输出;
[0020]当得到的所述待查对象有重名时,获取各个待查对象的公开信息中的身份信息,并获取所述用户的用户信息,利用余弦算法计算所述用户信息与各个身份信息的聚类相关性,并根据所述聚类相关性对各个待查对象的公开信息进行排序展示。
[0021]可选的,所述将所述语音输入进行文字转化,得到文本语句,包括:
[0022]对所述语音输入进行小波降噪处理,得到降噪音频;
[0023]根据字节频率对所述降噪音频进行音素识别,并利用预设大小的提取框根据预设步长,将各个音素进行遍历提取,并根据预构建的字典,查询提取到的各个音素组块对应的字词集合;
[0024]将所述字词集合中的各个字词根据所述语音输入的顺序进行排列,得到组合文本集合;
[0025]利用预训练的文本识别模型,对所述组合文本集合进行语句通顺度识别,将通顺度最高的组合文本输出,作为文本语句。
[0026]为了解决上述问题,本专利技术还提供一种基于用户语音的智能查询装置,所述装置包括:
[0027]用户拼音获取模块,用于获取用户的语音输入,并将所述语音输入进行文字转化,得到文本语句,及根据预设的查询策略及分词阈值,查询所述文本语句中的待查对象,并从所述语音输入中获取所述待查对象对应的的拼音字符;
[0028]数据库拼音化模块,用于将预构建的数据库中的已存对象集合进行拼音化,得到各已存对象的原始拼音,并根据预设的扩展音转换规则,将各个原始拼音进行声韵母转化,得到扩展拼音;
[0029]AC树构建模块,用于根据所述扩展拼音及所述原始拼音的对应关系,构建AC树,得到树集合;
[0030]综合查询模块,用于利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作,分别得到精确匹配结果及模糊匹配结果,并对所述精确匹配及所述模糊匹配结果进行交并集计算,得到所述待查对象的公开信息。
[0031]可选的,所述根据预设的查询策略及分词阈值,查询所述文本语句中的待查对象,包括:
[0032]根据预设的查询策略,判断所述文本语句的长度是否大于预设的分词阈值;
[0033]当所述文本语句的长度大于所述分词阈值时,利用分词工具对所述文本语句进行分词,并从分词结果中得到待查对象;
[0034]当所述文本语句的长度小于或等于所述分词阈值时,根据预设的动词白名单对所述语句文本中的特殊动词进行定位,并获取所述特殊动词关联的待查对象。
[0035]可选的,所述根据所述扩展拼音及所述原始拼音的对应关系,构建AC 树,得到树集合,包括:
[0036]根据所述扩展拼音与所述原始拼音的对应关系,将所述数据库中的已存对象集合对应的扩展拼音及原始拼音进行分组;
[0037]将各组中的已存对象的中文字符作为原始字符串,根据预配置的AC树构建格式,将各个已存对象对应的扩展拼音、原始拼音及原始字符串进行AC 树结构排列,得到树集合。
[0038]为了解决上述问题,本专利技术还提供一种电子设备,所述电子设备包括:
[0039]至少一个处理器;以及,
[0040]与所述至少一个处理器通信连接的存储器;其中,
[0041]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述所述的基于用户语音的智能查询方法。
[0042]为了解决上述问题,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的基于用户语音的智能查询方法。
[0043]本专利技术实施例获取用户的语音输入中的文本语句,并根据查询策略,查询所述文本语句中的待查对象及所述待查对象的拼音字符,其中,所述查询策略,为分词工具查询或特殊动词查询,有利于增加所述待查对象的准确度;然后将预构建的数据库中已存对象进行拼音化,并进行声韵母转化,得到扩展拼音,其中,所述声韵母转化可以改变所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户语音的智能查询方法,其特征在于,所述方法包括:获取用户的语音输入,并将所述语音输入进行文字转化,得到文本语句;根据预设的查询策略及分词阈值,查询所述文本语句中的待查对象,并从所述语音输入中获取所述待查对象对应的的拼音字符;将预构建的数据库中的已存对象集合进行拼音化,得到各已存对象的原始拼音,并根据预设的扩展音转换规则,将各个原始拼音进行声韵母转化,得到扩展拼音;根据所述扩展拼音及所述原始拼音的对应关系,构建AC树,得到树集合;利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作,分别得到精确匹配结果及模糊匹配结果,并对所述精确匹配及所述模糊匹配结果进行交并集计算,得到所述待查对象的公开信息。2.如权利要求1所述的基于用户语音的智能查询方法,其特征在于,所述根据预设的查询策略及分词阈值,查询所述文本语句中的待查对象,包括:根据预设的查询策略,判断所述文本语句的长度是否大于预设的分词阈值;当所述文本语句的长度大于所述分词阈值时,利用分词工具对所述文本语句进行分词,并从分词结果中得到待查对象;当所述文本语句的长度小于或等于所述分词阈值时,根据预设的动词白名单对所述语句文本中的特殊动词进行定位,并获取所述特殊动词关联的待查对象。3.如权利要求1所述的基于用户语音的智能查询方法,其特征在于,所述根据所述扩展拼音及所述原始拼音的对应关系,构建AC树,得到树集合,包括:根据所述扩展拼音与所述原始拼音的对应关系,将所述数据库中的已存对象集合对应的扩展拼音及原始拼音进行分组;将各组中的已存对象的中文字符作为原始字符串,根据预配置的AC树构建格式,将各个已存对象对应的扩展拼音、原始拼音及原始字符串进行AC树结构排列,得到树集合。4.如权利要求1所述的基于用户语音的智能查询方法,其特征在于,所述得到所述待查对象的公开信息之后,所述方法还包括:判断得到的所述待查对象的数量;当得到的所述待查对象没有重名时,将所述待查对象的公开信息进行输出;当得到的所述待查对象有重名时,获取各个待查对象的公开信息中的身份信息,并获取所述用户的用户信息,利用余弦算法计算所述用户信息与各个身份信息的聚类相关性,并根据所述聚类相关性对各个待查对象的公开信息进行排序展示。5.如权利要求1所述的基于用户语音的智能查询方法,其特征在于,所述将所述语音输入进行文字转化,得到文本语句,包括:对所述语音输入进行小波降噪处理,得到降噪音频;根据字节频率对所述降噪音频进行音素识别,并利用预设大小的提取框根据预设步长,将各个音素进行遍历提取,并根据预构建的字典,查询提取到的各个音素组块对应的字词集合;将...

【专利技术属性】
技术研发人员:谢正文夏璨王阳欧阳此君刘屹孙敬萍
申请(专利权)人:招商局金融科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1