基于用户语音的智能查询方法、装置、设备及存储介质制造方法及图纸

技术编号：36290649 阅读：14 留言：0更新日期：2023-01-13 10:03

本发明专利技术涉及人工智能技术，揭露了一种基于用户语音的智能查询方法、装置、设备及存储介质。所述方法包括：获取用户语音输入的文本语句，通过查询策略与分词阈值，查询文本语句中的待查对象，并将待查对象的拼音进行识别，得到拼音字符；对预构建的数据库中的已存对象集合进行拼音化，得到原始拼音，根据扩展音转换规则进行声韵母转换，得到扩展拼音，并将扩展拼音及原始拼音根据对应关系构建AC树，得到数据库的AC树集合；利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作，对所述精确匹配及所述模糊匹配结果进行交并集计算，得到所述待查对象的公开信息。本发明专利技术可以提高基于用户语音的智能查询的准确性。用户语音的智能查询的准确性。用户语音的智能查询的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于用户语音的智能查询方法、装置、设备及存储介质

[0001]本专利技术涉及人工智能
，尤其涉及一种基于用户语音的智能查询方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]随着社会的发展，各行各业企业中的人数不断增长，导致企业中人员的数据库不断扩大，人工查询目标对象变得浪费时间且麻烦，由此出现了通信录智能找人、部门、文件的方法。其中，现有的智能查询方法主要是通过命名实体识别的方法，查询人名、地名、机构名等信息进行对象抽取，但所述命名实体识别方法无法对用户的口音进行纠错，导致智能查询的效果不佳。

技术实现思路

[0003]本专利技术提供一种基于用户语音的智能查询方法、装置、设备及存储介质，其主要目的在于提高基于用户语音的智能查询的准确性。
[0004]为实现上述目的，本专利技术提供的一种基于用户语音的智能查询方法，包括：
[0005]获取用户的语音输入，并将所述语音输入进行文字转化，得到文本语句；
[0006]根据预设的查询策略及分词阈值，查询所述文本语句中的待查对象，并从所述语音输入中获取所述待查对象对应的的拼音字符；
[0007]将预构建的数据库中的已存对象集合进行拼音化，得到各已存对象的原始拼音，并根据预设的扩展音转换规则，将各个原始拼音进行声韵母转化，得到扩展拼音；
[0008]根据所述扩展拼音及所述原始拼音的对应关系，构建AC树，得到树集合；
[0009]利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作，分别得到精确匹配...

【技术保护点】

【技术特征摘要】
1.一种基于用户语音的智能查询方法，其特征在于，所述方法包括：获取用户的语音输入，并将所述语音输入进行文字转化，得到文本语句；根据预设的查询策略及分词阈值，查询所述文本语句中的待查对象，并从所述语音输入中获取所述待查对象对应的的拼音字符；将预构建的数据库中的已存对象集合进行拼音化，得到各已存对象的原始拼音，并根据预设的扩展音转换规则，将各个原始拼音进行声韵母转化，得到扩展拼音；根据所述扩展拼音及所述原始拼音的对应关系，构建AC树，得到树集合；利用所述拼音字符对所述树集合进行字符串精确及模糊匹配操作，分别得到精确匹配结果及模糊匹配结果，并对所述精确匹配及所述模糊匹配结果进行交并集计算，得到所述待查对象的公开信息。2.如权利要求1所述的基于用户语音的智能查询方法，其特征在于，所述根据预设的查询策略及分词阈值，查询所述文本语句中的待查对象，包括：根据预设的查询策略，判断所述文本语句的长度是否大于预设的分词阈值；当所述文本语句的长度大于所述分词阈值时，利用分词工具对所述文本语句进行分词，并从分词结果中得到待查对象；当所述文本语句的长度小于或等于所述分词阈值时，根据预设的动词白名单对所述语句文本中的特殊动词进行定位，并获取所述特殊动词关联的待查对象。3.如权利要求1所述的基于用户语音的智能查询方法，其特征在于，所述根据所述扩展拼音及所述原始拼音的对应关系，构建AC树，得到树集合，包括：根据所述扩展拼音与所述原始拼音的对应关系，将所述数据库中的已存对象集合对应的扩展拼音及原始拼音进行分组；将各组中的已存对象的中文字符作为原始字符串，根据预配置的AC树构建格式，将各个已存对象对应的扩展拼音、原始拼音及原始字符串进行AC树结构排列，得到树集合。4.如权利要求1所述的基于用户语音的智能查询方法，其特征在于，所述得到所述待查对象的公开信息之后，所述方法还包括：判断得到的所述待查对象的数量；当得到的所述待查对象没有重名时，将所述待查对象的公开信息进行输出；当得到的所述待查对象有重名时，获取各个待查对象的公开信息中的身份信息，并获取所述用户的用户信息，利用余弦算法计算所述用户信息与各个身份信息的聚类相关性，并根据所述聚类相关性对各个待查对象的公开信息进行排序展示。5.如权利要求1所述的基于用户语音的智能查询方法，其特征在于，所述将所述语音输入进行文字转化，得到文本语句，包括：对所述语音输入进行小波降噪处理，得到降噪音频；根据字节频率对所述降噪音频进行音素识别，并利用预设大小的提取框根据预设步长，将各个音素进行遍历提取，并根据预构建的字典，查询提取到的各个音素组块对应的字词集合；将...

【专利技术属性】
技术研发人员：谢正文，夏璨，王阳，欧阳此君，刘屹，孙敬萍，
申请(专利权)人：招商局金融科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人