查询语句管理方法和装置、可读存储介质、电子设备制造方法及图纸

技术编号:26376448 阅读:40 留言:0更新日期:2020-11-19 23:45
本公开实施例公开了一种查询语句管理方法和装置、可读存储介质、电子设备,其中,方法包括:获取日志中符合预设条件的多个查询语句;对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合,其中,每个所述聚类集合中包括至少一个查询语句;分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句;本实施例通过分类和聚合处理,确定了与聚类集合匹配的设定数量的匹配标准问句,实现对不同方式提出的实质相同的问题匹配对应的标准问句,以提高对不同查询语句的处理效率。

【技术实现步骤摘要】
查询语句管理方法和装置、可读存储介质、电子设备
本公开涉及语句管理
,尤其是一种查询语句管理方法和装置、可读存储介质、电子设备。
技术介绍
对于涉及问答的业务场景,在回答问题的过程中会遇到很多业务上的问题,例如,房产经纪人会遇到如:二套房的贷款比例,税费如何计算等问题;而房产经纪人自己也有需要解答的问题,比如公司某项规章制度的解读,公积金如何提取等。由于需要解决各种面向不同人群的问题,知识管理需要将问题积累沉淀并产生对应知识,提供一个便捷的搜索入口,以便后续有人再有相同问题时可以直接搜到答案。但是千人千面,不同人的人问问题的方式也不尽相同,同一个问题会有多种问法,比如针对“邮箱密码如何修改及重置”这一问题,可能出现的问法有“邮箱密码忘记了怎么办”,“怎么修改邮箱密码”,“邮箱密码修改规则是什么”,“邮箱密码丢了如何找回”等等;因此,需要对查询语句进行管理。
技术实现思路
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种查询语句管理方法和装置、可读存储介质、电子设备。根据本公开实施例的一个方面,提供了一种查询语句管理方法,包括:获取日志中符合预设条件的多个查询语句;对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合;其中,每个所述聚类集合中包括至少一个查询语句;分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句。可选地,所述预设条件包括以下至少一种:有答案无点击、无答案;所述获取日志中符合预设条件的多个查询语句,包括:基于所述预设条件对从日志中获取的查询语句进行筛选,获得符合所述预设条件的多个查询语句。可选地,所述对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合,包括:对所述多个查询语句进行分类,将所述多个查询语句分类到至少一个类别中;其中,所述每个类别中包括至少两个所述查询语句;对所述每个类别中包括的至少两个所述查询语句进行聚类,得到至少一个聚类集合。可选地,所述对所述多个查询语句进行分类,将所述多个查询语句分类到至少一个类别中,包括:针对所述多个查询语句中的每个所述查询语句,对所述查询语句进行分词,得到至少一个词语;通过分类模型对所述至少一个词语对应的至少一个词向量进行处理,确定所述查询语句对应的类别标签;其中,所述分类模型经过已知类别标签的训练语句集合训练,所述语句训练集合对应所述查询语句的业务场景。可选地,所述分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句,包括:针对所述聚类集合中的每个所述查询语句,将所述查询语句与预存的多个标准问句中的每个标准问句通过输入网络模型进行评分,得到所述查询语句与所述多个标准问句中每个标准问句相匹配的得分;基于所述得分确定与所述查询语句相匹配的设定数量的标准问句;基于与所述聚类集合中包括的每个所述查询语句相匹配的标准问句,确定所述聚类集合对应的设定数量的匹配标准问句。可选地,所述基于所述得分确定与所述查询语句相匹配的设定数量的标准问句,包括:按照所述得分的大小对所述多个标准问句对应的多个得分进行排序;按照所述排序,确定得分最高的设定数量的所述标准问句作为所述查询语句的标准问句。可选地,所述基于与所述聚类集合中包括的每个所述查询语句相匹配的标准问句,确定所述聚类集合对应的设定数量的匹配标准问句,包括:基于与所述聚类集合中包括的每个所述查询语句相匹配的标准问句,得到所述聚类集合对应的多个标准问句;基于所述多个标准问句中每个所述标准问句对应的得分,确定设定数量的所述标准问句作为所述聚类集合对应的匹配标准问句。可选地,所述将所述查询语句与预存的多个标准问句中的每个标准问句通过输入网络模型进行评分,得到所述查询语句与所述多个标准问句中每个标准问句相匹配的得分,包括:分别对所述查询语句与所述每个标准问句进行分词,确定所述查询语句对应的多个词向量和所述标准问句对应的多个词向量;通过双向长短期记忆网络对所述查询语句对应的多个词向量进行处理,得到句子特征;通过双向长短期记忆网络对所述标准问句对应的多个词向量进行处理,得到标准问特征;连接所述句子特征和所述标准问特征,得到连接特征;基于所述连接特征确定一个一维矩阵,通过所述一维矩阵确定所述查询语句与所述标准问句相匹配的得分和所述标准问句在所述多个标准问句中的位置;其中,所述一维矩阵表示所述查询语句与所述多个标准问句之间的匹配关系。可选地,还包括:基于所述匹配标准问句确定所述聚类集合中包括查询语句对应的答案内容,并将所述查询语句与所述答案内容存入知识库。可选地,所述基于所述匹配标准问句确定所述聚类集合中包括查询语句对应的答案内容,包括:基于所述设定数量的匹配标准问句,确定设定数量的与所述标准问句对应的答案内容;将所述设定数量的答案内容作为所述聚类集合对应的答案内容。根据本公开实施例的另一方面,提供了一种查询语句管理装置,包括:语句获取模块,用于获取日志中符合预设条件的多个查询语句;语句处理模块,用于对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合;其中,每个所述聚类集合中包括至少一个查询语句;标准匹配模块,用于分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句。可选地,所述预设条件包括以下至少一种:有答案无点击、无答案;所述语句获取模块,具体用于基于所述预设条件对从日志中获取的查询语句进行筛选,获得符合所述预设条件的多个查询语句。可选地,所述语句处理模块,包括:分类单元,用于对所述多个查询语句进行分类,将所述多个查询语句分类到至少一个类别中;其中,所述每个类别中包括至少两个所述查询语句;聚类单元,用于对所述每个类别中包括的至少两个所述查询语句进行聚类,得到至少一个聚类集合。可选地,所述分类单元,具体用于针对所述多个查询语句中的每个所述查询语句,对所述查询语句进行分词,得到至少一个词语;通过分类模型对所述至少一个词语对应的至少一个词向量进行处理,确定所述查询语句对应的类别标签;其中,所述分类模型经过已知类别标签的训练语句集合训练,所述语句训练集合对应所述查询语句的业务场景。可选地,所述标准匹配模块,包括:评分单元,用于针对所述聚类集合中的每个所述查询语句,将所述查询语句与预存的多个标准问句中的每个标准问句通过输入网络模型进行评分,得到所述查询语句与所述多个标准问句中每个标准问句相匹配的得分;语句匹配单元,用于基于所述得分确定与所述查询语句相匹配的设定数量的标准问句;集合匹配单元,用于基于与所述聚类集合中包括的每个本文档来自技高网...

【技术保护点】
1.一种查询语句管理方法,其特征在于,包括:/n获取日志中符合预设条件的多个查询语句;/n对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合;其中,每个所述聚类集合中包括至少一个查询语句;/n分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句。/n

【技术特征摘要】
1.一种查询语句管理方法,其特征在于,包括:
获取日志中符合预设条件的多个查询语句;
对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合;其中,每个所述聚类集合中包括至少一个查询语句;
分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句。


2.根据权利要求1所述的方法,其特征在于,所述预设条件包括以下至少一种:有答案无点击、无答案;
所述获取日志中符合预设条件的多个查询语句,包括:
基于所述预设条件对从日志中获取的查询语句进行筛选,获得符合所述预设条件的多个查询语句。


3.根据权利要求1或2所述的方法,其特征在于,所述对所述多个查询语句进行分类处理,并基于分类处理的结果进行聚合处理,得到至少一个聚类集合,包括:
对所述多个查询语句进行分类,将所述多个查询语句分类到至少一个类别中;其中,所述每个类别中包括至少两个所述查询语句;
对所述每个类别中包括的至少两个所述查询语句进行聚类,得到至少一个聚类集合。


4.根据权利要求3所述的方法,其特征在于,所述对所述多个查询语句进行分类,将所述多个查询语句分类到至少一个类别中,包括:
针对所述多个查询语句中的每个所述查询语句,对所述查询语句进行分词,得到至少一个词语;
通过分类模型对所述至少一个词语对应的至少一个词向量进行处理,确定所述查询语句对应的类别标签;其中,所述分类模型经过已知类别标签的训练语句集合训练,所述语句训练集合对应所述查询语句的业务场景。


5.根据权利要求1-4任一所述的方法,其特征在于,所述分别对所述聚类集合中的每个所述查询语句进行标准问句匹配,为所述每个聚类集合确定设定数量的匹配标准问句,包括:
针对所述聚类集合中的每个所述查询语句,将所述查询语句与预存的多个标准问句中的每个标准问句通过输入网络模型进行评分,得到所述查询语句与所述多个标准问句中每个标准问句相匹配的得分;
基于所述得分确定与所述查询语句相匹配的设定数量的标准问句;
基于与所述聚类集合中包括的每个所述查询语句相匹配的标准问句,确定所述聚...

【专利技术属性】
技术研发人员:卢新洁赵嫘崔鸣梁达昌黄钰瑶
申请(专利权)人:贝壳技术有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1