数据更新方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:24708182 阅读:90 留言:0更新日期:2020-06-30 23:59
本申请提供了一种数据更新方法、装置、电子设备及计算机可读存储介质。所述方法包括:获取搜索语句;根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句;在知识库中未查询到所述目标查询语句对应的查询结果时,对所述搜索语句进行聚类处理,得到至少一个聚类搜索内容;将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端;获取由所述业务端根据所述目标搜索内容编辑的目标查询结果;根据所述目标查询结果更新所述知识库。本申请通过在根据聚类的搜索内容未查询到相应结果时,直接将搜索内容发送至业务端进行编辑,无需人工判断需要向知识库加入哪些知识,减少了人力资源的浪费,节省了人力成本。

【技术实现步骤摘要】
数据更新方法、装置、电子设备及计算机可读存储介质
本申请涉及数据处理
,特别是涉及一种数据更新方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网和大数据技术的发展,各行业数据呈指数级增长,如何将海量的数据进行有效地处理与利用存在巨大价值。知识图谱利用图的方式来存储知识,给信息处理系统理解和处理自然语言带来了全新的思路,目前被广泛应用于智能问答、辅助决策等方面。人们对知识图谱的依赖性越来越强。然而知识图谱是非常复杂的,通过直接观察图谱本身用户同样不能迅速获得想要的知识。通过知识图谱可视化技术,则能够将知识图谱从不同维度进行可视化展示,方便用户更高效地了解和使用知识图谱的内容。可视化技术诞生已久,但是面向垂直领域的知识图谱进行可视化的技术还有待完善。已有知识图谱可视化服务基本都是图谱内容的简单图形可视化,而垂直领域知识图谱需要面向领域内不同用户进行多方位展示,便于数据的深入挖掘和分析。垂直领域知识图谱是需要不断积累更新的,一般依靠知识库管理人员的经验判断需要向知识库中加入哪些知识,它可以与知识检索过程有效结合,造成人力资源的浪费,且增加了人力成本。
技术实现思路
本申请提供一种数据更新方法、装置、电子设备及计算机可读存储介质,以解决现有技术中依靠知识库管理人员的经验判断需要向知识库中加入哪些知识,它可以与知识检索过程有效结合,造成人力资源的浪费,且增加了人力成本的问题。为了解决上述问题,本申请公开了一种数据更新方法,包括:获取搜索语句;>根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句;在知识库中未查询到所述目标查询语句对应的查询结果时,对所述搜索语句进行聚类处理,得到至少一个聚类搜索内容;将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端;获取由所述业务端根据所述目标搜索内容编辑的目标查询结果;根据所述目标查询结果更新所述知识库。可选地,所述根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句,包括:在所述搜索语句对应的语句类型为实体词类型时,将所述搜索语句映射为所述目标查询语句。可选地,所述根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句,包括:在所述搜索语句对应的语句类型为自然语句类型时,调用预先训练的语句识别模型对所述搜索语句进行处理,确定所述对应的目标查询语句。可选地,所述调用预先训练的语句识别模型对所述搜索语句进行处理,确定所述搜索语句对应的目标查询语句,包括:将所述搜索语句输入至所述语句识别模型;获取所述搜索语句对应的词向量;调用双向长短时记忆模型层对所述词向量进行编码处理,得到所述词向量对应的编码向量;调用长短时记忆模型层对所述编码向量进行解码处理,得到解码词向量;调用分类层对所述解码实体词进行实体识别处理,确定所述搜索语句中包含的实体词及所述实体词对应的实体类型;调用卷积神经网络层对所述搜索语句进行分类处理,确定所述搜索语句对应的所述语句类型;根据所述实体词、所述实体类型和所述实体类型,确定所述目标查询语句。可选地,所述根据所述实体词、所述实体类型和所述语句类型,确定所述目标查询语句,包括:调用所述语句识别模型根据所述语句类型,确定所述语句类型对应的查询模板;根据所述查询模板、所述实体词和所述实体类型,确定所述目标查询语句。可选地,所述将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端,包括:获取所述至少一个聚类搜索内容对应的热度属性值;根据各所述热度属性值,获取所述至少一个聚类搜索内容中的热度属性值大于或者等于设定属性值的聚类搜索内容,将所述热度属性值大于或者等于设定属性值的聚类搜索内容确定为所述目标搜索内容;将所述目标搜索内容发送至所述业务端。可选地,在所述根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句之后,还包括:在根据所述目标查询语句在知识库中获取到查询结果时,获取所述查询结果对应的文本信息和图示信息;将所述文本信息和所述图示信息发送给所述用户。为了解决上述问题,本申请公开了一种数据更新装置,包括:搜索语句获取模块,用于获取搜索语句;目标查询语句确定模块,用于根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句;搜索内容获取模块,用于在知识库中未查询到所述目标查询语句对应的查询结果时,对所述搜索语句进行聚类处理,得到至少一个聚类搜索内容;搜索内容发送模块,用于将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端;目标查询结果获取模块,用于获取由所述业务端根据所述目标搜索内容编辑的目标查询结果;知识库更新模块,用于根据所述目标查询结果更新所述知识库。可选地,所述目标查询语句确定模块包括:目标查询语句获取单元,用于在所述搜索语句对应的语句类型为实体词类型时,将所述搜索语句映射为所述目标查询语句。可选地,所述目标查询语句确定模块包括:目标查询语句确定单元,用于在所述搜索语句对应的语句类型为自然语句类型时,调用预先训练的语句识别模型对所述搜索语句进行处理,确定所述搜索语句对应的目标查询语句。可选地,所述目标查询语句确定包括:搜索语句输入子单元,用于将所述搜索语句输入至所述语句识别模型;词向量获取子单元,用于获取所述搜索语句对应的词向量;编码向量获取子单元,用于调用双向长短时记忆模型层对所述词向量进行编码处理,得到所述词向量对应的编码向量;解码词向量获取子单元,用于调用长短时记忆模型层对所述编码向量进行解码处理,得到解码词向量;实体词确定子单元,用于调用分类层对所述解码实体词进行实体识别处理,确定所述搜索语句中包含的实体词及所述实体词对应的实体类型;语句类型确定子单元,用于调用卷积神经网络层对所述搜索语句进行分类处理,确定所述搜索语句对应的所述语句类型;目标查询语句确定子单元,用于根据所述实体词、所述实体类型和所述语句类型,确定所述目标查询语句。可选地,所述目标查询语句确定子单元,包括:查询模板确定子单元,用于调用所述语句识别模型根据所述语句类型,确定所述实体类型对应的查询模板;查询语句确定子单元,用于根据所述查询模板、所述实体词和所述实体类型,确定所述目标查询语句。可选地,所述搜索内容发送模块包括:热度属性值获取单元,用于获取所述至少一个聚类搜索内容对应的热度属性值;搜索内容确定单元,用于根据各所述热度属性值,获取所述至少一个聚类搜索内容中的热度属性值大于或者等于设定属性值的聚类搜索内容,将所述热度属性值大于或者等于设定属性值的聚类搜索内容确定为所述目标搜索内容;搜索内容发送单元,用于将所述目标搜索内容发送至所述业本文档来自技高网...

【技术保护点】
1.一种数据更新方法,其特征在于,包括:/n获取搜索语句;/n根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句;/n在知识库中未查询到所述目标查询语句对应的查询结果时,对所述搜索语句进行聚类处理,得到至少一个聚类搜索内容;/n将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端;/n获取由所述业务端根据所述目标搜索内容编辑的目标查询结果;/n根据所述目标查询结果更新所述知识库。/n

【技术特征摘要】
1.一种数据更新方法,其特征在于,包括:
获取搜索语句;
根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句;
在知识库中未查询到所述目标查询语句对应的查询结果时,对所述搜索语句进行聚类处理,得到至少一个聚类搜索内容;
将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端;
获取由所述业务端根据所述目标搜索内容编辑的目标查询结果;
根据所述目标查询结果更新所述知识库。


2.根据权利要求1所述的方法,其特征在于,所述根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句,包括:
在所述搜索语句对应的语句类型为实体词类型时,将所述搜索语句映射为所述目标查询语句。


3.根据权利要求1所述的方法,其特征在于,所述根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句,包括:
在所述搜索语句对应的语句类型为自然语句类型时,调用预先训练的语句识别模型对所述搜索语句进行处理,确定所述搜索语句对应的目标查询语句。


4.根据权利要求3所述的方法,其特征在于,所述调用预先训练的语句识别模型对所述搜索语句进行处理,确定所述搜索语句对应的目标查询语句,包括:
将所述搜索语句输入至所述语句识别模型;
获取所述搜索语句对应的词向量;
调用双向长短时记忆模型层对所述词向量进行编码处理,得到所述词向量对应的编码向量;
调用长短时记忆模型层对所述编码向量进行解码处理,得到解码词向量;
调用分类层对所述解码实体词进行实体识别处理,确定所述搜索语句中包含的实体词及所述实体词对应的实体类型;
调用卷积神经网络层对所述搜索语句进行分类处理,确定所述搜索语句对应的所述语句类型;
根据所述实体词、所述实体类型和所述语句类型,确定所述目标查询语句。


5.根据权利要求4所述的方法,其特征在于,所述根据所述实体词、所述实体类型和和所述语句类型,确定所述目标查询语句,包括:
调用所述语句识别模型根据所述语句类型,确定所述语句类型对应的查询模板;
根据所述查询模板、所述实体词和所述实体类型,确定所述目标查询语句。


6.根据权利要求1所述的方法,其特征在于,所述将所述至少一个聚类搜索内容中符合预设条件的目标搜索内容发送至业务端,包括:
获取所述至少一个聚类搜索内容对应的热度属性值;
根据各所述热度属性值,获取所述至少一个聚类搜索内容中的热度属性值大于或者等于设定属性值的聚类搜索内容,将所述热度属性值大于或者等于设定属性值的聚类搜索内容确定为所述目标搜索内容;
将所述目标搜索内容发送至所述业务端。


7.根据权利要求1所述的方法,其特征在于,在所述根据所述搜索语句对应的语句类型,确定所述搜索语句对应的目标查询语句之后,还包括:
在根据所述目标查询语句在知识库中获取到查询结果时,获取所述查询结果对应的文本信息和图示信息;
将所述文本信息和所述图示信息发送给用户。


8.一种数据更新装置,其特征在于,包括:
搜索语句获取模块,用于获取搜索语句;
目标查询语句确定模块,用于根据所述搜索语句对应的语句...

【专利技术属性】
技术研发人员:张春会
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1