智能客服场景中的知识点召回方法及装置制造方法及图纸

技术编号:25045400 阅读:45 留言:0更新日期:2020-07-29 05:35
本说明书实施例提供一种智能客服场景中的知识点召回方法及装置,在召回方法中,获取分层可导航小世界图HNSW,该HNSW包括上下排列的多层NSW。获取待召回知识点的用户问句,并确定用户问句的句子向量。从最上层NSW开始,按照从上到下的顺序对各层NSW进行层搜索。该层搜索包括:根据当前层NSW所包含的节点的连接关系,从其所包含的节点中,搜索距离句子向量最近的第一节点,经由该第一节点进入下一层NSW,直至到达最下层NSW。在最下层NSW中,根据N个节点的连接关系,从中搜索距离句子向量最近的目标节点。将目标节点所代表的类簇中心对应的知识点类簇作为目标类簇,并从归属于目标类簇的各知识点标题对应的知识点中,召回与用户问句相匹配的知识点。

【技术实现步骤摘要】
智能客服场景中的知识点召回方法及装置
本说明书一个或多个实施例涉及计算机
,尤其涉及一种智能客服场景中的知识点召回方法及装置。
技术介绍
在智能客服场景中,通常是基于智能客服系统来回复用户问句。具体地,智能客户系统在接收到用户问句之后,先计算用户问句与知识库中各知识点标题的关联度。该知识库用于存储若干知识点,其中的每个知识点包括知识点标题和正文。这里的知识点标题通常也称为标准问句,正文通常也称为标准问句的答案。之后基于关联度,从知识库中召回与用户问句相匹配的知识点,并基于召回知识点的正文,回复用户问句。
技术实现思路
本说明书一个或多个实施例描述了一种智能客服场景中的知识点召回方法,可以提升知识点的召回效率。第一方面,提供了一种智能客服场景中的知识点召回方法,包括:获取分层可导航小世界图HNSW,所述HNSW包括上下排列的多层NSW;所述多层NSW的相邻两层NSW中,上一层NSW所包含的节点为下一层NSW所包含的节点的子集;所述多层NSW的最下层NSW包含N个节点;其中的每个节点代表一个知识点类簇的类簇本文档来自技高网...

【技术保护点】
1.一种智能客服场景中的知识点召回方法,包括:/n获取分层可导航小世界图HNSW,所述HNSW包括上下排列的多层NSW;所述多层NSW的相邻两层NSW中,上一层NSW所包含的节点为下一层NSW所包含的节点的子集;所述多层NSW的最下层NSW包含N个节点;其中的每个节点代表一个知识点类簇的类簇中心并对应于一个中心向量;所述中心向量基于归属于对应知识点类簇的各知识点标题的句子向量确定;所述多层NSW中的每层NSW中,每个节点与不超过m个邻居节点相连接;/n获取待召回知识点的用户问句,并确定所述用户问句的句子向量;/n从所述多层NSW的最上层NSW开始,按照从上到下的顺序对各层NSW进行层搜索;所述...

【技术特征摘要】
1.一种智能客服场景中的知识点召回方法,包括:
获取分层可导航小世界图HNSW,所述HNSW包括上下排列的多层NSW;所述多层NSW的相邻两层NSW中,上一层NSW所包含的节点为下一层NSW所包含的节点的子集;所述多层NSW的最下层NSW包含N个节点;其中的每个节点代表一个知识点类簇的类簇中心并对应于一个中心向量;所述中心向量基于归属于对应知识点类簇的各知识点标题的句子向量确定;所述多层NSW中的每层NSW中,每个节点与不超过m个邻居节点相连接;
获取待召回知识点的用户问句,并确定所述用户问句的句子向量;
从所述多层NSW的最上层NSW开始,按照从上到下的顺序对各层NSW进行层搜索;所述层搜索包括:根据当前层NSW所包含的节点的连接关系,从当前层NSW所包含的节点中,搜索距离所述句子向量最近的第一节点,经由该第一节点进入下一层NSW,直至到达最下层NSW;
在所述最下层NSW中,根据所述N个节点的连接关系,从所述N个节点中搜索距离所述句子向量最近的节点作为目标节点;
将所述目标节点所代表的类簇中心对应的知识点类簇作为所述用户问句所属的目标类簇;并从归属于所述目标类簇的各知识点标题对应的知识点中,召回与所述用户问句相匹配的知识点。


2.根据权利要求1所述的方法,所述根据当前层NSW所包含的节点的连接关系,从当前层NSW所包含的节点中,搜索距离所述句子向量最近的第一节点,包括:
以当前层NSW的开始节点为初始的当前节点,从当前节点和与当前节点具有连接关系的邻居节点中,确定出距离所述句子向量最近的节点作为更新的当前节点,将达到搜索结束条件时的当前节点确定为所述第一节点,所述第一节点用于作为下一层NSW的开始节点。


3.根据权利要求2所述的方法,所述当前层NSW为最上层NSW,所述开始节点为任意选择的节点。


4.根据权利要求2所述的方法,所述搜索结束条件包括:所述开始节点的n阶邻居节点全部搜索完成,其中,n>=1;或者,当前节点与所述句子向量的距离小于所述当前节点的邻居节点与所述句子向量的距离。


5.根据权利要求1所述的方法,所述HNSW通过以下步骤构建得到:
获取知识库中各知识点的知识点标题,得到多个知识点标题;
确定所述多个知识点标题中各知识点标题的句子向量;
对所述各知识点标题的句子向量进行聚类,确定N个知识点类簇;
针对所述N个知识点类簇中的每个知识点类簇,对归属于该知识点类簇的各个知识点标题的句子向量进行求平均或者求加权平均,得到该知识点类簇的类簇中心的中心向量;
将N个知识点类簇的类簇中心的中心向量作为数据集,并基于所述数据集,采用HNSW算法,构建所述HNSW。


6.根据权利要求5所述的方法,所述基于所述数据集,采用HNSW算法,构建所述HNSW,包括:
迭代地执行以下步骤,直至所述数据集中的最后一个类簇中心的中心向量选取完成:
从所述数据集中选取一个类簇中心的中心向量,通过预定公式,计算该中心向量所落入的目标层级;
对于从所述最下层NSW开始至所述目标层级的NSW的各层NSW,将该一个类簇中心作为一个节点插入所述各层NSW中,并通过朴素查找法在所述各层NSW中查找该一个节点的邻居节点,以及将该一个节点与邻居节点通过连接边连接。


7.根据权利要求5所述的方法,所述对所述各知识点标题的句子向量进行聚类,包括:
采用聚类算法,对所述各知识点标题的句子向量进行聚类;所述聚类算法包括以下任一种:kmeans算法、基于层次的聚类算法、以及基于密度的聚类算法。


8.根据权利要求1所述的方法,所述确定所述用户问句的句子向量,包括:
采用语义编码模型,确定所述用户问句的句子向量;所述语义编码模型包括以下任一种:Bert模型、卷积神经网络CNN、深度神经网络DNN以及Transformer编码器。


9.根据权利要求1所述的方法,所述从归属于所述目标类簇的各知识点标题对应的知识点中,召回与所述用户问句相匹配的知识点,包括:
计算归属于所述目标类簇的各知识点标题对应的知识点与所述用户问句的相似度;
将对应于最大相似度的知识点作为与所述用户问句相匹配的知识点。


10.一种智能客服场景中的知识点召回装置,包括:
获取单元,用于获取分层可导航小世界...

【专利技术属性】
技术研发人员:杨明晖刘佳王子豪崔恒斌
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1