【技术实现步骤摘要】
问答库构建方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,尤其涉及一种问答库构建方法、装置、电子设备及存储介质。
技术介绍
目前,可以构建问答库来支持智能客服系统,但是实践中发现,为了提高智能客服系统的性能,需要搜集大量的问答语句来构建问答库,并可能需要经常更新问答库,随着用户量的增加,线上数据量逐渐增大,问题的种类五花八门,问题的形式变化不一等,问答库的构建效率会变慢。因此,如何提高问答库的构建速度是一个亟需解决的问题。
技术实现思路
鉴于以上内容,有必要提供一种问答库构建方法、装置、电子设备及存储介质,能够提高问答库的构建速度。本专利技术的第一方面提供一种问答库构建方法,所述问答库构建方法包括:获取客服对话语句;根据预设关键词,对所述客服对话语句进行语句提取,获得提问语句;对所述提问语句进行向量转换,获得语句向量;根据预设质点向量以及所述语句向量,对所述提问语句进行增量聚类,以确定所述提问语句对应的类别;根据所述提问语句以及所述提 ...
【技术保护点】
1.一种问答库构建方法,其特征在于,所述问答库构建方法包括:/n获取客服对话语句;/n根据预设关键词,对所述客服对话语句进行语句提取,获得提问语句;/n对所述提问语句进行向量转换,获得语句向量;/n根据预设质点向量以及所述语句向量,对所述提问语句进行增量聚类,以确定所述提问语句对应的类别;/n根据所述提问语句以及所述提问语句对应的类别,构建客服问答库。/n
【技术特征摘要】 【专利技术属性】
1.一种问答库构建方法,其特征在于,所述问答库构建方法包括:
获取客服对话语句;
根据预设关键词,对所述客服对话语句进行语句提取,获得提问语句;
对所述提问语句进行向量转换,获得语句向量;
根据预设质点向量以及所述语句向量,对所述提问语句进行增量聚类,以确定所述提问语句对应的类别;
根据所述提问语句以及所述提问语句对应的类别,构建客服问答库。
2.根据权利要求1所述的问答库构建方法,其特征在于,所述预设质点向量中的每个质点对应一个不同的类别,所述类别用于区分不同类型的提问语句,所述根据预设质点向量以及所述语句向量,对所述提问语句进行增量聚类,以确定所述提问语句对应的类别包括:
针对每个所述语句向量,确定所述语句向量与所述预设质点向量中的每个质点的距离;
从所述预设质点向量的所有质点中,将与所述语句向量的距离最小的质点确定为目标质点;
获取所述目标质点对应的目标类别;
判断所述语句向量与所述目标质点的距离是否小于预设距离阈值;
若所述语句向量与所述目标质点的距离小于预设距离阈值,确定所述提问语句对应的类别为所述目标类别。
3.根据权利要求2所述的问答库构建方法,其特征在于,所述根据预设质点向量以及所述语句向量,对所述提问语句进行增量聚类,以确定所述提问语句对应的类别还包括:
若所述语句向量与所述目标质点的距离大于或等于预设距离阈值,创建新类别;
确定所述提问语句对应的类别为所述新类别。
4.根据权利要求2所述的问答库构建方法,其特征在于,所述确定所述提问语句对应的类别为所述目标类别之后,所述问答库构建方法还包括:
将所述语句向量添加至所述目标质点对应的簇;
重新计算所述簇的质点。
技术研发人员:李小娟,徐国强,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。