知识库管理的入库优化方法、装置、设备及介质制造方法及图纸

技术编号:39430748 阅读:12 留言:0更新日期:2023-11-19 16:15
本申请适用于人工智能技术领域,尤其涉及一种知识库管理的入库优化方法、装置、设备及介质。该方法获取用户提交的入库问题及其对应的入库答案,对入库问题和入库答案分别进行语义提取,得到对应入库问题的问题语义和对应入库答案的答案语义,将问题语义和答案语义分别与目标知识库中存储的已知问题和已知答案的语义进行相似度计算,从而确定相似问题,将相似问题反馈给用户,获取用户对相似问题的确认结果,根据确认结果对应的写入方式,将入库问题和入库答案写入目标知识库,形成了有效地决策结果供用户在扩展知识库时使用,以提高知识库管理的规范性和效率,从而提高该知识库所支撑的具有客户管理交互需求的金融或保险等业务系统的可靠性。务系统的可靠性。务系统的可靠性。

【技术实现步骤摘要】
知识库管理的入库优化方法、装置、设备及介质


[0001]本申请适用于人工智能
,尤其涉及一种知识库管理的入库优化方法、装置、设备及介质。

技术介绍

[0002]知识库项目是对知识内容管理的项目,以支持在不同应用场景下,可以通过问答机器人来响应用户的问题,也即是问答机器人的支撑部分,对于一些商业或者金融场景下的客户管理和智能交互等业务系统的使用具有重要意义,因此,构建高效且高质量的知识内容是十分重要的。例如,当前的一些银行为方便客户转账汇款等开发的客户端业务系统,在该客户端业务系统中存在着用于与客户进行交互的问答机器人,以便于解决客户的问题。
[0003]目前,为知识库提供专业的高质量内容的来源一般为人工进行知识编写,进而传入知识库进行保存。由于进行知识编写的人员不相同,可能存在编写内容相同的情况,会造成知识库中相似的问答结果冗余,从而会降低检索的效率和准确度。现有的问答知识内容是由该知识库的管理员进行新增和编辑,编辑后扭转到下一节点的审核员对问题及答案进行专业审核检查,如果通过则会收录到知识库中,不通过则驳回结束流程,虽然能够进行质量的把控,但是依然无法解决出现问答冗余的问题。因此,如何有效地管理知识库的入库方式,以减少相似、相同问题的存在,降低知识库的冗余占用,从而提高检索的效率和准确度成为亟待解决的问题。

技术实现思路

[0004]有鉴于此,本申请实施例提供了一种知识库管理的入库优化方法、装置、设备及介质,以解决如何有效地管理知识库的入库方式,以减少相似、相同问题的存在,降低知识库的冗余占用,从而提高检索的效率和准确度的问题。
[0005]第一方面,本申请实施例提供一种知识库管理的入库优化方法,所述入库优化方法包括:
[0006]在用户发起入库操作时,获取所述用户提交的入库问题及其对应的入库答案,对所述入库问题和所述入库答案分别进行语义提取,得到对应所述入库问题的问题语义和对应所述入库答案的答案语义;
[0007]将所述问题语义与目标知识库中存储的已知问题的语义进行相似度计算,得到对应所述已知问题的第一相似度,根据所述第一相似度,从所有已知问题中筛选得到目标问题,形成第一问题组;
[0008]将所述入库答案与所述目标知识库中存储的已知答案的语义进行相似度计算,得到对应所述已知答案的第二相似度,根据所述第二相似度,从所有已知答案中筛选得到目标答案;
[0009]确定所有目标答案对应的问题,形成第二问题组,比较所述第一问题组和所述第
二问题组,确定相同的问题为相似问题,将所述相似问题反馈给所述用户;
[0010]获取所述用户对所述相似问题的确认结果,根据所述确认结果对应的写入方式,将所述入库问题和所述入库答案写入所述目标知识库。
[0011]在一实施方式中,在获取所述用户提交的入库问题及其对应的入库答案之后,还包括:
[0012]基于所述入库问题,对所述目标知识库进行检索,得到检索结果;
[0013]若所述检索结果为未检索到匹配的问题,则执行获取所述用户对所述相似问题的确认结果,根据所述确认结果对应的写入方式,将所述入库问题和所述入库答案写入所述目标知识库的步骤。
[0014]在一实施方式中,在基于所述入库问题,对所述目标知识库进行检索,得到检索结果之后,还包括:
[0015]若所述检索结果为检索到匹配的问题,则向所述用户反馈预设提示,所述预设提示用于提示所述用户禁止写入所述入库问题和入库答案。
[0016]在一实施方式中,对所述入库问题和所述入库答案分别进行语义提取,得到对应所述入库问题的问题语义和对应所述入库答案的答案语义包括:
[0017]对所述入库问题和所述入库答案分别进行分词,得到对应所述入库问题的第一分词结果和对应所述入库答案的第二分词结果;
[0018]对所述第一分词结果进行词向量编码,得到第一编码结果,确定所述第一编码结果为对应所述入库问题的问题语义;
[0019]对所述第二分词结果进行词向量编码,得到第二编码结果,确定所述第二编码结果为对应的所述入库答案的答案语义。
[0020]在一实施方式中,根据所述第一相似度,从所有已知问题中筛选得到目标问题,形成第一问题组包括:
[0021]根据所有已知问题的语义与所述问题语义的第一相似度,对所有已知问题进行排序,得到第一排序结果,其中,所述第一相似度越高,对应的已知问题在第一排序结果中排序越靠前;
[0022]从所述第一排序结果中确定靠前的N个已知问题为目标问题,N个目标问题形成第一问题组,N为大于零的整数;
[0023]所述根据所述第二相似度,从所有已知答案中筛选得到目标答案包括:
[0024]根据所有已知答案的语义与所述答案语义的第二相似度,对所有已知答案进行排序,得到第二排序结果,其中,所述第二相似度越高,对应的已知答案在第二排序结果中排序越靠前;
[0025]从所述第二排序结果中确定靠前的N个已知答案为目标答案。
[0026]在一实施方式中,在比较所述第一问题组和所述第二问题组,确定相同的问题为相似问题之后,还包括:
[0027]检测所述相似问题的个数是否为零;
[0028]若检测到所述相似问题的个数为零,则将所述入库问题和所述入库答案写入所述目标知识库;或者
[0029]若检测到所述相似问题的个数不为零,则执行将所述相似问题反馈给所述用户的
步骤。
[0030]在一实施方式中,根据所述确认结果对应的写入方式,将所述入库问题和所述入库答案写入所述目标知识库包括:
[0031]若所述确认结果为确认提交,则确定所述确认结果对应的写入方式为直接写入,将所述入库问题和所述入库答案写入所述目标知识库;或者
[0032]若所述确认结果为确认相似,则确定所述确认结果对应的写入方式为关联写入,将所述入库问题和所述入库答案与所述相似问题关联写入所述目标知识库。
[0033]第二方面,本申请实施例提供一种知识库管理的入库优化方法,所述入库优化装置包括:
[0034]语义提取模块,用于在用户发起入库操作时,获取所述用户提交的入库问题及其对应的入库答案,对所述入库问题和所述入库答案分别进行语义提取,得到对应所述入库问题的问题语义和对应所述入库答案的答案语义;
[0035]第一相似度计算模块,用于将所述问题语义与目标知识库中存储的已知问题的语义进行相似度计算,得到对应所述已知问题的第一相似度,根据所述第一相似度,从所有已知问题中筛选得到目标问题,形成第一问题组;
[0036]第二相似度计算模块,用于将所述入库答案与所述目标知识库中存储的已知答案的语义进行相似度计算,得到对应所述已知答案的第二相似度,根据所述第二相似度,从所有已知答案中筛选得到目标答案;
[0037]相似问题反馈模块,用于确定所有目标答案对应的问题,形成第二问题组,比较所述第一问题组和所述第二问题组,确定相同的问题为相似问题,将所述相似问本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识库管理的入库优化方法,其特征在于,所述入库优化方法包括:在用户发起入库操作时,获取所述用户提交的入库问题及其对应的入库答案,对所述入库问题和所述入库答案分别进行语义提取,得到对应所述入库问题的问题语义和对应所述入库答案的答案语义;将所述问题语义与目标知识库中存储的已知问题的语义进行相似度计算,得到对应所述已知问题的第一相似度,根据所述第一相似度,从所有已知问题中筛选得到目标问题,形成第一问题组;将所述入库答案与所述目标知识库中存储的已知答案的语义进行相似度计算,得到对应所述已知答案的第二相似度,根据所述第二相似度,从所有已知答案中筛选得到目标答案;确定所有目标答案对应的问题,形成第二问题组,比较所述第一问题组和所述第二问题组,确定相同的问题为相似问题,将所述相似问题反馈给所述用户;获取所述用户对所述相似问题的确认结果,根据所述确认结果对应的写入方式,将所述入库问题和所述入库答案写入所述目标知识库。2.根据权利要求1所述的入库优化方法,其特征在于,在获取所述用户提交的入库问题及其对应的入库答案之后,还包括:基于所述入库问题,对所述目标知识库进行检索,得到检索结果;若所述检索结果为未检索到匹配的问题,则执行获取所述用户对所述相似问题的确认结果,根据所述确认结果对应的写入方式,将所述入库问题和所述入库答案写入所述目标知识库的步骤。3.根据权利要求2所述的入库优化方法,其特征在于,在基于所述入库问题,对所述目标知识库进行检索,得到检索结果之后,还包括:若所述检索结果为检索到匹配的问题,则向所述用户反馈预设提示,所述预设提示用于提示所述用户禁止写入所述入库问题和入库答案。4.根据权利要求1所述的入库优化方法,其特征在于,对所述入库问题和所述入库答案分别进行语义提取,得到对应所述入库问题的问题语义和对应所述入库答案的答案语义包括:对所述入库问题和所述入库答案分别进行分词,得到对应所述入库问题的第一分词结果和对应所述入库答案的第二分词结果;对所述第一分词结果进行词向量编码,得到第一编码结果,确定所述第一编码结果为对应所述入库问题的问题语义;对所述第二分词结果进行词向量编码,得到第二编码结果,确定所述第二编码结果为对应的所述入库答案的答案语义。5.根据权利要求1所述的入库优化方法,其特征在于,根据所述第一相似度,从所有已知问题中筛选得到目标问题,形成第一问题组包括:根据所有已知问题的语义与所述问题语义的第一相似度,对所有已知问题进行排序,得到第一排序结果,其中,所述第一相似度越高,对应的已知问题在第一排序结果中排序越靠前;从所述第一排序结果中确定靠前的N个已知问题为目标问题,N个目标问题形成第一问
题组,N为大于零的整数;所述根据所述第...

【专利技术属性】
技术研发人员:蔡文洁
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1