【技术实现步骤摘要】
信息处理方法和装置
本申请涉及计算机
,尤其涉及一种信息处理方法和装置。
技术介绍
在互联网中,智能客服系统可以接收用户输入的提问信息,在知识点数据库中检索出与该提问信息最为接近的知识点信息,并将该最为接近的知识点信息作为问题答案发送给用户。目前知识点数据库中存储的知识点信息通常由人工手动输入,当存在多个知识点输入人员时,难以避免的出现多人输入重复的知识点的情况,导致知识点数据库内收录的知识点信息的质量较低,因此,有必要提供一种技术方案,以提高收录的知识点信息的质量。
技术实现思路
本申请实施例的目的是提供一种信息处理方法和装置,以提高收录的知识点信息的质量。为达到上述技术目的,本申请实施例是这样实现的:本申请实施例提供了一种信息处理方法,包括:获取用户输入的知识点信息,并从所述知识点信息中提取知识点标题信息;其中,所述知识点标题信息包括内容相互关联的多个子标题信息;在预设知识库中,判断是否已收录与所述知识点标题信息满足预设相似度条件的知识点,得到收录判断结果;基于所述收录判断结果,确定是否收录用户输入的所述知识点信息。本申请实施例提供了一种信息处理装置,包括:第一获取模块,用于获取用户输入的知识点信息,并从所述知识点信息中提取知识点标题信息;其中,所述知识点标题信息包括内容相互关联的多个子标题信息;第一判断模块,用于在预设知识库中,判断是否已收录与所述知识点标题信息满足预设相似度条件的知识点,得到收录判断结果;第一确定模块,用于基于所述收录判断结果,确定是否收录用户输入的所述知识点信息。本申请实施例提供了一种信息处理设备,包括:处理器;以及被安排成存储 ...
【技术保护点】
1.一种信息处理方法,包括:获取用户输入的知识点信息,并从所述知识点信息中提取知识点标题信息;其中,所述知识点标题信息包括内容相互关联的多个子标题信息;在预设知识库中,判断是否已收录与所述知识点标题信息满足预设相似度条件的知识点,得到收录判断结果;基于所述收录判断结果,确定是否收录用户输入的所述知识点信息。
【技术特征摘要】
1.一种信息处理方法,包括:获取用户输入的知识点信息,并从所述知识点信息中提取知识点标题信息;其中,所述知识点标题信息包括内容相互关联的多个子标题信息;在预设知识库中,判断是否已收录与所述知识点标题信息满足预设相似度条件的知识点,得到收录判断结果;基于所述收录判断结果,确定是否收录用户输入的所述知识点信息。2.根据权利要求1所述的方法,其中,在预设知识库中,判断是否已收录与所述知识点标题信息满足预设相似度条件的知识点,得到收录判断结果,包括:对所述知识点标题信息进行切分处理,得到多个文本块;在预设知识库中检索包含所述文本块或者包含所述文本块对应的相似文本块的目标标题信息;判断所述知识点标题信息与所述目标标题信息之间的文本相似度是否大于对应的相似度阈值;若大于,则确定已收录与所述知识点标题信息满足预设相似度条件的知识点,反之,确定未收录与所述知识点标题信息满足预设相似度条件的知识点。3.根据权利要求2所述的方法,其中,在判断所述知识点标题信息与所述目标标题信息之间的文本相似度是否大于对应的相似度阈值之前,所述方法还包括:通过训练好的第一文本相似度计算模型,计算所述知识点标题信息与所述目标标题信息之间的文本相似度;其中,所述第一文本相似度计算模型包括神经网络模型。4.根据权利要求1所述的方法,其中,确定是否收录用户输入的所述知识点信息,包括:若所述收录判断结果表示未收录与所述知识点标题信息满足预设相似度条件的知识点,则确定收录用户输入的所述知识点信息,否则,确定不收录用户输入的所述知识点信息。5.根据权利要求1所述的方法,其中,在确定是否收录用户输入的所述知识点信息之前,所述方法还包括:检查所述知识点标题信息的长度是否超过长度阈值,得到长度检查结果;检查所述知识点标题信息中是否包含特定字符,得到字符检查结果;确定是否收录用户输入的所述知识点信息,包括:若所述收录判断结果表示未收录与所述知识点标题信息满足预设相似度条件的知识点,并且,所述长度检查结果表示所述知识点标题信息的长度未超过长度阈值,并且,所述字符检查结果表示所述知识点标题信息中不包含特定字符,则确定收录用户输入的所述知识点信息,否则,确定不收录用户输入的所述知识点信息。6.根据权利要求1所述的方法,其中,在确定是否收录用户输入的所述知识点信息之前,所述方法还包括:判断任意两个所述子标题信息之间的内容关联度是否均大于关联度阈值,得到关联度判断结果;确定是否收录用户输入的所述知识点信息,包括:若所述收录判断结果表示未收录与所述知识点标题信息满足预设相似度条件的知识点,并且,所述关联度判断结果表示任意两个所述子标题信息之间的内容关联度均大于关联度阈值,则确定收录用户输入的所述知识点信息,否则,确定不收录用户输入的所述知识点信息。7.根据权利要求6所述的方法,其中,在判断任意两个所述子标题信息之间的内容关联度是否均大于关联度阈值之前,所述方法还包括:通过训练好的第二文本相似度计算模型,计算任意两个子标题信息之间的文本相似度;其中,所述第二文本相似度计算模型包括神经网络模型;将计算得到的所述文本相似度作为所述任意两个子标题信息之间的内容关联度。8.一种信息处理装置,包括:第一获取模块,用于获取用户输入的知识点信息,并从所述知识点信息中提取知识点标题信息;其中,所述知识点标题信息包括内容相互关联...
【专利技术属性】
技术研发人员:杨明晖,崔恒斌,王子豪,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。