一种知识库构建方法和装置制造方法及图纸

技术编号:43550929 阅读:25 留言:0更新日期:2024-12-03 12:33
本发明专利技术公开了一种知识库构建方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取预设时间段的多条对话数据,从每条对话数据中识别出与所述对话数据对应的各个关键词;对所述多条对话数据对应的各个关键词进行聚类,得到每个关键词所属的类别;对于每个类别对应的各个关键词,根据所述类别对所述各个关键词进行异常检测,并对检测出的异常关键词进行纠正,从而更新所述类别对应的各个关键词;根据每个类别及其对应的各个关键词构建知识库。该实施方式实现知识库的自行构建,并对异常关键词进行检测和纠正,提升知识库的准确性,提高信息的可访问性和可用性,进而提升检索效率和准确率。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其涉及一种知识库构建方法和装置


技术介绍

1、随着海量数据的增长,搭建知识库能够有助于个人、组织或企业更好地管理和利用知识库的信息资源,从而有效地组织、存储和检索大量的知识和信息。

2、相关技术中的知识库构建方法,对于异常数据的处理不完善,知识库中存在错误信息,且无法自动获取并更新知识库,不能实现知识库的自行创建。


技术实现思路

1、有鉴于此,本专利技术实施例提供一种知识库构建方法和装置,能够实现知识库的自行构建,并对异常关键词进行检测和纠正,提升知识库的准确性,提高信息的可访问性和可用性,进而提升检索效率和准确率。

2、为实现上述目的,根据本专利技术实施例的一个方面,提供了一种知识库构建方法,包括:

3、获取预设时间段的多条对话数据,从每条对话数据中识别出与所述对话数据对应的各个关键词;

4、对所述多条对话数据对应的各个关键词进行聚类,得到每个关键词所属的类别;

5、对于每个类别对应的各个关键词,根据所述类别的预设条件对所本文档来自技高网...

【技术保护点】

1.一种知识库构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述类别的预设条件对所述各个关键词进行异常检测,包括:

3.根据权利要求2所述的方法,其特征在于,对检测出的异常关键词进行纠正,包括:

4.根据权利要求3所述的方法,其特征在于,生成与所述关键词对应的多个候选词,包括:

5.根据权利要求1所述的方法,其特征在于,从每条对话数据中识别出与所述对话数据对应的各个关键词,包括:

6.根据权利要求1所述的方法,其特征在于,对所述多条对话数据对应的各个关键词进行聚类之前,还包括:</p>

7.根据...

【技术特征摘要】

1.一种知识库构建方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据所述类别的预设条件对所述各个关键词进行异常检测,包括:

3.根据权利要求2所述的方法,其特征在于,对检测出的异常关键词进行纠正,包括:

4.根据权利要求3所述的方法,其特征在于,生成与所述关键词对应的多个候选词,包括:

5.根据权利要求1所述的方法,其特征在于,从每条对话数据中识别出与所述对话数据对应的各个关键词,包括:

【专利技术属性】
技术研发人员:李冬雪
申请(专利权)人:北京京东拓先科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1