一种实现自主学习的知识库构建方法技术

技术编号：22308179 阅读：28 留言：0更新日期：2019-10-16 08:17

本发明专利技术公开了一种实现自主学习的知识库构建方法，通过获取多个知识点，将多个知识点输入至知识点识别模型，生成候选知识点集合，再将候选新知识点集合输入至新知识点判定模型，生成新知识点集合，然后对新知识点集合进行过滤处理，生成所有知识点均为新知识点的第一集合，并根据第一集合和新知识点集合，得到学习新知识点的第一准确率，当第一准确率达到预设的阈值时，将知识点识别模型结合新知识点判定模型，得到自主学习知识库，采用本发明专利技术提供的实施例，能够实现知识库自动区分相似知识点，以及从未知数据中发现新知识，并不断减少人工的指导，大大提高了工作效率。

A method of knowledge base construction for autonomous learning

全部详细技术资料下载

【技术实现步骤摘要】
一种实现自主学习的知识库构建方法
本专利技术涉及人工智能
，尤其涉及一种实现自主学习的知识库构建方法。
技术介绍
对话知识库是对话系统中一个很重要的知识存储库，里面包含了大量人工构想以及实际积累的知识点(用户关心的问题以及对应的回答)。通过各种聚类或分类算法，以及人工查阅的方法可以从大量的对话数据中数据进行归类，每一类对应一种用户关心的问题。然而，在现有的算法中，无法区分相似但不同的知识点，无法发现低频但重要的新知识点，还需要大量人工指导，人力成本过高，无法自行学习。
技术实现思路
本专利技术实施例的目的是提供一种实现自主学习的知识库构建方法，能够区分相似知识点，自动从未知数据中发现新知识，并不断减少人工的指导，大大提高了工作效率。为实现上述目的，本专利技术实施例提供了一种实现自主学习的知识库构建方法，包括以下步骤：获取多个知识点，将所述多个知识点输入至预先建立的知识点识别模型，生成候选知识点集合；其中，知识点包括该知识对应的问题和该知识点问题对应的答案；将所述候选新知识点集合输入至预先建立的新知识点判定模型，生成新知识点集合；对所述新知识点集合进行过滤处理，生成所有知识点均为新知识点的第一集合；根据所述第一集合和所述新知识点集合，得到学习新知识点的第一准确率，并判断所述第一准确率是否达到预设的阈值；若是，则将所述知识点识别模型，结合所述新知识点判定模型，得到自主学习知识库；若否，则对所述知识点识别模型和所述新知识点判定模型进行优化处理，以使学习新知识点的准确率达到所述预设的阈值。进一步的，所述预先建立的知识点识别模型通过以下方法构建：以BERT文本二分...

【技术保护点】
1.一种实现自主学习的知识库构建方法，其特征在于，包括以下步骤：获取多个知识点，将所述多个知识点输入至预先建立的知识点识别模型，生成候选知识点集合；其中，知识点包括该知识对应的问题和该知识点问题对应的答案；将所述候选新知识点集合输入至预先建立的新知识点判定模型，生成新知识点集合；对所述新知识点集合进行过滤处理，生成所有知识点均为新知识点的第一集合；根据所述第一集合和所述新知识点集合，得到学习新知识点的第一准确率，并判断所述第一准确率是否达到预设的阈值；若是，则将所述知识点识别模型，结合所述新知识点判定模型，得到自主学习知识库；若否，则对所述知识点识别模型和所述新知识点判定模型进行优化处理，以使学习新知识点的准确率达到所述预设的阈值。

【技术特征摘要】
1.一种实现自主学习的知识库构建方法，其特征在于，包括以下步骤：获取多个知识点，将所述多个知识点输入至预先建立的知识点识别模型，生成候选知识点集合；其中，知识点包括该知识对应的问题和该知识点问题对应的答案；将所述候选新知识点集合输入至预先建立的新知识点判定模型，生成新知识点集合；对所述新知识点集合进行过滤处理，生成所有知识点均为新知识点的第一集合；根据所述第一集合和所述新知识点集合，得到学习新知识点的第一准确率，并判断所述第一准确率是否达到预设的阈值；若是，则将所述知识点识别模型，结合所述新知识点判定模型，得到自主学习知识库；若否，则对所述知识点识别模型和所述新知识点判定模型进行优化处理，以使学习新知识点的准确率达到所述预设的阈值。2.如权利要求1所述的实现自主学习的知识库构建方法，其特征在于，所述预先建立的知识点识别模型通过以下方法构建：以BERT文本二分类模型作为第一基础模型，获取多个常见知识点集合；对所述多个常见知识点集合中的每个知识点问题进行正负分类，得到属于需要的知识点的正知识点集合，和属于不需要的知识点的负知识点集合；以所述多个常见知识点集合作为所述第一基础模型的输入，以所述正知识点集合作为所述第一基础模型的输出，并当所述第一基础模型的识别准确率达到第一阈值时，将所述第一基础模型作为知识点识别模型。3.如权利要求2所述的实现自主学习的知识库构建方法，其特征在于，所述预先建立的新知识点判定模型通...

【专利技术属性】
技术研发人员：陈开冉，黎展，周捷光，
申请(专利权)人：广州探迹科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人