The invention discloses a method for establishing the knowledge base of Natural Language Processing based on the method includes: Step 1, the text data file into the preset data; step 2, find the parent theme, all statements involving the parent theme from the data sets out, as the list of the parent theme; step 3, found that the child all statements define sub theme, the theme from the parent theme list of content extraction; step 4, determine whether all sub topics were all found, if yes, the step 5; if not, return to step 3; step 5, the rest of the parent theme list as the parent theme process. The parent theme and the parent theme process as knowledge, into the knowledge base. The invention creates a knowledge base that accords with user's learning logic. By learning the extraction of learning materials and logical design of knowledge points, it can meet users' quick search and in-depth learning of knowledge points, effectively improve user's retrieval and learning efficiency, and enhance user experience.
【技术实现步骤摘要】
一种基于自然语言处理的知识库建立方法
本专利技术涉及自然语言处理
,更为具体来说,本专利技术为一种基于自然语言处理的知识库建立方法。
技术介绍
目前,虽然已经建立了一些用于用户学习的知识库或数据库,但是,常规建立知识库的方法往往是对现有内容的简单分类和简单存储,实质上相当于建立了一个电子图书馆,所以常规知识库中的内容之间往往是相互独立的。用户在进行检索和学习时,往往需要不断地尝试新的关键字才能得到足够有用的信息,甚至有时即使经过多次的检索仍然没有得到想要的结果。在用户不断尝试新关键字的过程中,呈现给用户的冗杂的、无用的内容会耗费用户大量的时间,用户往往需付出大量无用的劳动才能对需要学习的知识点有所了解,导致知识获取的效率过低、耗时耗力,难以满足用户的需求,而且上述问题导致用户体验非常差。因此,面对大量的学习材料的情况下,如何使用户尽快学习到需要的知识点、提高用户学习效率、改善用户体验,成为了本领域技术人员亟待解决的技术问题和始终研究的重点。
技术实现思路
为解决已建立的常规知识库会耗费用户大量的时间、限制用户的学习效率、影响用户体验等问题,本专利技术创新提出了一种基于自然语言处理的知识库建立方法,该方法通过对待学习材料的处理和加工的方式提取用户需要的核心内容,以该核心内容作为知识库建立的基础内容,实现在用户进行检索和查询过程中能够更快的接触到主干知识点,并可按照知识库中预先创立的知识构架进行高效学习,避免用户将宝贵的时间浪费在冗杂的无用内容上;因此,本专利技术能够显著地提高用户的检索和学习效率,提高用户满意度。为实现上述的技术目的,本专利技术公开了一种基 ...
【技术保护点】
一种基于自然语言处理的知识库建立方法,其特征在于:该方法包括如下步骤,步骤1,读取具有文本数据的文件,将文件中的文本数据放入预设的数据集中;步骤2,通过扫描整个数据集的方式发现父主题,将涉及所述父主题的所有语句从数据集中摘出,并将涉及所述父主题的所有语句作为父主题内容清单;步骤3,通过扫描所述父主题内容清单的方式发现子主题,并将定义所述子主题的所有语句从父主题内容清单中摘出;其中,所述子主题用于解释所述父主题;步骤4,判断父主题内容清单中的所有子主题是否全部被发现,如果是,则执行步骤5;如果否,则返回步骤3;步骤5,将父主题内容清单中剩下的内容作为父主题流程,将父主题和父主题流程作为知识点、纳入知识库中。
【技术特征摘要】
2017.11.06 CN 20171107594831.一种基于自然语言处理的知识库建立方法,其特征在于:该方法包括如下步骤,步骤1,读取具有文本数据的文件,将文件中的文本数据放入预设的数据集中;步骤2,通过扫描整个数据集的方式发现父主题,将涉及所述父主题的所有语句从数据集中摘出,并将涉及所述父主题的所有语句作为父主题内容清单;步骤3,通过扫描所述父主题内容清单的方式发现子主题,并将定义所述子主题的所有语句从父主题内容清单中摘出;其中,所述子主题用于解释所述父主题;步骤4,判断父主题内容清单中的所有子主题是否全部被发现,如果是,则执行步骤5;如果否,则返回步骤3;步骤5,将父主题内容清单中剩下的内容作为父主题流程,将父主题和父主题流程作为知识点、纳入知识库中。2.根据权利要求1所述的基于自然语言处理的知识库建立方法,其特征在于:步骤5中,将父主题与子主题之间的关系作为基本主题网络,将所述基本主题网络、父主题、父主题流程作为知识点纳入知识库中。3.根据权利要求2所述的基于自然语言处理的知识库建立方法,其特征在于:步骤3中,还包括产生子主题流程的步骤:将用于定义子主题的所有语句作为子主题内容清单、用于定义下级子主题的所有语句从所述子主题内容清单中摘出,将子主题内容清单中剩下的内容作...
【专利技术属性】
技术研发人员:黄浩,徐晨,
申请(专利权)人:北京中科智营科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。