The invention discloses a knowledge processing method and device, the method comprises: acquiring the target text data, including at least one field of knowledge of the target text data; the default semantic description rules based on analysis of the target text data, get the target text according to the number of two in each field of knowledge entities and between knowledge the entity relationship; the two knowledge of each entity in the field of knowledge and entity relationship are combined to generate knowledge of each knowledge in the field of three tuple; three tuple knowledge based on domain ontology construct the target text data corresponding to the. Different from the existing technology through manual sorting approach to case structured treatment makes the low efficiency of domain knowledge, knowledge of three yuan the invention uses a combination of semantic parsing scheme to obtain domain knowledge in knowledge entities and relations to form structured, then construct the domain ontology, thereby improving the efficiency of structured domain knowledge processing.
【技术实现步骤摘要】
本专利技术涉及数据挖掘
,特别涉及一种领域知识处理方法及装置。背景
知识通常是以文本形式存在,现有技术中通常采用人工整理的方式来对文本进行数据表格的制作,用以表示结构化的领域知识,使得现有技术中对领域知识进行结构化处理时具有效率较低的问题,因此,亟需一种能够对领域知识进行高效的结构化处理的方案。
技术实现思路
本专利技术的目的在于,提供一种领域知识处理方法及装置,用以解决现有技术中通过人工整理的方式对领域知识进行结构化处理时效率较低的技术问题。本专利技术提供了一种领域知识处理方法,包括:获取目标文本数据,所述目标文本数据中包括至少一条领域知识;基于预设的语义描述规则,对所述目标文本数据进行解析,得到所述目标文本数据中每条所述领域知识的两个知识实体及其之间的实体关系;将每条所述领域知识中的两个知识实体及实体关系进行组合,以生成每条所述领域知识的知识三元组;基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体。上述方法,优选的,所述基于预设的语义描述规则,对所述目标文本数据进行解析,得到所述目标文本数据中每条所述领域知识的两个知识实体及其之 ...
【技术保护点】
一种领域知识处理方法,包括:获取目标文本数据,所述目标文本数据中包括至少一条领域知识;基于预设的语义描述规则,对所述目标文本数据进行解析,得到所述目标文本数据中每条所述领域知识的两个知识实体及其之间的实体关系;将每条所述领域知识中的两个知识实体及实体关系进行组合,以生成每条所述领域知识的知识三元组;基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体。
【技术特征摘要】
1.一种领域知识处理方法,包括:获取目标文本数据,所述目标文本数据中包括至少一条领域知识;基于预设的语义描述规则,对所述目标文本数据进行解析,得到所述目标文本数据中每条所述领域知识的两个知识实体及其之间的实体关系;将每条所述领域知识中的两个知识实体及实体关系进行组合,以生成每条所述领域知识的知识三元组;基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体。2.根据权利要求1所述的方法,其特征在于,所述基于预设的语义描述规则,对所述目标文本数据进行解析,得到所述目标文本数据中每条所述领域知识的两个知识实体及其之间的实体关系,包括:确定所述目标文本数据中每条领域知识的目标谓词;对每个所述目标谓词进行分类,得到分类结果;基于每个所述目标谓词的分类结果,确定其各自对应的领域知识的知识实体及其之间的实体关系。3.根据权利要求2所述的方法,其特征在于,所述基于每个所述目标谓词的分类结果,确定其各自对应的领域知识的知识实体及其之间的实体关系,包括:依据每个所述目标谓词的分类结果,确定每个所述分类结果对应的文本识别模板,所述文本识别模板的模板类别与所述目标谓词的分类结果相对应;基于所述文本识别模板,对每个所述目标谓词所在的领域知识进行实体分析,得到每条所述领域知识的两个知识实体及其之间的实体关系。4.根据权利要求3所述的方法,其特征在于,在得到所述目标文本数据中每条所述领域知识的两个知识实体及其之间的实体关系之后,所述方法还包括:获取所述目标文本数据中未经过所述文本识别模板分析的剩余领域知识;对所述剩余领域知识进行词句解析,得到满足模板生成规则的目标领域知识;基于所述目标领域知识,生成与当前存在的所述文本识别模板属于不同模板类别的新的文本识别模板。5.根据权利要求4所述的方法,其特征在于,在基于所述目标领域知识,生成与当前存在的所述文本识别模板属于不同模板类别的新的文本识别模板之后,所述方法还包括:利用区别于所述目标文本数据的领域知识文本对所述新的文本识别模板进行准确率判断,以剔除准确率低于预设阈值的文本识别模板。6.根据权利要求1所述的方法,其特征在于,所述基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体,包括:对所有所述知识三元组进行归一化操作,得到所述目标文本数据对应的结构化的领域知识库;基于所述领域知识库中每个所述知识三元组中的实体关系,建立所述领域知识库对应的领域知识图谱;对所述领域知识图谱进行属性的逻辑判断,以构建出所述领域知识图谱对应的领域知识本体。7.根据权利要求1所述的方法,其特征在于,在基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体之前,所述方法还包括:获取每个所述知识三元组的文本语境属性值及文本语料属性值;基于所述文本语境属性值及文本语料属性值,获取每个所述知识三元组的准确率;在每个所述知识三元组的准确率均处于预设准确率值范围时,执行所述基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体,否则,删除其准确率值未处于其各自对应的准确率值范围的三元组,执行所
\t述基于所述知识三元组,构建所述目标文本数据对应的结构化的领域知识本体。8...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。