The present invention discloses a knowledge learning method and system based on the two element relationship. By analyzing the phrases and / or sentences in the database, the material database and / or sentences through the Natural Language Processing method, the word tree is obtained; the tagging information of the word node in the word tree of the training data and the tagging information of the two element word relation are obtained. The word tree and the corresponding annotation information are stored as template library, and a template library is built based on a small amount of training data based on the two element relationship. Learning skills are obtained from the template library by machine learning, and the learning skills are applied to the material data of the learning. The template is added to the template library, and the template library can be expanded at any time, so it does not need to repeat the same or similar learning materials in large numbers, greatly alleviating the manual workload and improving the reusability. The invention is a knowledge learning method and system based on two element relationship and can be widely applied to the field of artificial intelligence.
【技术实现步骤摘要】
一种基于二元关系的知识学习方法和系统
本专利技术涉及人工智能领域,尤其是一种基于二元关系的知识学习方法和系统。
技术介绍
人工智能的一个领域是让机器直接学习人学习的材料,即用自然语言表达的材料,并用学到的知识指导其进行工作。学习的其中一种做法是对大量的材料进行标注,让机器从标注中学习这些材料的格式,从而机器可以从相同或者相似格式的其他材料中学到知识。上述做法的局限性在于,需要对大量的材料进行标注,所以一般只能针对特定领域,例如在某论文中,为了实现机器医疗辅助诊断,需要对几千乃至上万份病例进行标注,这样机器才能看懂相似格式的病例,从中学到知识,而如果换了另一种类型的材料,例如B超结果,或者换了一种全新格式,如另外一家医院的病例,又需要重新进行大量材料的标注,工作重复性高、效率低。
技术实现思路
为了解决上述技术问题,本专利技术的目的是:提供一种基于二元关系实现减少人工成本、提高复用性的知识学习方法。为了解决上述技术问题,本专利技术的另一目的是:提供一种基于二元关系实现减少人工成本、提高复用性的知识学习系统。本专利技术所采用的技术方案是:一种基于二元关系的知识学习方法,包括有以下步骤:A、将训练数据库中的短语和/或句子通过自然语言处理方法解析,得到训练数据的词树;B、获取训练数据的词树中词节点的标注信息,并根据词节点的标注信息对词树进行标注形成一元模板;C、获取训练数据的词树中二元词关系的标注信息,根据二元词关系的标注信息对一元模板进行标注形成模板并存储到模板库;D、将材料数据库中的短语和/或句子通过自然语言处理方法解析,得到材料数据的词树;E、采用机器学习处理模 ...
【技术保护点】
1.一种基于二元关系的知识学习方法,其特征在于,包括有以下步骤:A、将训练数据库中的短语和/或句子通过自然语言处理方法解析,得到训练数据的词树;B、获取训练数据的词树中词节点的标注信息,并根据词节点的标注信息对词树进行标注形成一元模板;C、获取训练数据的词树中二元词关系的标注信息,根据二元词关系的标注信息对一元模板进行标注形成模板并存储到模板库;D、将材料数据库中的短语和/或句子通过自然语言处理方法解析,得到材料数据的词树;E、采用机器学习处理模板库中的模板,得到基于模板的学习方法;F、对材料数据的词树逐个应用基于模板的学习方法,若应用成功,则将学习到的知识进行存储;若应用失败,则重新执行步骤B、C和E。
【技术特征摘要】
1.一种基于二元关系的知识学习方法,其特征在于,包括有以下步骤:A、将训练数据库中的短语和/或句子通过自然语言处理方法解析,得到训练数据的词树;B、获取训练数据的词树中词节点的标注信息,并根据词节点的标注信息对词树进行标注形成一元模板;C、获取训练数据的词树中二元词关系的标注信息,根据二元词关系的标注信息对一元模板进行标注形成模板并存储到模板库;D、将材料数据库中的短语和/或句子通过自然语言处理方法解析,得到材料数据的词树;E、采用机器学习处理模板库中的模板,得到基于模板的学习方法;F、对材料数据的词树逐个应用基于模板的学习方法,若应用成功,则将学习到的知识进行存储;若应用失败,则重新执行步骤B、C和E。2.根据权利要求1所述的一种基于二元关系的知识学习方法,其特征在于:所述自然语言处理方法包括有依存句法分析和/或语义依存分析。3.根据权利要求1所述的一种基于二元关系的知识学习方法,其特征在于:所述步骤E中采用机器学习处理的具体步骤为:将模板库中的模板输入人工神经网络进行训练,所述基于模板的学习方法以人工神经网络的形式存储。4.根据权利要求1所述的一种基于二元关系的知识学习方法,其特征在于:所述词节点的标注信息和二元词关系的标注信息包括有词树转化为知识的规则。5.根据权利要求4所述的一种基于二元关系的知识学习方法,其特征在于:所述词树转化为知识的规则包括有知识体系的定义。6.一种基于二元关系的知识学习系统,其特征在于:包括...
【专利技术属性】
技术研发人员:黄劲,林载辉,
申请(专利权)人:盈盛资讯科技有限公司,
类型:发明
国别省市:中国香港,81
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。