一种通过知识融合生成学习图谱的方法及系统技术方案

技术编号:26376481 阅读:38 留言:0更新日期:2020-11-19 23:45
本发明专利技术属于自然语言处理技术领域,提供了一种通过知识融合生成学习图谱的方法及系统,其方法包括:获取不同来源的实体内容;根据预设的标准维度将所述实体内容转换为标准实体内容;获取用户的学习轨迹;根据所述学习轨迹分析所述标准实体内容之间的实体关系;根据所述标准实体内容和所述实体关系生成知识图谱。本发明专利技术将不同来源的实体内容进行统一标准维度的转换,避免不同维度标准导致生成的知识图谱有误。

【技术实现步骤摘要】
一种通过知识融合生成学习图谱的方法及系统
本专利技术涉及自然语言处理
,尤指一种通过知识融合生成学习图谱的方法及系统。
技术介绍
目前生成知识图谱要么从单一平台获取语料,导致生成的知识图谱中各个节点的实体内容数据来源单一,实体内容较少。要么从各个不同的平台获取语料,然后生成对应的知识图谱。但是不同平台对于实体内容都有各自不同的描述方法,从而导致实质相同的实体内容可能由于描述不同无法进行归纳。例如番薯为学名,别称有甘薯、地瓜、甜薯、红薯、红苕、白薯等。实体内容来源多样,维度不同,在生成知识图谱过程中容易造成错误。因此,需要一种通过知识融合生成学习图谱的方法及系统。
技术实现思路
本专利技术的目的是提供一种通过知识融合生成学习图谱的方法及系统,实现将不同来源的实体内容进行统一标准维度的转换,避免不同维度标准导致生成的知识图谱有误。本专利技术提供的技术方案如下:本专利技术提供一种通过知识融合生成学习图谱的方法,包括:获取不同来源的实体内容;根据预设的标准维度将所述实体内容转换为标准实体内容;获取用户的学习轨迹;根据所述学习轨迹分析所述标准实体内容之间的实体关系;根据所述标准实体内容和所述实体关系生成知识图谱。进一步的,获取不同来源的实体内容之前包括:获取语料样本;分析所述语料样本中实质相同但描述方式不同的样本内容;选取其中任意一个样本内容作为对应的标准维度;根据所述标准维度建立标准库,所述样本内容为对应的标准维度的维度实体内容。进一步的,选取其中任意一个样本内容作为对应的标准维度具体包括:获取每一个样本内容的描述规则来源;根据所述描述规则来源选取其中一个样本内容作为对应的所述标准维度;或,统计每一个样本内容在所述语料样本中出现的样本内容频率;按照由大到小的顺序对所述样本内容频率进行排序,选择样本内容频率最高的样本内容作为对应的所述标准维度。进一步的,根据预设的标准维度将所述实体内容转换为标准实体内容具体包括:将所述实体内容和所述标准库中的维度实体内容进行比对;若比对相符,则确定对应的所述标准实体内容。进一步的,根据所述标准实体内容和所述实体关系生成知识图谱具体包括:当获取的是某一个用户的学习轨迹时,根据所述标准实体内容和所述实体关系生成对应用户的学习记录图谱;当获取的是所有的用户的学习轨迹时,根据所述标准实体内容和所述实体关系生成学习知识图谱。本专利技术还提供一种通过知识融合生成学习图谱的系统,包括:实体获取模块,获取不同来源的实体内容;转换模块,根据预设的标准维度将所述实体获取模块获取的所述实体内容转换为标准实体内容;轨迹获取模块,获取用户的学习轨迹;关系分析模块,根据所述轨迹获取模块获取的所述学习轨迹分析所述标准实体内容之间的实体关系;生成模块,根据所述转换模块得到的所述标准实体内容和所述关系分析模块获取的所述实体关系生成知识图谱。进一步的,还包括:样本获取模块,获取语料样本;样本分析模块,分析所述样本获取模块获取的所述语料样本中实质相同但描述方式不同的样本内容;标准选取模块,选取其中所述样本分析模块得到的任意一个样本内容作为对应的标准维度;标准库建立模块,根据所述标准选取模块选取的所述标准维度建立标准库,所述样本内容为对应的标准维度的维度实体内容。进一步的,所述标准选取模块具体包括:规则获取单元,获取所述样本分析模块得到的每一个样本内容的描述规则来源;标准选取单元,根据所述规则获取单元获取的所述描述规则来源选取其中一个样本内容作为对应的所述标准维度;或,频率统计单元,统计所述样本分析模块得到的每一个样本内容在所述语料样本中出现的样本内容频率;所述标准选取单元,按照由大到小的顺序对所述频率统计单元统计的所述样本内容频率进行排序,选择样本内容频率最高的样本内容作为对应的所述标准维度。进一步的,所述转换模块具体包括:比对单元,将所述实体获取模块获取的所述实体内容和所述标准库建立模块建立的所述标准库中的维度实体内容进行比对;转换单元,若所述比对单元比对相符,则确定对应的所述标准实体内容。进一步的,所述生成模块具体包括:所述生成模块,当所述轨迹获取模块获取的获取的是某一个用户的学习轨迹时,根据所述转换模块得到的所述标准实体内容和所述关系分析模块获取的所述实体关系生成对应用户的学习记录图谱;所述生成模块,当所述轨迹获取模块获取的获取的是所有的用户的学习轨迹时,根据所述转换模块得到的所述标准实体内容和所述关系分析模块获取的所述实体关系生成学习知识图谱。通过本专利技术提供的一种通过知识融合生成学习图谱的方法及系统,能够带来以下至少一种有益效果:1、本专利技术中,将不同来源的实体内容进行标化,按照各自的标准维度得到统一的标准实体内容,然后结合用户的学习轨迹生成知识图谱,避免实体内容的维度不一致导致知识图谱出错。2、本专利技术中,通过分析语料样本,统计其中实质相同但描述方式不同的样本内容,从而从中选取每一类样本内容的标准维度,便于后续的实体内容按照预设的规则进行转化。附图说明下面将以明确易懂的方式,结合附图说明优选实施方式,对一种通过知识融合生成学习图谱的方法及系统的上述特性、技术特征、优点及其实现方式予以进一步说明。图1是本专利技术一种通过知识融合生成学习图谱的方法的一个实施例的流程图;图2是本专利技术一种通过知识融合生成学习图谱的方法的另一个实施例的流程图;图3是本专利技术一种通过知识融合生成学习图谱的方法的另一个实施例的流程图;图4是本专利技术一种通过知识融合生成学习图谱的方法的另一个实施例的流程图;图5是本专利技术一种通过知识融合生成学习图谱的系统的一个实施例的结构示意图;图6是本专利技术一种通过知识融合生成学习图谱的系统的另一个实施例的结构示意图。附图标号说明:100通过知识融合生成学习图谱的系统110实体获取模块120转换模块121比对单元122转换单元130轨迹获取模块140关系分析模块150生成模块160样本获取模块170样本分析模块180标准选取模块181规则获取单元182标准选取单元183频率统计单元190标准库建立模块具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在本文档来自技高网...

【技术保护点】
1.一种通过知识融合生成学习图谱的方法,其特征在于,包括:/n获取不同来源的实体内容;/n根据预设的标准维度将所述实体内容转换为标准实体内容;/n获取用户的学习轨迹;/n根据所述学习轨迹分析所述标准实体内容之间的实体关系;/n根据所述标准实体内容和所述实体关系生成知识图谱。/n

【技术特征摘要】
1.一种通过知识融合生成学习图谱的方法,其特征在于,包括:
获取不同来源的实体内容;
根据预设的标准维度将所述实体内容转换为标准实体内容;
获取用户的学习轨迹;
根据所述学习轨迹分析所述标准实体内容之间的实体关系;
根据所述标准实体内容和所述实体关系生成知识图谱。


2.根据权利要求1所述的通过知识融合生成学习图谱的方法,其特征在于,获取不同来源的实体内容之前包括:
获取语料样本;
分析所述语料样本中实质相同但描述方式不同的样本内容;
选取其中任意一个样本内容作为对应的标准维度;
根据所述标准维度建立标准库,所述样本内容为对应的标准维度的维度实体内容。


3.根据权利要求2所述的通过知识融合生成学习图谱的方法,其特征在于,选取其中任意一个样本内容作为对应的标准维度具体包括:
获取每一个样本内容的描述规则来源;
根据所述描述规则来源选取其中一个样本内容作为对应的所述标准维度;或,
统计每一个样本内容在所述语料样本中出现的样本内容频率;
按照由大到小的顺序对所述样本内容频率进行排序,选择样本内容频率最高的样本内容作为对应的所述标准维度。


4.根据权利要求2所述的通过知识融合生成学习图谱的方法,其特征在于,根据预设的标准维度将所述实体内容转换为标准实体内容具体包括:
将所述实体内容和所述标准库中的维度实体内容进行比对;
若比对相符,则确定对应的所述标准实体内容。


5.根据权利要求1-4任一项所述的通过知识融合生成学习图谱的方法,其特征在于,根据所述标准实体内容和所述实体关系生成知识图谱具体包括:
当获取的是某一个用户的学习轨迹时,根据所述标准实体内容和所述实体关系生成对应用户的学习记录图谱;
当获取的是所有的用户的学习轨迹时,根据所述标准实体内容和所述实体关系生成学习知识图谱。


6.一种通过知识融合生成学习图谱的系统,其特征在于,包括:
实体获取模块,获取不同来源的实体内容;
转换模块,根据预设的标准维度将所述实体获取模块获取的所述实体内容转换为标准实体内容;
轨迹获取模块,获取用户的学习轨迹;
关系分...

【专利技术属性】
技术研发人员:魏誉荧
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1