一种开放教育领域知识的结构化建模方法技术

技术编号:34490914 阅读:30 留言:0更新日期:2022-08-10 09:09
本发明专利技术公开了一种开放教育领域知识的结构化建模方法,包括如下步骤:对开放教育文本进行三元组自动抽取以获得概念实体及实体关系;通过所述概念实体和实体关系构建特征网络;利用所述特征网络进行关系分类计算,计算出所述概念实体的注意力权重和所述实体关系的概率分布;根据所述注意力权重和概率分布对所述开放教育文本进行层级分析,构建知识单元的层级与递进结构。本发明专利技术提供的建模方法融合了开放关系和层级关系定义,可以实现快速建模和半自动化抽取。和半自动化抽取。和半自动化抽取。

【技术实现步骤摘要】
一种开放教育领域知识的结构化建模方法


[0001]本专利技术属于计算机
,具体而言属于一种开放教育领域知识的结构化建模方法。

技术介绍

[0002]开放教育领域知识库,是针对特定开放教育主题构建的知识库,其主题范围包含开放教育内容的服务范围,可以分为针对教学常规的业务知识库(例如招生)和针对教学的课程知识库。专题知识库构建内容主要包括知识图谱(含认知目标)、知识标记资源库、知识标记题库、问答库(包括简单问答、多轮问答)、讲课脚本、讲题脚本。知识库(Knowledge based System)包含从结构化和非结构化数据源中提取相关的实体和关系信息。信息的表示形式为三元组格式,如(头实体,关系,尾实体)关系类型。由于领域知识库构建过程中存在诸如知识呈现领域性知识特点分布差异巨大,学科知识构建需要庞大的专业领域知识,知识的结构化计算与构建层次等问题,自动化构建面临着巨大的挑战。
[0003]半监督学习(Semi

supervisived Learning)是一种利用大量未标记数据和标记数据建立模型的学习方法,具有学本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种开放教育领域知识的结构化建模方法,其特征在于,包括如下步骤:对开放教育文本进行三元组自动抽取以获得概念实体及实体关系;通过所述概念实体和实体关系构建特征网络;利用所述特征网络进行关系分类计算,计算出所述概念实体的注意力权重和所述实体关系的概率分布;根据所述注意力权重和概率分布对所述开放教育文本进行层级分析,构建知识单元的层级与递进结构。2.根据权利要求1所述的方法,其特征在于,所述三元组自动抽取的方法包括如下步骤:对开放教育文本进行实体识别和词汇挖掘,利用词频选出候选词汇进而抽取概念实体;对原始开放关系进行模式匹配,实现对领域资源进行实体关系自动抽取,并提供开放关系自动抽取的执行接口。3.根据权利要求1所述的方法,其特征在于,所述特征网络包括共现网络、语义网络、isA关系网络和开放关系网络,构建所述特征网络方法包括如下步骤:将所述抽取出的概念实体和实体关系进行校对后,标注形成训练数据,通过机器学习形成共现网络和语义网络模型;根据所述开放教育文本,判断并构建isA关系网络,结合所述概念实体、实体关系和isA关系网络实现对文本中的概念实体和词汇之间的上下位抽取、上下位排序操作,同时,实现对isA关系网络的自动补全和自动纠错操作;针对文本的特征,将规则模式和神经网络模型集成,形成规则与深度学习融合的软匹配模式,进行概念之间的语义关系建模,并构建出开放关系网络。4.根据权利要求1所述的方法,其特征在于,所述关系分类计算的方法包括如下步骤:构建双向Transformer的预训练语言模型,采用基础和微调两种方式分别获取文本的向量表示;将两种所述文本的向量表示进行融合得融合表示信息,利用所述特征网络对所述融合表示信息进行建模;将所述融合表示信息发送到神经网络分类器中,得到融合表示信息的隐藏向量表示,并基于全词掩蔽策略进行初始化;并利用所述神经网络分类器对数据进行建模表示,利用所述建模表示通过弱监督学习进行损失计算,更新模型参数;通过注意力机制对所述融合表示信息进行交互,获得所述融合表示信息对应的概念实体的注意力权重,所述注意力机制表示为:其中的W
h
表示注意力权重参数,h
i
表示融合后的隐藏状态的向量表示,h
j
表示序列数据建模后前序第j数据隐藏状态的向量表示;对所述隐藏向量表示对应的文本和概念实体进行编码,建立实体关系的编码功能后,
通过计算得到头部实体和尾部实体的向量表示,所述向量表示的计算过程包括:通过计算得到头部实体和尾部实体的向量表示,所述向量表示的计算过程包括:其中h
head
表示关系三元组中头实体的向量表示,h
tail
表示关系三元组中尾实体的向量表示,h
i
表示融合后当前的隐藏状态的向量表示,向量a到b是头实体的隐藏状态向量,向量m到n是尾实体的隐藏状态向量,W1∈R
d*d
、W2∈R
d*d
、b1∈R
d*d
和b2∈R
d*d
为...

【专利技术属性】
技术研发人员:肖君白庆春王腊梅盛海龙
申请(专利权)人:上海开放大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1