【技术实现步骤摘要】
一种面向汉语国际教育的智能导学方法
本专利技术涉及汉语国际教育
,具体为一种面向汉语国际教育的智能导学方法。
技术介绍
智能导学系统是一种基于人工智能和计算机技术的教学辅助系统,力图模仿自然人的教学方法,与学习者进行及时、按需的交互。智能导学系统是目前人工智能领域和信息化教学领域的研究热点。本专利技术旨在研究如何构建汉语国际教育领域知识图谱、采用深度文本推理技术提高自动问答的语义推理能力,提升智能导学系统的整体性能,对智能导学研究具有非常重要的理论意义。同时,随着中国国力的日益强大,汉语也越来越受到世界各国人民的青睐,如何帮助母语非汉语者进行自主学习,培养其具有熟练的汉语作为第二语言技能,实现良好的文化传播,加快汉语国际化进程具有重要的现实意义。
技术实现思路
本专利技术的目的在于提供一种面向汉语国际教育的智能导学方法,该面向汉语国际教育的智能导学方法具体步骤如下:S1:领域知识图谱构建,具体如下:1)构建过程:通过以下三个步骤构建领域知识图谱:第一步,利用网络爬虫采集教学资源和网络百科知识语料;第二步,从教学大纲、教案、教材、试题库抽取知识点和知识点关系,构建 ...
【技术保护点】
1.一种面向汉语国际教育的智能导学方法,其特征在于:该面向汉语国际教育的智能导学方法具体步骤如下:S1:领域知识图谱构建,具体如下:1)构建过程:通过以下三个步骤构建领域知识图谱:第一步,利用网络爬虫采集教学资源和网络百科知识语料;第二步,从教学大纲、教案、教材、试题库抽取知识点和知识点关系,构建整个知识图谱的核心;第三步,通过网络百科语料扩展学科知识图谱;2)语料收集:教学资源可分为两类,第一类是具有较强结构化特征的教学大纲,第二类是与教学大纲高度相关的其他教学资源,包括教案、教材、试题库等,这类教学资源详细描述了知识点以及知识点之间的关联信息,教学资源一般由领域专家手工 ...
【技术特征摘要】
1.一种面向汉语国际教育的智能导学方法,其特征在于:该面向汉语国际教育的智能导学方法具体步骤如下:S1:领域知识图谱构建,具体如下:1)构建过程:通过以下三个步骤构建领域知识图谱:第一步,利用网络爬虫采集教学资源和网络百科知识语料;第二步,从教学大纲、教案、教材、试题库抽取知识点和知识点关系,构建整个知识图谱的核心;第三步,通过网络百科语料扩展学科知识图谱;2)语料收集:教学资源可分为两类,第一类是具有较强结构化特征的教学大纲,第二类是与教学大纲高度相关的其他教学资源,包括教案、教材、试题库等,这类教学资源详细描述了知识点以及知识点之间的关联信息,教学资源一般由领域专家手工创建,具有专业性强、准确率高等特点,通过收集汉语国际教育教学资源,以抽取知识点之间的关联信息,从而构建整个领域知识图谱的核心,除教学资源外,还将从开放的网络百科知识库中抽取领域知识百科知识语料属于互联网上开放的知识文本数据,具有规模庞大、不断更新扩展的特点,中文的百科知识语料主要来源有中文维基百科、百度百科、搜狗百科等,这类知识百科文本一般具有较高的质量和半结构化的特点,是知识图谱扩充的重要来源,同时采用迭代方式扩充知识图谱,即首先利用知识图谱核心中的实体及实体关系,在百科知识库中进行搜索,抽取搜索结果中的实体及实体关系,然后再利用扩充的实体及实体关系进行再次搜索,从而不断扩充整个知识图谱;3)基于自举的实体及实体关系联合识别:实体和实体关系的抽取是知识图谱构建的核心内容,决定着知识图谱的质量,传统的实体和实体关系抽取通常需要标注大量的训练数据,或者人工提供种子实体、种子关系等;S2:文本推理模型,在深度文本推理模型中,输入为一个语段T及一个假设H,在关系向量计算阶段,首先利用实体及实体关系联合识别模型对T和H中的实体进行识别,并将其表示为词向量,然后,利用卷积神经网络进行关系向量计算以获取关系向量,在知识推理阶段,模型利用知识图谱计算词向量和关系向量的语义向量并进行拼接,以获取实体及其关系的整体语义向量表示,随后,词向量、关系向量及整体语义向量表示被输入基于注意力机制的LSTM模型中,以学习(T,H)对的总体向量表示,最后,(T,H)对的总体语义表示被输入一个逻辑斯蒂回归分类器中,判断(T,H)对的蕴涵关系(蕴涵或非蕴涵),具体如下:1)关系向量计算:关系向量计算的任务是利用神经网络模型计算实体关系的低维度向量表示,其目的在于更好地表示句子中的语义信息,首先需要对文本中的实体及实体关系进行识别,然后,对实体关系进行向量化表示,对于实体及实体关系识别,可采用前面提到的联合识别模型进行处理。例如,语段T,需要识别出实体“莫言”、“斯德哥尔摩”,以及对应的实体关系“前往”,用三元组表示为(莫言,前往,斯德哥尔摩),对于关系的向量表示,Zhang等人提出了一种基于深度神经网络的关系表示模型,在该模型中,文本的每个关系被表示为词特征和位置特征,其中词特征由句子中全部词的词向量组合而成,位置特征由关系词与存在该关系的两个词的相对位置组成,例如,对于(莫言,前往,斯德哥尔摩),“前往”对于“莫言”和“斯德哥尔摩”的相对位置为-5和3,为表示位置信息,相对位置的数值被映射至一个随机初始化的矩阵d,最终,“前往”的位置特征可表示为[d(-5),d(3)],然后,经过卷积操作和最大池化过程,并使用激活函数进行计算,最终得到关系的向量表示;2)知识推理:知识推理的任务是,利用知识图谱获取实体及实体关系的语义向量表示,其目的在于挖掘语段与假设中的复杂语义关系并表示为向量,从而将推理问题转化为表示学习问题,在文本推理的任务中,假设H往往无法从语段T中直接得出,其原因在于T中包含了复杂的语义关系,需要进行一系列的推理,例如,假设H所包含的事实(通过实体关系三元组表示):(瑞典皇家科学院,位于,斯德哥尔摩)需要从语段T中所包含的事实经过推理得出:(莫言,前往,斯德哥尔摩)(莫言,领取,诺贝尔文学奖)(瑞典皇家科学院,颁发,诺贝尔文学奖)知识图谱中包含大量的实体关系,可形成丰富的推理规则,为文本推理提供支持,然而,直接利用实体关系生成的推理规则可能导致歧义问题,产生推理错误,为此,本项目将知识图谱中的实体及实体关系表示为语义向量,其理由很明显:基于全局的语义表示能够在一定程度上避免歧义,采用PTransE模型对知识图谱中的实体及实体关系进行表示,该模型提出一种考虑关系路径的表示学习方法,类似于r1+r2=r3,这与推理规则的形式非常相似,换言之,基于PTransE的知识表示实际上就是对推理规则的表示,并且由于关系表示的结果(即Embedding)可直接进行计算,等价于进行多步推理,能够有效避免因推理步骤复杂导致的歧义和错误,经过上述步骤,知识图谱中的实体及实体关系被表示为向量,接下来,我们只需找出语段T及假设H在知识图谱中对应的实体及实体关系,即可获得T和H中实体及实体关系的语义表示,采用启发式规则进行搜索,对于T和H中的实体,可以直接在知识图谱的实体集中搜索匹配的字符串,若找到,则将知识图谱中实体的语义向量直接赋值给该实体;若未找到,则将该实体的向量置为0,对于T和H中的关系,仍可以采用上述办法进行,然而,由于复杂的关系往往包含多个词,采用...
【专利技术属性】
技术研发人员:任亚峰,任函,姬东鸿,吕晨,
申请(专利权)人:广东外语外贸大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。