基于预训练模型与概念知识图谱的相似选择题判别方法技术

技术编号：38074068 阅读：10 留言：0更新日期：2023-07-06 08:42

基于预训练模型与概念知识图谱的相似选择题判别方法，包括以下步骤，S10、给定一组以文本形式呈现的选择题，基于学科知识图谱，提取选择题涉及学科知识图谱中的学科概念；S20、基于学科知识图谱中的学科概念及学科概念的关系，得到和问题相关的知识库子图；S30、利用分隔符连接题目的题干与选项，将待判别题目组的题目分别扁平化为题目文本序列；S40、预训练语言模型将扁平化后的题目文本序列转化并输出为语义向量表示；S50、基于S20中得到的知识库子图，通过RGCN的图卷积网络结构，构建图卷积网络；S60、结合文本语义表示与知识图语义表示，利用深度神经网络得到输入选择题间的相似性判别分数；实现自动分辨题库中的相似试题的效果。效果。效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于预训练模型与概念知识图谱的相似选择题判别方法

[0001]本专利技术属于自然语言问答与智能教育领域，涉及一种基于预训练语言模型与概念知识图谱的相似题目判别方法。该判别方法能够利用预训练语言模型与领域知识图谱，捕获试题之间的语义及逻辑关联，并结合深度神经网络的表示建模，从而使得机器可以识别相似问题组，在自动组卷，自适应测评等智能教育场景下取得应用价值。

技术介绍

[0002]随着机器学习和人工智能技术的发展，机器在众多自然语言处理任务上取得了出色表现，并且在很多场景下取得了令人瞩目的应用成果，如会场同传、智能客服等。智慧考试是人工智能的在教育领域的一项重要应用。智能系统可以自动收集、整理、命制考题，并根据学生需求，完成自动组卷，实现因人施考的自适应测评。
[0003]然而，供自动组卷使用的试题库中，存在相似的试题。有的是对同一组知识点的重复考察，有的试题内容构成了其它试题的提示或答案。一组相似试题在一份试卷中同时出现，会削弱生成的试卷难度，阻碍对考生学习成果的有效评估。为了避免相似试题在一份试卷中同时出现，传统的解决方案是人工为每道试题标注知识点，结合人工制定的互斥试题集与组卷策略来避免相似试题在一套试卷中共现。需要人工两两对比试题内容，工作量较大，容易出现遗漏。因此，如何自动判别相似问题，成为了一项重要的技术需求。
[0004]试题通常由自然语言表述，具有灵活多变的特点。预训练语言模型技术利用大规模无标注数据和自监督学习任务可以较好的建模文本的语义特征。然而，由于试题的专业性，相似问题之间的逻辑往...

【技术保护点】

【技术特征摘要】
1.基于预训练模型与概念知识图谱的相似选择题判别方法，其特征在于，包括以下步骤，S10、给定一组以文本形式呈现的选择题，基于学科知识图谱，提取选择题涉及学科知识图谱中的学科概念；S20、基于学科知识图谱中的学科概念及学科概念的关系，得到和问题相关的知识库子图；S30、利用分隔符连接题目的题干与选项，将待判别题目组的题目分别扁平化为题目文本序列；S40、预训练语言模型将扁平化后的题目文本序列转化并输出为语义向量表示；S50、基于S20中得到的知识库子图，通过RGCN的图卷积网络结构，构建图卷积网络；S60、结合文本语义表示与知识图语义表示，利用深度神经网络得到输入选择题间的相似性判别分数；文本语义表示与知识图语义表示结合之后，利用全连接网络等交互机制，再通过sigmoid激活函数得到输入选择题间的相似性判别分数值；根据分值大小来衡量题目之间的相似性。2.根据权利要求1所述的判别方法，其特征在于，基于选择题和对应的学科知识图谱，利用实体识别与实体链接方法，提取选择题中的实体提及，并由此组成实体提及集合，提取上述实体提及对应的学科知识图谱中实体并由此组成实体节点集合。3.根据权利要求1所述的判别方法，其特征在于，基于实体节点集合以及其在学科知识图谱中的一阶邻域范围内的节点汇集成节点集；以该节点集中节点间的关系为...

【专利技术属性】
技术研发人员：来雨轩，安琪，王艺丹，王立，王娇，
申请(专利权)人：国家开放大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人