基于文本分析及关联规则挖掘的概念图自动生成方法技术

技术编号：20272742 阅读：31 留言：0更新日期：2019-02-02 03:44

本实施例公开了一种基于文本分析及关联规则挖掘的概念图自动生成方法，基于文本分析技术中的文本分类方法，将试题分类到对应的概念中，采用有监督的数据挖掘算法处理无结构化的试题文本；将文本分析技术中的文本分类方法同关联规则挖掘相结合，得到生成的概念图。本发明专利技术能够代替专家手工分类的过程，并结合当前概念图生成算法中的关联规则挖掘方法，实现概念图的自动生成。

全部详细技术资料下载

【技术实现步骤摘要】
基于文本分析及关联规则挖掘的概念图自动生成方法
本实施例涉及一种基于文本分析及关联规则挖掘的概念图自动生成方法。
技术介绍
随着教育信息化和教育现代化的不断推进，教育数据挖掘已成为国内外研究者关注的重点。为促进教育技术的发展，多种有关教育数据挖掘的技术被不断提出。作为教育数据挖掘中有效的知识可视化工具，概念图已成为当前研究的热点。概念图由美国康奈尔大学的Novak博士于1984年首次提出，它通过直观且接近自然语言的图形化方式表述概念间的关联。近年来概念图的表现形式仍以Novak的网络型概念结构图为标准，使用节点表示概念，使用有向边表示概念间的关联方向，并在边上使用介词标签表示概念间的归属关系。有关概念图，国内外学者进行了大量研究，并广泛应用到不同学科领域中，如教学诊断、知识组建、临床护理等，取得了一定成果。但早期概念图的生成主要依赖于专家经验，不仅耗费时间长，且难以保证其正确性。近年来，依赖教育数据挖掘技术的概念图自动生成方法不断被提出。Jiang等人提出了一种可以理解手绘概念图结构的方法和一种基于结构的智能操作技术。然而概念图首先需要由专家手工绘制生成。Chen等人利用文本分析技术从文献中自动生成电子学习领域的概念图。但他们仅考虑了单词间的关联规则而没有反映概念之间的关联。Caputo等人使用文本分析技术中的自然语言处理方法从电子商务网页中生成概念图。他们使用信息提取方法来挖掘概念并分析它们的关联，但并未充分考虑动态数据在概念图生成过程中的作用。Huang等人提出了一种模拟数据集下的概念图自动生成算法。他们通过使用改进的Apriori算法计算概念之间的相...

【技术保护点】
1.一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：基于文本分析技术中的文本分类方法，将试题分类到对应的概念中，采用有监督的数据挖掘算法处理无结构化的试题文本；将文本分析技术中的文本分类方法同关联规则挖掘相结合，得到生成的概念图。

【技术特征摘要】
1.一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：基于文本分析技术中的文本分类方法，将试题分类到对应的概念中，采用有监督的数据挖掘算法处理无结构化的试题文本；将文本分析技术中的文本分类方法同关联规则挖掘相结合，得到生成的概念图。2.如权利要求1所述的一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：在试题文本分析阶段，从试题中提取文本特征，建立分类模型，并利用文本分析中的文本分类方法将试题分类到概念，获得试题和概念之间的关联。3.如权利要求1所述的一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：在概念间的关联规则挖掘阶段，首先生成测试问题频繁项集，并结合答题记录，将前一阶段获取的试题和概念之间的关联，映射为概念之间的关联，最终生成概念图。4.如权利要求3所述的一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：所述测试问题频繁项集为测试问题的出现频率高于设定值的所有测试问题集合。5.如权利要求1所述的一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：试题文本分析阶段，对试题文本进行分词和停用词的过滤，继而进行文本特征的提取，对提取的特征进行分类，得到分类结果，将试题自动分类到概念。6.如权利要求5所述的一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：选择TF-IDF方法来提取文本特征，并将分词及停用词过滤后的试题转化为可被计算机理解的向量空间模型；更进一步的，对提取的文本特征进行赋予权重，权重的大小根据该文本特征项的词频与该特征在整个文本数据集中出现的次数的乘积。7.如权利要求6所述的一种基于文本分析及关联规则挖掘的概念图自动生成方法，其特征是：在模型分类前，将试题文本特征划分为训练样本Wtrain和待分类样本Wtest，待分类样本...

【专利技术属性】
技术研发人员：邵增珍，李彦聪，郭延辉，赵学臣，王萧，董树霞，
申请(专利权)人：山东女子学院，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人