【技术实现步骤摘要】
一种基于细粒度学生时空行为异质网表征的相似学生搜索方法
[0001]本专利技术属于大数据挖掘中教育数据挖掘领域,具体涉及一种基于细粒度学生时空行为异质网表征的相似学生搜索方法。
技术介绍
[0002]近年来,在人工智能、数据挖掘等前沿技术与高等教育管理情景深度融合的背景下,基于校园海量数据的智慧教育进一步为精准教育、精准学生管理等提供了技术支持。面向学生在校内的学业、生活、经济、心理等各方面问题,高校教育工作者利用学生在校产生的各类大规模数据进行学业表现预测、高危学生聚类、课程参与度与学生成绩的关联规则分析等任务,实现对学生的个性化培养和精准管理,改善学生在校生活质量、帮助学生成长。搜索相似学生、挖掘学生特点便是教育管理工作的一个重要方面。
[0003]在进行教育数据挖掘时,传统方法大多将实际数据建模为同质信息网络,并未对网络中不同类型的对象及链接加以区分,这样的学习到的嵌入表达往往包含语义信息较少。现实世界的系统往往由大量类型各异、彼此交互的组件构成,在高校教育情景下,就存在着多种多样的交互组件,如:学生、教师、课 ...
【技术保护点】
【技术特征摘要】
1.一种基于细粒度学生时空行为异质网表征的相似学生搜索方法,其特征在于:该方法包括以下步骤:步骤1,基于脱敏的学生一卡通数据构建学生细粒度时空校园行为异质多重网络;步骤1.1,构建时空双特性节点,将按照一定尺度划分的时间和位置信息组合起来;步骤1.2,探究不同粒度划分的时间信息影响,构建细粒度时空节点;步骤1.3,基于一卡通刷卡记录连接学生节点和细粒度时空节点,保留短时多次刷卡情景,构建学生细粒度时空校园行为异质多重网络;步骤2,基于学生共现关系元路径进行学生行为模式嵌入学习;步骤2,基于学生共现关系元路径进行学生行为模式嵌入学习;步骤2.1,设计可揭示学生共现关系的元路径;步骤2.2,基于元路径随机游走算法学习学生行为模式嵌入;步骤3,采用低维向量空间中的密集表示法进行学生学籍信息中的学生属性表示,得到学生属性嵌入表征;步骤4,将学生行为模式嵌入表征与学生属性嵌入表征进行融合,得到学生嵌入表征后采用Annoy算法来查找每个学生嵌入表示的Top n个相似嵌入。2.根据权利要求1所述的一种基于细粒度学生时空行为异质网表征的相似学生搜索方法,其特征在于:步骤1.1中,一次刷卡记录具有时间和空间两个维度的特征,时间和空间两个维度的特征不被拆分处理,利用时间和空间的组合信息实现对学生校园行为的轨迹语义表征;步骤1.2中,为了区分不同学生行为差异,克服大尺度时空划分对学生行为描述的可区别性能差问题,将时间信息以月、日、小时、分钟、秒单位进行更加细粒度的划分处理;步骤1.3中,结合应用情景,学生使用一卡通可能存在于某时某地有多次重复刷卡的情况,为准确保留模型信息,允许出现两个节点之间连接多条边的情况,即加入了“多重边”;在步骤1.1、1.2的基础上构建了学生细粒度时空校园行为异质多重网络;其中共有两种节点类型:学生节点和细粒度时空节点;一种链接类型:学生节点与细粒度时空节点之间由学生刷卡记录连接的关系;学生节点之间无连接,细粒度时空节点之间无连接。3.根据权利要求1所述的一种基于细粒度学生时空行为异质网表征的相似学生搜索方法,其特征在于:步骤2.1中,设计可揭示学生共现关系的元路径;不同的元路径表达着不同的语义关系,根据学生校内活动场景,在学生细粒度时空校园行为异质多重网络上定义了学生共现关系元路径mp,记为:简写为S
‑
TP
‑
S,其中,v
s
表示学生类型的节点,v
tp
表示时空类型的节点;
→
表示从某节点到下个邻居节点的游走,“visit”表示学生访问某时空的行为语义,“visited”表示某时空被学生访问的行为语义;mp路径表示某个学生节点访问某个时空节点再访问某个学生节点,其语义为:两个学生在相同的时间空间内均有过一次刷卡记录,这种情况称为“一次共同出现”,并称这样的两个学生具有“共现”关系,互为“消费朋友”;步骤2.2中,利用步骤2.1设计的学生共...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。