基于大数据和知识图谱的推荐方法与装置制造方法及图纸

技术编号:38349890 阅读:26 留言:0更新日期:2023-08-02 09:29
本发明专利技术公开了基于大数据和知识图谱的推荐方法与装置,属于教育数据分析与智能算法推荐技术领域,解决现有技术在推荐专业时不能充分满足考生对专业的意愿的问题。本发明专利技术根据考生所意向的学类实体和专业实体查询高考志愿服务知识图谱,得到专业实体集合;根据用户输入的意向省份,在高考志愿服务知识图谱中查询匹配的省份实体;在高考志愿服务知识图谱中查询与省份实体具有位于关系的高校实体集合;在高考志愿服务知识图谱中同时查询与专业实体集合以及高校实体集合具有原子关系的原子术语实体集合;根据考生的位次和原子术语实体集合,过滤掉与考生位次不匹配的原子术语实体,过滤后得到候选高校专业集合。本发明专利技术用于高考志愿推荐。志愿推荐。志愿推荐。

【技术实现步骤摘要】
基于大数据和知识图谱的推荐方法与装置


[0001]本专利技术提供了一种基于大数据和知识图谱的推荐方法与装置,用于高考志愿推荐,属于教育数据分析与智能算法推荐


技术介绍

[0002]高考是当前选拔人才的重要途径,学生在获得高考成绩之后需要进行高考志愿填报。传统的高考志愿填报方式是学生及家长通过阅读教育部门印发的《高考志愿填报指南》,了解各个院校的专业设置情况以及录取分数和位次,从中筛选出适合学生高考分数和位次的院校及专业,并依据院校及专业的录取分数和位次,按照“冲刺”、“稳妥”、“保底”的策略调整每一条志愿在志愿填报表单中的优先顺序,最终形成一套志愿填报方案。该方法存在以下问题:(1)院校和专业的样本数量是非常庞大的,仅依靠人工的方式很难细致全面的了解院校和专业的录取情况。(2)院校和专业往年的录取分数和位次存在波动,只看一年的录取分数和位次不足以分析该志愿是应该作为“冲刺”志愿,还是“稳妥”志愿,或者是“保底”志愿,而人工分析往年录取数据的工作量是非常艰巨的。(3)许多专业的在培养阶段学习的课程,未来就业的领域以及职业发展的方向是非常本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于大数据和知识图谱的推荐方法,其特征在于,包括:S1. 根据考生所意向的学类实体和专业实体查询高考志愿服务知识图谱,得到专业实体集合;S2.根据用户输入的意向省份,在高考志愿服务知识图谱中查询匹配的省份实体;S3.在高考志愿服务知识图谱中查询与省份实体具有位于关系的高校实体集合;S4.在高考志愿服务知识图谱中同时查询与专业实体集合以及高校实体集合具有原子关系的原子术语实体集合;S5.根据考生的位次和原子术语实体集合,过滤掉与考生位次不匹配的原子术语实体,过滤后得到候选高校专业集合。2.根据权利要求1所述的一种基于大数据和知识图谱的推荐方法,其特征在于,所述高考志愿服务知识图谱包括:高校实体:是指高考志愿服务知识图谱中名称定义为高校名称的一类节点,用于表示高校,包含的属性有该高校的基本介绍、是否为985高校、是否为211高校、是否为双一流高校、距离报考当年一年前该高校的录取位次、距离报考当年二年前该高校的录取位次和距离报考当年三年前该高校的录取位次;专业实体:是指高考志愿服务知识图谱中名称定义为三级专业名称的一类节点,用于表示专业,包含的属性有该专业的基本介绍;原子术语实体:是指高考志愿服务知识图谱中名称定义为高校名和专业名组成的细粒度的一类节点,用于表示由高校和专业组成的原子,包含的属性有距离报考当年一年前该高校该专业的录取位次、距离报考当年两年前该高校该专业的录取位次和距离报考当年三年前该高校该专业的录取位次;省份实体:是指高考志愿服务知识图谱中名称定义为省份及直辖市名称的一类节点,用于表示省份;学类实体:是指高考志愿服务知识图谱中名称定义为二级学类名称的一类节点,用于表示二级学类,包含的属性有该学类的基本介绍;学科实体:是指高考志愿服务知识图谱中名称定义为一级学类名称的一类节点,用于表示一级学科,包含的属性有该学科的基本介绍;开设关系:是指以高校实体作为头实体,以专业实体作为尾实体,从头实体指向尾实体的有向边;位于关系:是指以高校实体作为头实体,以省份实体作为尾实体,从头实体指向尾实体的有向边;原子关系:是指以高校实体作为头实体,以原子术语实体作为尾实体,从头实体指向尾实体的有向边;或指的是以专业实体作为头实体,以原子术语实体作为尾实体,由头实体指向尾实体的有向边;属于关系:是指以专业实体作为头实体,以学类实体作为尾实体,从头实体指向尾实体的有向边;或指的是以学类实体作为头实体,以学科实体作为尾实体,从头实体指向尾实体的有向边;相关学类关系:是指两个相关或相似的学类实体之间的有向边。3.一种高校专业填报策略分档方法,其特征在于,包括:
模型训练阶段:步骤1.对获取的训练数据集进行预处理;步骤2.构建基于LSTM的录取成功率预测模型,并用预处理后的训练数据集进行训练,得到训练好的录取成功率预测模型;模型使用阶段:步骤3.获取考生的候选高校专业集合,利用训练好的录取成功率预测模型对候选高校专业集合中的全部高校中的各专业进行预测,计算考生被各院校中各专业录取的成功率,其中,各专业包括法学、土木工程、计算机应用和电气自动化;步骤4.将候选高校专业集合中的各高校中的各专业按照成功率得分划分为“冲”、“稳”、“保”三类院校专业集合,所述“冲”表示此高校中的该专业集合录取难度最大,所述“稳”表示此高校中的该专业集合录取难度适中,所述“保”表示此高校中的该专业集合录取难度最小。4.根据权利要求3所述的一种高校专业填报策略分档方法,其特征在于,所述步骤1具体为:步骤11.获取各高校各专业公示的历年历史录取数据,当年的前一年定义为y,y之前的第三年定义为y1,y之前的第二年定义为y2,y之前的第一年定义为y3,所述的历史录取数据指的是y年、y1年、y2年、y3年各高校中各专业的录取数据;所述历史录取数据定义如下:各高校中各专业在y1年的录取位次为rank1,在y2年的录取位次为rank2,在y3年的录取位次为rank3,在y年的录取位次定义为rank_update;步骤12.将所述历史录取数据取rank_update的值作为中心位次,根据某省y年的一分一段表将rank_update映射为具体的分数score_update;步骤13.取分数score_update向上5分以及向下5分的全部分数组成一个浮动分数集合,记作sample_score1, sample_score2,

sample_score11,其中,分数score_update为sample_score6;步骤14.将所述浮动分数集合中的分数根据某省y年的一分一段表转换为具体的位次,记作sample_rank1, sample_rank2,

,sample_rank11,组成一个浮动位次集合;步骤15.将所述浮动位次集合中的各位次sample_ranki分别与所述rank1、rank2、rank3和rank_update进行组合,组合后生成一个浮动样本集合,浮动样本集合内有11个样本;步骤16.将所述浮动样本集合中的各样本中的sample_ranki与rank_update进行比较,若sample_ranki大于rank_update,则样本中新增变量resign_labeli=0,表示未能被录取,若sample_ranki小于rank_update,则样本中新增变量resign_labeli=1,表示能被录取;步骤17.将各高校中的各专业的rank1、rank2、rank3与计算得到的各sample_ranki和resign_labeli组合生成一条训练样本,其中,一个高校中的一个专业共计生成11条训练样本;步骤18.基于步骤17得到的结果,将各高校中的各专业生成的训练样本进行组合,生成训练基于LSTM的录取成功率预测模型的训练数据集;步骤19.按照数据标准化方法,将所述训练样本中的rank1、rank2、rank3和对应的sample_rank进行归一化,转换成符合基于LSTM的录取成功率预测模型输入要求的形式,
即得到预处理后的各高校中的各专业往年的历史录取数据,其中,数据标准化方法计算公式如下: 计算rank1、rank2、rank3和sample_rank的平均值mean;mean = (rank1 + rank2 + rank3 + sample_rank)
ꢀ÷ꢀ
4;计算rank1、rank2、rank3和sample_rank的标准差std;std=利用平均值与标准差对rank1、rank2、rank3、sample_ranki进行标准化;x1 = (rank1
ꢀ‑ꢀ
...

【专利技术属性】
技术研发人员:付立军张永宏李鑫刘雨江
申请(专利权)人:中科智禾数字科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1