【技术实现步骤摘要】
智能高考志愿推荐方法及系统
[0001]本专利技术涉及高考志愿推荐领域,更为具体的,涉及一种智能高考志愿推荐方法及系统。
技术介绍
[0002]传统的高考志愿填报方式为考生依据各省(市)考试院发放的高考指南手册,通过翻阅指南手册查找历年录取分数与自己考试分数接近的院校及其相关专业,据此进行院校及专业的选择。目前我国高等院校有3000余所,且专业众多,尚未接触高校设置的高中毕业生往往对高校、专业没有客观的认识和了解。考生和家长难以有效利用海量分散的院校录取数据进行志愿填报,缺乏一个客观的专业的填报指导和参考。
技术实现思路
[0003]本专利技术的目的在于克服现有技术的不足,提供一种智能高考志愿推荐方法及系统,避免了人工定义所带来的人力耗费,提高了精确性;能够全方位,多层次采集与处理数据,能够处理特殊情况;减少了内存消耗,提高了效率,避免了因缺少用户历史数据造成的冷启动问题;能够多角度,人性化地向目标人群提供了精准推荐服务。
[0004]本专利技术的目的是通过以下方案实现的:
[0005]一种智 ...
【技术保护点】
【技术特征摘要】
1.一种智能高考志愿推荐方法,其特征在于,包括步骤:对学生输入信息进行处理与评估,利用深度文本特征模型计算样本相似度完成院校专业初筛,获取候选院校专业;利用录取概率模型预测上线概率;再结合预测录取概率对候选院校专业进行细筛,根据样本相似度与预测录取概率,进行加权排名,样本相似度高且录取概率高则进行优先推荐。2.根据权利要求1所述的智能高考志愿推荐方法,其特征在于,还包括步骤:根据推荐排名,得到相关报考方案及分析;若个人意向为已有学校新专业,则取该学校与该专业相似度最大的专业进行光滑化预测,若个人意向为新学校已有专业,则取该专业同层次与该学校相似度最大的学校进行光滑化预测。3.根据权利要求1所述的智能高考志愿推荐方法,其特征在于,所述利用深度文本特征模型计算文本相似度完成院校专业初筛,获取候选院校专业;利用录取概率模型预测上线概率,具体包括:步骤S01:获取历史录取数据和中文语言模型训练语料库,进行数据预处理;步骤S02:根据步骤S01中获取的进行预处理后的录取数据,建立多特征权重模型,根据位次预测录取概率;根据步骤S01中获取的进行预处理后的文本数据,输入Word2vec网络并利用Huffman树优化Word2vec网络的输出层,获得深度文本特征模型;构建原始推荐数据库,借由所述深度文本特征模型转化为嵌入向量,用于评估样本语义相似度。4.根据权利要求3所述的智能高考志愿推荐方法,其特征在于,在步骤S01中,对历史数据进行数据预处理的方法如下:步骤S011:根据考生地区往年度一分一段表,输入LSTM神经网络进行训练,获取<分数,名次>转化模型,将考生高考成绩转换成所在省的高考位次;步骤S012:获取院校的历年录取调档位次,预处理院校历年录取调档位次,去除掉疑似断档的录取位次;具体去除断档录取位次的方法如下:设一定年限内某地区某院校的录取位次表示为:设一定年限内某地区某院校的录取位次表示为:上标i为院校编号,j为录取地区,下标T为该年年份,min、max表示录取位次最小值、最大值;根据其中的一定年限内录取位次的最大值与最小值,将其在时间年限内取平均数,得到录取位次数据对于每一个院校i的历年录取位次进行断档判断,首先将首先将进行升序排序,得到升序数组再对进行如下判断:若进行如下判断:若则在数组S中去掉至此,断档情况处理完成。
5.根据权利要求3所述的智能高考志愿推荐方法,其特征在于,在步骤S02中,获取深度文本特征模型的方法,具体包括:步骤S02a:获取开源中文文本语料库,将学信网相关文本加入语料库构成原始训练数据,输入Word2vec模型进行训练;步骤S02b:将初始训练语料库输入Word2vec模型,初始化原始参数,初始化原始字向量;步骤S02c:其中,采用的Word2vec模型包括输入层、投影层和输出层组成;对Word2vec模型的输出层作如下优化处理:输入层:包含目标词的前c个字和后c个字,取目标词为w,则输入表示为上下文的字向量v(Context(w)1),v(Context(w)2)
…
v(Context(w)
2c
)∈R
m
,其中,参数c、m在初始化步骤中确定。投影层:将输入层的向量进行累加求和,即:将输出层优化为Huffman树结构,其具体流程如下:获取原始训练语料库,提取训练语料中出现次数大于一定阈值的所有字构成一个语料库,得到(字,字频)二元组,每一个字用w表示;将{w1,w2,w3,...w
n
}作为原始数据,根据字频作为权值,选出两个权值最小的字作为树结构的左右子树,且该树的根节点权值为左右子树之和;从原始数据中删除选取的两个字,并将获得的树加入原始数据;重复以上两个步骤,直到原始数据中只存在一棵树,即为后续处理所需要的Huffman树结构;使用生成的Huffman树数据,对每一个字生成Huffman二进制前缀编码;所有层分对概率的累乘即可得目标词的出现概率,目标为让目标词出现概率最大化,因此,其目标函数为:式中,σ为单层分类概率预测函数,为模型参数,为模型的Huffman编码,x
w
为投影层的输入向量,为训练语料库,w为语料库中某个字,j代表Huffman树层次分类的第j层;步骤S02d:利用随机梯度上升法,更新x
w
以及输入的原始字向量v(Context(w)1),v(Context(w)2)
…
v(Context(w)
2c
),在k次迭代步骤结束后,得到训练语料库中所有字的嵌入向量,基于此计算文本相似度。6.根据权利要求3或5所述的智能高考志愿推荐方法,其特征在于,在步骤S02中,获取某学校某专业某地区录取概率预测模型的方法如下:步骤S021:对学校进行评分,评分的指标包括该校近T年调档位次的统计信息、录取分数线离散化程度、历年的调档位次与省控线对应位次的离散化程度、录取分数线的离散化
程度指标,根据...
【专利技术属性】
技术研发人员:唐静静,何皓,李佳辉,田英杰,付赛际,
申请(专利权)人:西南财经大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。