【技术实现步骤摘要】
一种基于分词方法的自动排课方法、系统、设备及介质
[0001]本专利技术涉及自动排课
,尤其是涉及一种基于分词方法的自动排课方法
、
系统
、
设备及介质
。
技术介绍
[0002]随着高校办学规模的不断扩大,学生人数
、
课程人数和任课教师人数越来越多,个性化的排课要求也越来越高,对自动排课的要求也越来越高
。
传统的自动排课方法从当前的排课数据出发,从各种角度考虑学生
、
教师,教室
、
课堂的特殊要求
。
但因为各种特殊要求的交织在一起,最终排课效果并不理想
。
技术实现思路
[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一
。
为此,本专利技术提出一种基于分词方法的自动排课方法
、
系统
、
设备及介质,能够提高排课质量和效率
。
[0004]第一方面,本专利技术实施例提供了一种基于分词方法的自动排课方法,所述基于分词方法的自动排课方法包括:
[0005]根据历史数据集中的不同字段,构建第一历史数据集和第二历史数据集以及与所述第一历史数据集对应的第一待排数据集和所述第二历史数据集对应的第二待排数据集;
[0006]将所述第二历史数据集中的所有字段进行合并,构建第一历史文档集合;将所述第二待排数据集中的所有字段进行合并,构建第一待排文档集合;
[0007]采用分词 ...
【技术保护点】
【技术特征摘要】
1.
一种基于分词方法的自动排课方法,其特征在于,所述基于分词方法的自动排课方法包括:根据历史数据集中的不同字段,构建第一历史数据集和第二历史数据集以及与所述第一历史数据集对应的第一待排数据集和所述第二历史数据集对应的第二待排数据集;将所述第二历史数据集中的所有字段进行合并,构建第一历史文档集合;将所述第二待排数据集中的所有字段进行合并,构建第一待排文档集合;采用分词方法对所述第一历史文档集合和所述第一待排文档集合进行分词,构建文档模型并得到分词后的第一历史文档集合和分词后的第一待排文档集合;采用所述分词后的第一历史文档集合和似然函数训练所述文档模型,得到训练好的文档模型和与所述第一历史文档集合对应的第一主题分类,并将所述第一待排文档集合输入至所述训练好的文档模型中,得到第二主题分类;采用所述第一主题分类更新所述第一历史数据集的主题分类,得到更新后的第一历史数据集;采用所述第二主题分类更新所述第一待排数据集的主题分类,得到更新后的第一待排数据集;将所述更新后的第一历史数据集中的所有字段进行合并得到第二历史文档集合,将所述更新后的第一待排数据集中的所有字段进行合并得到第二待排文档集合,将所述第二历史文档集合和所述第二待排文档集合进行合并得到合并数据集,并对所述合并数据集进行分词,得到分词后的合并数据集;排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集,并计算所述第二待排文档集合中每条文档与所述剩余数据集中相近的多条文档;从所述多条文档中寻找所述第一待排数据集中当前待排课堂的最优排课结果,以完成自动排课
。2.
根据权利要求1所述的基于分词方法的自动排课方法,其特征在于,所述采用所述分词后的第一历史文档集合和似然函数训练所述文档模型,包括:构建第一概率计算函数,并采用所述第一概率计算函数计算所述第一历史文档集合中每个分词的概率;基于所述每个分词的概率,构建似然函数,并通过最大化所述似然函数训练所述文档模型
。3.
根据权利要求2所述的基于分词方法的自动排课方法,其特征在于,通过如下方式构建似然函数:
L(
β
,
α
|w)
=
∏P(w|d)+
λ
T
其中,
β
表示主题分布,
α
表示分词分布,
w
表示所述分词后的第一历史文档集合中的分词,
P(w|d)
表示每个分词的概率,
d
表示所述分词后的第一历史文档集合中的文档,
λ
表示平衡系数,
T
表示主题占比例系数
。4.
根据权利要求1所述的基于分词方法的自动排课方法,其特征在于,所述排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集,包括:计算所述分词后的合并数据集中所有分词的词频;根据所述词频排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集
。
5.
根据权利要求1所述的基于分词方法的自动排课方法,其特征在于,通过如下方式计算所述第二待排文档集合中每条文档与所述剩余数据集中相近的多条文档:其中,
N
表示相近的多条文档的数量,
x
m
y
...
【专利技术属性】
技术研发人员:郭尚志,廖海波,谢羲和,刘文剑,梁鹏,何勇波,程鹏,
申请(专利权)人:湖南强智科技发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。