一种基于分词方法的自动排课方法技术

技术编号:39807558 阅读:9 留言:0更新日期:2023-12-22 02:41
本发明专利技术公开了一种基于分词方法的自动排课方法

【技术实现步骤摘要】
一种基于分词方法的自动排课方法、系统、设备及介质


[0001]本专利技术涉及自动排课
,尤其是涉及一种基于分词方法的自动排课方法

系统

设备及介质


技术介绍

[0002]随着高校办学规模的不断扩大,学生人数

课程人数和任课教师人数越来越多,个性化的排课要求也越来越高,对自动排课的要求也越来越高

传统的自动排课方法从当前的排课数据出发,从各种角度考虑学生

教师,教室

课堂的特殊要求

但因为各种特殊要求的交织在一起,最终排课效果并不理想


技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题之一

为此,本专利技术提出一种基于分词方法的自动排课方法

系统

设备及介质,能够提高排课质量和效率

[0004]第一方面,本专利技术实施例提供了一种基于分词方法的自动排课方法,所述基于分词方法的自动排课方法包括:
[0005]根据历史数据集中的不同字段,构建第一历史数据集和第二历史数据集以及与所述第一历史数据集对应的第一待排数据集和所述第二历史数据集对应的第二待排数据集;
[0006]将所述第二历史数据集中的所有字段进行合并,构建第一历史文档集合;将所述第二待排数据集中的所有字段进行合并,构建第一待排文档集合;
[0007]采用分词方法对所述第一历史文档集合和所述第一待排文档集合进行分词,构建文档模型并得到分词后的第一历史文档集合和分词后的第一待排文档集合;
[0008]采用所述分词后的第一历史文档集合和似然函数训练所述文档模型,得到训练好的文档模型和与所述第一历史文档集合对应的第一主题分类,并将所述第一待排文档集合输入至所述训练好的文档模型中,得到第二主题分类;
[0009]采用所述第一主题分类更新所述第一历史数据集的主题分类,得到更新后的第一历史数据集;采用所述第二主题分类更新所述第一待排数据集的主题分类,得到更新后的第一待排数据集;
[0010]将所述更新后的第一历史数据集中的所有字段进行合并得到第二历史文档集合,将所述更新后的第一待排数据集中的所有字段进行合并得到第二待排文档集合,将所述第二历史文档集合和所述第二待排文档集合进行合并得到合并数据集,并对所述合并数据集进行分词,得到分词后的合并数据集;
[0011]排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集,并计算所述第二待排文档集合中每条文档与所述剩余数据集中相近的多条文档;
[0012]从所述多条文档中寻找所述第一待排数据集中当前待排课堂的最优排课结果,以完成自动排课

[0013]与现有技术相比,本专利技术第一方面具有以下有益效果:
[0014]本方法将历史数据集构造成历史文档形式,采用分词方法对历史文档进行分词并构建文档模型,以及采用分词后的历史文档和似然函数训练文档模型,能够更加贴合学校最终的排课使用习惯,排课质量高;采用训练好的文档模型对历史数据和待排数据进行主题分类,然后计算待排数据中每一条文档与历史数据中相近的多条文档,并从多条文档中寻找当前待排课堂的最优排课结果,通过自动排课能够极大提升排课时间,使得排课效率提高

[0015]根据本专利技术的一些实施例,所述采用所述分词后的第一历史文档集合和似然函数训练所述文档模型,包括:
[0016]构建第一概率计算函数,并采用所述第一概率计算函数计算所述第一历史文档集合中每个分词的概率;
[0017]基于所述每个分词的概率,构建似然函数,并通过最大化所述似然函数训练所述文档模型

[0018]根据本专利技术的一些实施例,通过如下方式构建似然函数:
[0019]L(
β
,
α
|w)

∏P(w|d)+
λ
T
[0020]其中,
β
表示主题分布,
α
表示分词分布,
w
表示所述分词后的第一历史文档集合中的分词,
P(w|d)
表示每个分词的概率,
d
表示所述分词后的第一历史文档集合中的文档,
λ
表示平衡系数,
T
表示主题占比例系数

[0021]根据本专利技术的一些实施例,所述排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集,包括:
[0022]计算所述分词后的合并数据集中所有分词的词频;
[0023]根据所述词频排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集

[0024]根据本专利技术的一些实施例,通过如下方式计算所述第二待排文档集合中每条文档与所述剩余数据集中相近的多条文档:
[0025][0026]其中,
N
表示相近的多条文档的数量,
x
m
y
m
表示点向量,
λ
表示平衡系数,
T
表示主题占比例系数,
n
表示所有分词

[0027]根据本专利技术的一些实施例,所述从所述多条文档中寻找所述第一待排数据集中当前待排课堂的最优排课结果,以完成自动排课,包括:
[0028]预设硬性约束条件,并对所述多条文档进行硬性约束条件检查,得到检查后的多条文档;
[0029]根据所述第一历史数据集中记录的排课时间和地点,从所述检查后的多条文档中寻找所述第一待排数据集中当前待排课堂的最优排课结果,以完成自动排课

[0030]根据本专利技术的一些实施例,在从所述多条文档中寻找所述第一待排数据集中当前待排课堂的最优排课结果之后,所述基于分词方法的自动排课方法还包括:
[0031]对所述第一待排数据集中完成自动排课的课堂打上成功排课标志;
[0032]对未打成功排课标志的待排课堂采用传统排课方法

[0033]第二方面,本专利技术实施例还提供了一种基于分词方法的自动排课系统,所述基于分词方法的自动排课系统包括:
[0034]数据集构建单元,用于根据历史数据集中的不同字段,构建第一历史数据集和第二历史数据集以及与所述第一历史数据集对应的第一待排数据集和所述第二历史数据集对应的第二待排数据集;
[0035]数据集合并单元,用于将所述第二历史数据集中的所有字段进行合并,构建第一历史文档集合;将所述第二待排数据集中的所有字段进行合并,构建第一待排文档集合;
[0036]第一分词单元,用于采用分词方法对所述第一历史文档集合和所述第一待排文档集合进行分词,构建文档模型并得到分词后的第一历史文档集合和分词后的第一待排文档集合;
[0037]模型训练单元,用于采用所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于分词方法的自动排课方法,其特征在于,所述基于分词方法的自动排课方法包括:根据历史数据集中的不同字段,构建第一历史数据集和第二历史数据集以及与所述第一历史数据集对应的第一待排数据集和所述第二历史数据集对应的第二待排数据集;将所述第二历史数据集中的所有字段进行合并,构建第一历史文档集合;将所述第二待排数据集中的所有字段进行合并,构建第一待排文档集合;采用分词方法对所述第一历史文档集合和所述第一待排文档集合进行分词,构建文档模型并得到分词后的第一历史文档集合和分词后的第一待排文档集合;采用所述分词后的第一历史文档集合和似然函数训练所述文档模型,得到训练好的文档模型和与所述第一历史文档集合对应的第一主题分类,并将所述第一待排文档集合输入至所述训练好的文档模型中,得到第二主题分类;采用所述第一主题分类更新所述第一历史数据集的主题分类,得到更新后的第一历史数据集;采用所述第二主题分类更新所述第一待排数据集的主题分类,得到更新后的第一待排数据集;将所述更新后的第一历史数据集中的所有字段进行合并得到第二历史文档集合,将所述更新后的第一待排数据集中的所有字段进行合并得到第二待排文档集合,将所述第二历史文档集合和所述第二待排文档集合进行合并得到合并数据集,并对所述合并数据集进行分词,得到分词后的合并数据集;排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集,并计算所述第二待排文档集合中每条文档与所述剩余数据集中相近的多条文档;从所述多条文档中寻找所述第一待排数据集中当前待排课堂的最优排课结果,以完成自动排课
。2.
根据权利要求1所述的基于分词方法的自动排课方法,其特征在于,所述采用所述分词后的第一历史文档集合和似然函数训练所述文档模型,包括:构建第一概率计算函数,并采用所述第一概率计算函数计算所述第一历史文档集合中每个分词的概率;基于所述每个分词的概率,构建似然函数,并通过最大化所述似然函数训练所述文档模型
。3.
根据权利要求2所述的基于分词方法的自动排课方法,其特征在于,通过如下方式构建似然函数:
L(
β
,
α
|w)

∏P(w|d)+
λ
T
其中,
β
表示主题分布,
α
表示分词分布,
w
表示所述分词后的第一历史文档集合中的分词,
P(w|d)
表示每个分词的概率,
d
表示所述分词后的第一历史文档集合中的文档,
λ
表示平衡系数,
T
表示主题占比例系数
。4.
根据权利要求1所述的基于分词方法的自动排课方法,其特征在于,所述排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集,包括:计算所述分词后的合并数据集中所有分词的词频;根据所述词频排除所述分词后的合并数据集中所有的第二待排文档集合,得到剩余数据集

5.
根据权利要求1所述的基于分词方法的自动排课方法,其特征在于,通过如下方式计算所述第二待排文档集合中每条文档与所述剩余数据集中相近的多条文档:其中,
N
表示相近的多条文档的数量,
x
m
y
...

【专利技术属性】
技术研发人员:郭尚志廖海波谢羲和刘文剑梁鹏何勇波程鹏
申请(专利权)人:湖南强智科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1