基于行为序列编码的在线资源学习行为分析与预测方法技术

技术编号:39896561 阅读:9 留言:0更新日期:2023-12-30 13:10
本发明专利技术涉及在线资源学习行为分析与预测领域,提供一种基于行为序列编码的在线资源学习行为分析与预测方法

【技术实现步骤摘要】
基于行为序列编码的在线资源学习行为分析与预测方法


[0001]本专利技术涉及在线资源学习行为分析与预测领域,尤其是涉及一种基于行为序列编码的在线资源学习行为分析与预测方法


技术介绍

[0002]通过分析学生在资源平台上的学习行为及演化规律,有助于了解学生学习的行为模式,为资源平台建设及资源更新提供指导建议

相比线下学习行为分析能够考虑音频

视频

生理等多模态数据,在线资源学习行为仅能通过点击流事件挖掘学生学习规律

[0003]目前,在线资源学习行为分析与预测存在的困难主要包括:
1)
点击事件对应的行为难以有效定义;
2)
在线资源学习行为的模式难以有效划分;
3)
在线资源学习行为模式的演化难以有效预测


技术实现思路

[0004]针对学生群体开展在线资源学习行为演化规律不明晰

行为模式难以预测的问题,本专利技术提出了一种基于行为序列编码的在线资源学习行为分析与预测方法,能够有效提高学生在线开展资源学习行为预测的准确率

[0005]本专利技术的目的是通过如下技术措施来实现的

[0006]一种基于行为序列编码的在线资源学习行为分析与预测方法,包括以下步骤:
[0007]步骤1,对学生在资源平台开展在线学习的各类行为进行编码,追踪学生在线上学习空间中的学习轨迹,并采用线性数据结构描述学生的学习行为序列;
[0008]步骤2,从资源平台访问的日志数据中提取了
12
个维度的指标刻画学生的学习行为,反映学生的学习积极性

学习专注度

学习兴趣和学习效能等,得到学生的时间特征序列后,利用秩相关系数
r
s
度量指标维度之间的相关性,对时间特征序列进行降维;
[0009]步骤3,根据用户行为特征进行群体分类,确定拟合度更高的聚类数量,分析不同用户群体的倾向性;
[0010]步骤4,统计单位周期内的用户群体分类,建立
ARIMAX
时间序列模型,预测学生群体分类演化趋势

[0011]在上述技术方案中,所述步骤1包括以下子步骤,
[0012]步骤
1.1
,利对学生在资源平台上的操作行为进行分解,具体分解为
Where、What、How

Status
四部分,“Where”即用户访问平台的哪个页面或是哪个模块,具体包括导航栏

搜索框

分类列表

课程列表或视频等;“What”即用户在平台页面元素上面进行什么操作,具体元素内容包括链接

按钮或进度条等;“How”即用户在平台上怎样进行操作,具体操作行为包括点击

拖拽等行为;“Status”即用户观看视频的状态或页面访问状态,具体包括离开,开始

结束

暂停

快进等;
[0013]步骤
1.2
,基于上述编码规则,将每个学生的一次操作行为转化为一条行为轨迹数据,例如:学生
A
点击了导航栏,可用“navigation_link_click”表示

每个学生的一系列操
作行为转化为一组行为序列数据

例如:学生
A
点击导航栏后进入课程列表页面,再通过课程列表访问了某一个课程,并点击开始按钮进行在线学习,可用“navigation_link_click

course_link_click

video_button_click_start”表示

若学生关闭页面窗口或是切换页面,则生成一条“page_leave”行为数据

[0014]在上述技术方案中,所述步骤2包括以下子步骤,
[0015]步骤
2.1
,从资源平台访问的日志数据中提取
12
个维度指标刻画学生的学习行为,分别为:
C01
平台访问次数
、C02
离线次数
、C03
在线时长
、C04
页面最长停留时长
、C05
访问栏目个数
、C06
学习学科门数
、C07
课程学习数量
、C08
课程访问次数
、C09
视频观看次数
、C10
课后学习次数
、C11
行为序列长度
、C12 IP
地址变更次数,其中
C01

C02
用于反映学习积极性
、C03

C04
用于反映学习专注度
、C05

C09
共5个指标用于反映学习兴趣和学习偏好
、C10
用于反映学生自主学习能力
、C11
用于反映学生在平台活跃度
、C12
用于反映学生学习环境变更情况;
[0016]步骤
2.2
,按照定义的
12
维度指标,首先构建包含时间序列特征的学生行为特征序列=
{
用户
ID
,访问日期,
[C01



C12]}
,再利用秩相关系数
r
s
度量指标维度之间的统计相关性,根据指标之间相关系数的大小进行指标筛选

其中,秩相关系数
r
s
计算公式为:
[0017][0018]通过比较两组变量中任意两个变量之间的秩值差异衡量它们之间的相关性,秩相关系数值越大,表示两组变量之间的关系越紧密

对任意两个变量相关性按照从小到大顺序编秩,
R
i
代表
x
i
的秩次,
Q
i
代表
y
i
的秩次,
R
i

Q
i

x
i
、y
i
的秩次之差,
x
i

y
i

[C01



C12]。
秩相关系数取值区间为
[1,

1],
r
s
为正时表示正相关,
r
s
为负时表示负相关,从中剔除相关系数值较大
(

0.5)
的特征维度,保留本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于,包括以下步骤:对学生在资源平台开展在线学习的各类行为进行编码,追踪学生在线上学习空间中的学习轨迹,并采用线性数据结构描述学生的学习行为序列;从资源平台访问的日志数据中提取
12
个维度指标刻画学生的学习行为,反映学生的学习积极性

学习专注度

学习兴趣和学习效能,得到学生的时间特征序列后,利用秩相关系数
r
s
度量指标维度之间的相关性,对时间特征序列进行降维;根据用户行为时间特征序列进行群体分类,确定拟合度更高的聚类数量,分析不同用户群体的倾向性;统计单位周期内的用户群体分类,建立
ARIMAX
时间序列模型,预测学生群体分类演化趋势
。2.
根据权利要求1所述的基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于:所述“对学生在资源平台开展在线学习的各类行为进行编码,追踪学生在线上学习空间中的学习轨迹,并采用线性数据结构描述学生的学习行为序列”包括以下子步骤,对学生在资源平台上的操作行为进行分解,具体分解为
Where、What、How

Status
四部分,“Where”即用户访问平台的哪个页面或是哪个模块,具体包括导航栏

搜索框

分类列表

课程列表或视频;“What”即用户在平台页面元素上面进行什么操作,具体元素内容包括链接

按钮或进度条;“How”即用户在平台上怎样进行操作,具体操作行为包括点击

拖拽行为;“Status”即用户观看视频的状态或页面访问状态,具体包括离开

开始

结束

暂停

快进;基于上述编码规则,将每个学生的一次操作行为转化为一条行为轨迹数据,每个学生的一系列操作行为转化为一组行为序列数据
。3.
根据权利要求1所述的基于行为序列编码的在线资源学习行为分析与预测方法,其特征在于:所述“从资源平台访问的日志数据中提取
12
个维度指标刻画学生的学习行为,反映学生的学习积极性

学习专注度

学习兴趣和学习效能,得到学生的时间特征序列后,利用秩相关系数
r
s
度量指标维度之间的相关性,对时间特征序列进行降维”包括以下子步骤,从资源平台访问的日志数据中提取
12
个维度指标刻画学生的学习行为,分别为:
C01
平台访问次数
、C02
离线次数
、C03
在线时长
、C04
页面最长停留时长
、C05
访问栏目个数
、C06
学习学科门数
、C07
课程学习数量
、C08
课程访问次数
、C09
视频观看次数
、C10
课后学习次数
、C11
行为序列长度
、C12IP
地址变更次数,其中
C01

C02
用于反映学习积极性...

【专利技术属性】
技术研发人员:吴砥陈旭王凯利
申请(专利权)人:华中师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1