【技术实现步骤摘要】
一种基于记忆机制的注意力图的生成方法、装置以及设备
[0001]本说明书涉及互联网
,尤其涉及一种基于记忆机制的注意力图的生成方法、装置以及设备。
技术介绍
[0002]在当前,在线学习已经成为学习者的主要学习方式。知识追踪模型作为在线学习的关键部分,主要通过跟踪学习者在学习过程中知识掌握程度的变化,来预测学习者在未来练习中的表现。当前的深度知识追踪模型更多的是考虑学生的响应时间、练习次数和练习难度等因素,忽略了一些关于学生遗忘行为的心理学研究方面的因素。
[0003]基于此,需要一种在知识追踪模型中可以准确捕捉遗忘行为的注意力图的生成方案。
技术实现思路
[0004]本说明书实施例提供一种基于记忆机制的注意力图的生成方法、装置、设备以及存储介质,用以解决如下技术问题:需要一种在知识追踪模型中可以准确捕捉遗忘行为的注意力图的生成方案。
[0005]为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
[0006]在第一方面,本说明书实施例提供一种基于记忆机制的注意力图的生成 ...
【技术保护点】
【技术特征摘要】
1.一种基于记忆机制的注意力图的生成方法,应用于包含知识点和时间的知识点序列中,所述方法包括:确定所述知识点序列所对应的特征矩阵,所述特征矩阵包括键矩阵K、查询矩阵Q和值矩阵V;获取第i个知识点在所述查询矩阵Q中的特征值Q
i
,以及,获取第j个知识点在所述键矩阵K中的特征值K
j
,其中,所述第j个知识点为与所述第i个知识点相关的前一个知识点;确定所述第i个知识点与所述第j个知识点在所述序列中是否相邻,当不相邻时,确定所述第i个知识点与所述第j个知识点之间所存在的其它知识点;确定所述第i个知识点与所述第j个知识点的时间差Δ(t
i
,t
j
),以及,确定所述第i个知识点与所述其它知识点的时间差Δ(t
i
,t
k
);根据所述时间差Δ(t
i
,t
j
)和Δ(t
i
,t
k
)对预设的衰减函数进行修正,生成修正后的衰减函数;根据所述特征值Q
i
、特征值K
j
、所述修正后的衰减函数和所述值矩阵V生成注意力图。2.如权利要求1所述的方法,其中,所述预设的衰减函数通过如下方式预先确定:确定包含所述时间差Δ(t
i
,t
j
)和衰减参数θ的衰减函数γ(t
i
,t
j
,θ),其中,所述θ为可学习的衰减参数。3.如权利要求2所述的方法,其中,根据所述Δ(t
i
,t
j
)和Δ(t
i
,t
k
)对预设的衰减函数进行修正,生成修正后的衰减函数,包括:确定所述Δ(t
i
,t
k
)与所述Δ(t
i
,t
j
)的比值P,根据所述比值P对所述衰减函数γ(t
i
,t
j
,θ)进行修正,生成修正后的衰减函数。4.如权利要求3所述的方法,其中,根据所述P对所述衰减函数γ(t
i
,t
j
,θ)进行修正,生成修正后的衰减函数,包括:确定包含λ、所述衰减函数γ(t
i
,t
j
,θ)和所述P的修正项φ,其中,所述λ为可学习的修正参数;将所述修正项φ和所述衰减函数γ(t
i
,t
j
,θ)的和γ(t
i
,t
j
,t
k
,θ,λ)确定为修正后的衰减函数。5.如权利1至4任一项所述的方法,其中,根据所述特征值Q
i
、特征值K
j
、所述修正后的衰减函数和所述值矩阵V生成注意力图,包括:根据所述特征值Q
i
、特征值K
j
生成原始注意力分数s
i,j
;融合所述...
【专利技术属性】
技术研发人员:苏伟,孙元涛,石君太,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。