当前位置: 首页 > 专利查询>湖北大学专利>正文

依赖识别模型的训练方法、概念的推送方法、装置及设备制造方法及图纸

技术编号:39061215 阅读:17 留言:0更新日期:2023-10-12 19:54
本发明专利技术公开了一种依赖识别模型的训练方法、概念的推送方法、装置及设备,该方法包括:获取概念数据集,获取用户对概念数据集进行点击所产生的点击流数据;基于概念数据集,获取M组概念对;将M组概念对分别作为目标概念对,基于点击流数据获取目标概念对的N组特征值序列,并对目标概念对的N组特征值序列进行合并处理,以获取目标概念对的Y个特征值,目标概念对包括第一概念和第二概念,N组特征值序列表征第一概念和第二概念的依赖关系;基于M组概念对中每组概念对的Y个特征值训练二值分类器,以得到依赖识别模型。通过本发明专利技术解决了概念对之间依赖关系的识别准确率低的技术问题。念对之间依赖关系的识别准确率低的技术问题。念对之间依赖关系的识别准确率低的技术问题。

【技术实现步骤摘要】
依赖识别模型的训练方法、概念的推送方法、装置及设备


[0001]本专利技术属于模型训练
,尤其涉及一种依赖识别模型的训练方法、概念的推送方法、装置及设备。

技术介绍

[0002]学习资源中的知识概念间的依赖关系决定了每个资源在整个课程中学习顺序。当前主流的概念依赖关系挖掘方法是利用概念自身的特征进行依赖关系的识别。Talukdar和Cohen,提出了建模维基百科概念的先决结构的早期尝试。对于一对概念,作者使用超链接、编辑和页面内容来定义特征,然后使用MaxEnt分类器来推断概念之间的先决条件关系。Liang等人提出了一种基于超链接的方法来推断维基百科概念之间的先决条件关系。他们根据参考距离(RefD)计算先决条件,其中维基百科的超链接作为概念之间的“参考关系”。Zhou和Xiao创建了四组可进行先决条件发现的特征,包括基于链接的特征、基于类别的特征、基于内容的特征和基于时间的特征。
[0003]上述方法都是基于维基百科概念本身的特征进行概念依赖关系预测。Sayyadiharikandeh等人首次利用用户交互行为预测概念对间的依赖关系,但是,此方法的主要问题在于,用户日志所覆盖的维基百科概念对的比例过于偏低,我们无法利用它来预测大多数维基百科概念对间的依赖关系。所以,概念对之间依赖关系的识别准确率低是亟待解决的技术问题。

技术实现思路

[0004]本专利技术实施例提供了一种依赖识别模型的训练方法、概念的推送方法、装置及设备,解决了概念对之间依赖关系的识别准确率低的技术问题。
[0005]第一方面,本专利技术实施例提供了一种依赖识别模型的训练方法,包括:获取概念数据集,获取用户对所述概念数据集进行点击所产生的点击流数据;基于所述概念数据集,获取M组概念对;将所述M组概念对分别作为目标概念对,基于所述点击流数据获取所述目标概念对的N组特征值序列,并对所述目标概念对的N组特征值序列进行合并处理,以获取所述目标概念对的Y个特征值,所述目标概念对包括第一概念和第二概念,所述N组特征值序列表征所述第一概念和所述第二概念的依赖关系;基于所述M组概念对中每组概念对的Y个特征值训练二值分类器,以得到依赖识别模型。
[0006]结合本专利技术的第一方面,在一些实施方式下,所述基于所述点击流数据获取所述目标概念对的N组特征值序列,包括:通过分析所述点击流数据,获取所述目标概念对的第一组特征值序列,所述第一组特征值序列表征所述第一概念与所述第二概念的直接依赖关系;通过分析所述点击流数据,获取所述目标概念对的第二组特征值序列,所述第二组特征值序列表征所述第一概念的相关概念数据集与所述第二概念的依赖关系;通过分析所述点击流数据,获取所述目标概念对的第三组特征值序列,所述第三组特征值序列表征所述第二概念的相关概念数据集与所述第一概念的依赖关系;通过分析所述点击流数据,获取所
述目标概念对的第四组特征值序列,所述第四组特征值序列表征所述第一概念的相关概念数据集与所述第二概念的相关概念数据集的依赖关系。
[0007]结合本专利技术的第一方面,在一些实施方式下,所述对所述目标概念对的N组特征值序列进行合并处理,以获取所述目标概念对的Y个特征值,包括:根据所述目标概念对的N组特征值序列的特征值类型,对所述目标概念对的N组特征值序列进行重新分组,得到Y组特征值,所述Y组特征值中同一组内特征值的类型相同;对所述Y组特征值中E组特征值进行合并,得到E个特征值;对所述Y组特征值中F组特征值进行合并,得到F个特征值,所述F组特征值为二进制类型的数据,所述E组特征值为除所述F组特征值之外的特征值;基于所述E个特征值和所述F个特征值合成所述目标概念对的Y个特征值。
[0008]结合本专利技术的第一方面,在一些实施方式下,所述对所述Y组特征值中E组特征值进行合并,得到E个特征值,包括:确定多个权重系数;基于所述多个权重系数,对所述E组特征值中每组特征值分别进行合并运算,得到所述E个特征值。
[0009]结合本专利技术的第一方面,在一些实施方式下,所述对所述Y组特征值中F组特征值进行合并,得到F个特征值,包括:获取所述F组特征值中每组特征值的加和结果;基于所述F组特征值中每组特征值的加和结果,得到所述F个特征值。
[0010]结合本专利技术的第一方面,在一些实施方式下,所述基于所述F组特征值中每组特征值的加和结果,得到所述F个特征值,包括:如果所述F组特征值的第一组特征值的加和结果大于预设数值阈值,将所述F个特征值的第一个特征值赋值为1;如果所述F组特征值的第一组特征值的加和结果不大于所述预设数值阈值,将所述F个特征值的第一个特征值赋值为0。
[0011]第二方面,本专利技术实施例提供了一种概念的推送方法,包括:获取用户的当前学习概念;基于依赖识别模型处理所述当前学习概念,确定出用户的概念学习路径,所述学习路径包括所述当前学习概念的依赖概念,以及相对于所述依赖概念的依赖概念,所述依赖识别模型是基于第一方面中任一项所述的依赖识别模型的训练方法训练得到的;基于所述概念学习路径,响应于用户完成了所述当前学习概念,向用户推送需要进行学习的下一个概念。
[0012]结合本专利技术的第二方面,在一些实施方式下,在所述确定出用户的概念学习路径之后,还包括:基于所述概念学习路径,向用户一次性推送待学习的全部概念,以及所述待学习的全部概念的先后学习顺序的建议。
[0013]第三方面,本专利技术实施例提供了一种依赖识别模型的训练装置,包括:数据获取单元,用于获取概念数据集,获取用户对所述概念数据集进行点击所产生的点击流数据;概念对获取单元,用于基于所述概念数据集,获取M组概念对;特征值获取单元,用于将所述M组概念对分别作为目标概念对,基于所述点击流数据获取所述目标概念对的N组特征值序列,并对所述目标概念对的N组特征值序列进行合并处理,以获取所述目标概念对的Y个特征值,所述目标概念对包括第一概念和第二概念,所述N组特征值序列表征所述第一概念和所述第二概念的依赖关系;训练单元,用于基于所述M组概念对中每组概念对的Y个特征值训练二值分类器,以得到依赖识别模型。
[0014]第四方面,本专利技术实施例提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方
面和第二方面中任一项所述方法。
[0015]本专利技术实施例提供的一个或者多个技术方案,至少实现了如下技术效果或者优点:
[0016]本专利技术实施例通过获取概念数据集,获取用户对概念数据集进行点击所产生的点击流数据;基于概念数据集,获取M组概念对;将M组概念对分别作为目标概念对,基于点击流数据获取目标概念对的N组特征值序列,并对目标概念对的N组特征值序列进行合并处理,以获取目标概念对的Y个特征值,目标概念对包括第一概念和第二概念,N组特征值序列表征第一概念和第二概念的依赖关系;基于M组概念对中每组概念对的Y个特征值训练二值分类器,以得到依赖识别模型。通过训练后的依赖识别模型可以识别概念对之间的依赖关系,所以,提高了概念对之本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种依赖识别模型的训练方法,其特征在于,包括:获取概念数据集,获取用户对所述概念数据集进行点击所产生的点击流数据;基于所述概念数据集,获取M组概念对;将所述M组概念对分别作为目标概念对,基于所述点击流数据获取所述目标概念对的N组特征值序列,并对所述目标概念对的N组特征值序列进行合并处理,以获取所述目标概念对的Y个特征值,所述目标概念对包括第一概念和第二概念,所述N组特征值序列表征所述第一概念和所述第二概念的依赖关系;基于所述M组概念对中每组概念对的Y个特征值训练二值分类器,以得到依赖识别模型。2.根据权利要求1所述的依赖识别模型的训练方法,其特征在于,所述基于所述点击流数据获取所述目标概念对的N组特征值序列,包括:通过分析所述点击流数据,获取所述目标概念对的第一组特征值序列,所述第一组特征值序列表征所述第一概念与所述第二概念的直接依赖关系;通过分析所述点击流数据,获取所述目标概念对的第二组特征值序列,所述第二组特征值序列表征所述第一概念的相关概念数据集与所述第二概念的依赖关系;通过分析所述点击流数据,获取所述目标概念对的第三组特征值序列,所述第三组特征值序列表征所述第二概念的相关概念数据集与所述第一概念的依赖关系;通过分析所述点击流数据,获取所述目标概念对的第四组特征值序列,所述第四组特征值序列表征所述第一概念的相关概念数据集与所述第二概念的相关概念数据集的依赖关系。3.根据权利要求1所述的依赖识别模型的训练方法,其特征在于,所述对所述目标概念对的N组特征值序列进行合并处理,以获取所述目标概念对的Y个特征值,包括:根据所述目标概念对的N组特征值序列的特征值类型,对所述目标概念对的N组特征值序列进行重新分组,得到Y组特征值,所述Y组特征值中同一组内特征值的类型相同;对所述Y组特征值中E组特征值进行合并,得到E个特征值;对所述Y组特征值中F组特征值进行合并,得到F个特征值,所述F组特征值为二进制类型的数据,所述E组特征值为除所述F组特征值之外的特征值;基于所述E个特征值和所述F个特征值合成所述目标概念对的Y个特征值。4.根据权利要求3所述的依赖识别模型的训练方法,其特征在于,所述对所述Y组特征值中E组特征值进行合并,得到E个特征值,包括:确定多个权重系数;基于所述多个权重系数,对所述E组特征值中每组特征值分别进行合并运算,得到所述E个特征值...

【专利技术属性】
技术研发人员:肖奎陈昊左壮崔海波胡成
申请(专利权)人:湖北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1