基于强化学习的自适应移动学习路径生成方法技术

技术编号:21800212 阅读:74 留言:0更新日期:2019-08-07 10:46
基于强化学习的自适应移动学习路径生成方法,涉及教育技术领域和强化学习领域,解决现有移动学习领域中学习资源多、学习需求杂、学习选择困难、学习收益不稳定等问题,获取学习环境和学习者的契合度、生成学习资源有向图;根据生成的学习资源有向图和学习收益值R,初始化学习选择收益表LSRT;然后根据学习收益值和计算结果值等更新学习选择收益表LSRT,最终生成生成学习路径推荐队列。本发明专利技术所述的自适应移动学习路径生成方法,能够使学习在繁杂的学习资源中根据自身的学习需求自动生成最佳的学习序列,解决移动学习领域学习资源多、学习需求杂、学习选择困难和学习收益不稳定等问题。

An Adaptive Mobile Learning Path Generation Method Based on Reinforcement Learning

【技术实现步骤摘要】
基于强化学习的自适应移动学习路径生成方法
本专利技术涉及教育
和强化学习领域,具体涉及一种基于强化学习的自适应移动学习路径生成方法。
技术介绍
随着移动学习领域的拓展和移动学习资源、需求的增加,学习者希望在移动学习中高效地利用学习资源,快速高质量的完成学习。但海量无序的学习资源,让更多的学习者在选择时不知所措,所以有必要提出一种个性化自适应移动学习路径生成方法,能够根据移动学习环境、学习者特征和学习效果素自动推荐学习资源序列,并获得最大的学习收益。
技术实现思路
本专利技术为了解决移动学习环境中存在的学习资源多、学习需求杂、学习选择困难等问题,提供一种基于强化学习的自适应移动学习路径生成方法。一种基于强化学习的自适应移动学习路径生成方法,由以下步骤实现:步骤一、获取学习环境和学习者的契合度LeLF,用下式计算为:LeLF=EW*LeLFE+SW*LeLFS+TW*LeLFT式中,LeLFS为社会和学习者契合度,LelFT为技术和学习者契合度,LeLFE为教育和学习者契合度,EW为教育权重,SW为社会权重,TW为技术权重;学习者选择学习资源并获得学习收益值R,用下式计算为:R=FW*本文档来自技高网...

【技术保护点】
1.一种基于强化学习的自适应移动学习路径生成方法,其特征是:该方法由以下步骤实现:步骤一、获取学习环境和学习者的契合度LeLF,用下式计算为:LeLF=EW*LeLFE+SW*LeLFs+TW*LeLFT式中,LeLFs为社会和学习者契合度,LelFT为技术和学习者契合度,LeLFE为教育和学习者契合度,EW为教育权重,SW为社会权重,TW为技术权重;学习者选择学习资源并获得学习收益值R,用下式计算为:R=FW*LeLF+LW*LE式中FW为契合度权重,LW为效果权重,LE为学习者选择并学习资源后的学习效果;步骤二、生成学习资源有向图;分析并学习资源的先后顺序,生成学习资源有向图;学习资源有向...

【技术特征摘要】
1.一种基于强化学习的自适应移动学习路径生成方法,其特征是:该方法由以下步骤实现:步骤一、获取学习环境和学习者的契合度LeLF,用下式计算为:LeLF=EW*LeLFE+SW*LeLFs+TW*LeLFT式中,LeLFs为社会和学习者契合度,LelFT为技术和学习者契合度,LeLFE为教育和学习者契合度,EW为教育权重,SW为社会权重,TW为技术权重;学习者选择学习资源并获得学习收益值R,用下式计算为:R=FW*LeLF+LW*LE式中FW为契合度权重,LW为效果权重,LE为学习者选择并学习资源后的学习效果;步骤二、生成学习资源有向图;分析并学习资源的先后顺序,生成学习资源有向图;学习资源有向图的节点为学习资源,节点之间的有向线段表示学习者从当前学习资源选择下一个学习资源;步骤三、根据步骤二生成的学习资源有向图和步骤一的学习收益值R,初始化学习选择收益表LSRT;所述学习选择收益表LSRT为n*n的邻接矩阵,所述n为学习资源的数量,矩阵中的值用Rij表示,当Rij为-1时,表示第i个学习资源和第j个学习资源不联通,当Rij大于-1时,表示第i个学习资源和第j个学习资源联通,当前学习者在学习完第i个资源后,选择第j个资源进行学习的学习收益值;步骤四、初始化迭代次数N、初始化学习目标值D、学习速率SS、贪婪系数Gr、折扣因子Dc、学习路径推荐队列LPRQ;步骤五、初始化当前...

【专利技术属性】
技术研发人员:任维武底晓强郑燕林从立钢杨明刘名扬
申请(专利权)人:长春理工大学
类型:发明
国别省市:吉林,22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1