当前位置: 首页 > 专利查询>魏骁勇专利>正文

基于图形式上下文语境和机器学习的单词记忆方法及其装置制造方法及图纸

技术编号:8722013 阅读:215 留言:0更新日期:2013-05-22 14:52
本发明专利技术涉及由机器辅助进行的外语学习领域,提供了一种基于上下文语境和机器学习的单词记忆方法及其装置。该系统有两个特点:1.能将每个单词的同义词、反义词、近似词、以及重要程度自动地以图形方式呈现出来,从而为每个单词构建一个上下文相关(Context Related)的语境,帮助用户进行更形象直观的单词记忆;2.该系统能自动地识别用户的记忆能力、记忆周期、以及弱项单词(用户最不容易记住的单词),从而自动地为用户选择需要记忆的单词和制定复习的日程表,达到高效率的记忆。经过40个用户2年的测试表明,使用该系统的用户的年均单词记忆量达到1万个以上,年最高单词记忆量为3万个。

【技术实现步骤摘要】

本专利技术涉及由机器辅助进行的外语学习领域,提供了一种基于上下文语境和机器学习的单词记忆方法及其装置。
技术介绍
目前的主流单词记忆系统通常都是以文字的方式来表达单词的意思,忽悠了把单词放在语境下记忆才更加有效这个语言学学者已经得出很多年的结论。本系统采用直观的图形方式对单词的语境进行表达,能更好地帮助用户进行形象的记忆。另外,目前的主流的智能单词记忆系统都是根据Hermann Ebbinghaus遗忘曲线进行开发的。然而,HermannEbbinghaus遗忘曲线是1886年根据Hermann Ebbinghaus本人对一组无意义的符号进行记忆得到的模型。所以模型本身只代表Hermann Ebbinghaus本人的记忆能力,忽略了各个用户之间记忆能力的差异。并且,其记忆对象是无意义的符号,没有考虑各单词在实际使用中的重要程度。本系统综合考虑了用户差异和单词差异,因而可以让单词记忆更加有效和更加有针对性。
技术实现思路
本专利技术的目的在于提供一种能够自动地为用户选择需要记忆的单词和制定复习的日程表,达到高效率的记忆的基于图形式上下文语境和机器学习的单词记忆方法及其装置。为实现上述目的本专利技术采用以下技术方案: 一种基于上下文语境和机器学习的单词记忆方法,其特征在于包括以下步骤: O查询不理解单词; 2)系统调用已学习好的数据库,找到所查单词的同义词、反义词、近似词以及重要程度,并以图形化的语境方式展示给用户; 3)将单词加入生词本; 4)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需复习的单词,并提供图形化的复习界面; 5)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需测试的单词,并提供图形化的测试界面; 6)系统根据用户在复习和测试中的表现,使用逻辑回归(LogisticRegression)技术自动识别用户的记忆能力、记忆周期、以及弱项单词,作为每次复习和测试的参考。上述方案中,所述步骤2中数据库的学习采用处理步骤包括: 21)搜集文章; 22)结合现有字典,对每个单词的出现的同义词、反义词、近似词进行记录; 23)搜集考题集合;24)对每个单词的出现的同义词、反义词、近似词进行筛选,保留常用的、容易被作为考点的单词,同时按照以下公式估计每个单词在各项考试中的重要程度,本文档来自技高网...

【技术保护点】
一种基于上下文语境和机器学习的单词记忆方法,其特征在于包括以下步骤:1)查询不理解单词;2)系统调用已学习好的数据库,找到所查单词的同义词、反义词、近似词以及重要程度,并以图形化的语境方式展示给用户;3)将单词加入生词本;4)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需复习的单词,并提供图形化的复习界面;5)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需测试的单词,并提供图形化的测试界面;6)系统根据用户在复习和测试中的表现,使用逻辑回归技术自动识别用户的记忆能力、记忆周期、以及弱项单词,作为每次复习和测试的参考。

【技术特征摘要】
1.一种基于上下文语境和机器学习的单词记忆方法,其特征在于包括以下步骤: 1)查询不理解单词; 2)系统调用已学习好的数据库,找到所查单词的同义词、反义词、近似词以及重要程度,并以图形化的语境方式展示给用户; 3)将单词加入生词本; 4)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需复习的单词,并提供图形化的复习界面; 5)在用户需要时,系统根据用户的记忆能力、记忆周期、已经弱项单词为其选择所需测试的单词,并提供图形化的测试界面; 6)系统根据用户在复习和测试中的表现,使用逻辑回归技术自动识别用户的记忆能力、记忆周期、以及弱项单词,作为每次复习和测试的参考。2.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆方法,其特征在于:所述步骤2中数据库的学习采用处理步骤包括: 21)搜集文章; 22)结合现有字典,对每个单词的出现的同义词、反义词、近似词进行记录; 23)搜集考题集合; 24)对每个单词的出现的同义词、反义词、近似词进行筛选,保留常用的、容易被作为考点的单词,同时按照以下公式估计每个单词在各项考试中的重要程度,tRtp (x) - rt + Sy(X).ci + Ant(X).β + Ana(x) - γΙπιη χ)=--;-1ginmeimx) ■ φ )■ 公式中ImpO为当单词的重要程度,RepO为当前单词在各项考试中出现的频率,SyO为同义词个数,AntO为反义词个数,AnaO为相似词个数,Novelty O为该单词最后一次在考试中出现的时间距当前时间的跨度,CC, β Υ,π, φ为一组平衡的系数,该组系数在数据库的基础上使用逻辑回归技术通过计算机自动学习到。3.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆方法,其特征在于:所述步骤2中图形化的复习界面的图形化语境展示方法采用处理步骤包括: 31)查询步骤2中所述的数据库,获得每个单词的同义词、反义词、近似词、并计算其重要程度: 32)以当前单词为中心,将其同义词、反义词、近似词按照重要程度由内至外、同时上至下以环状分布在当前单词周围形成一个图形化的语境,以达到直观记忆的目的。4.根据权利要求1所述的一种基于上下文语境和机器学习的单词记忆系统,其特征在于:所述步骤4中选择所需复习的单词采用处理步骤包括: 41)按以下公式计算每个单词的需复习权重Rew(X), Iiwp(X) * Ca) + For...

【专利技术属性】
技术研发人员:魏骁勇杨震群
申请(专利权)人:魏骁勇
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1