一种基于用户眼球的单词查询方法技术

技术编号:11938619 阅读:72 留言:0更新日期:2015-08-26 09:56
本发明专利技术涉及一种基于用户眼球的单词查询方法,包括以下步骤:1)判断用户初始词汇量;2)计算用户眼球区域时间;3)根据用户眼球在该区域停留的时间和用户的词汇量判断用户不认识的单词并列表;4)用户阅读完后,对列表中的单词进行筛选,选出陌生单词并分类。通过眼睛定位屏幕区域的时间来推测用户是否在该屏幕区域中有陌生词,不需要通过鼠标移动到该区域来,以方便用户阅读的连贯性和便捷性。

【技术实现步骤摘要】

本专利技术设及属于模式分类、计算机视觉领域,具体设及一种基于用户眼球的单词 查询方法。
技术介绍
当今社会信息化发展的今天,人们在电脑上阅读的习惯也越来越普遍。而我们阅 读的内容的多样化的同时也产生了很多需求,比如一个非英语作为其母语的学生在阅读英 文类的书籍是难免会发生不认识的单词的情况。对于该样一种情形,在互联网发达的今天 已经有了很多的电子词典软件辅助我们查阅陌生单词提高我们的效率。就我们目前的情况 而言,已经成熟并大量投入使用的词典有金山词霸,有道词典,灵格斯词霸等等。它们目前 的查询方式有W下几个;通过键盘输入单词查询方式,通过鼠标指针移动取词查询方式。其 中第二种查找方式为用户的查询提供了很大的便捷性,备受广大用户喜爱。但是该种方式 也有其缺点,第一当我们发现又不认识的单词时,必须将鼠标指针移动到该单词的位置,该 还是比较麻烦;第二当我们的鼠标指针不小屯、落到一个认识的单词上时,它也会出现该单 词的释义,从而挡住了其他单词的位置,使我们在阅读时不得不把鼠标的位置摆放到一个 特定的区域,W免影响到我们阅读的连贯性。
技术实现思路
本专利技术的目的在于克服上述现有技术中存在的缺点,提供一种基于用户眼球的单 词查询方法,具有方便快捷的优点。 为实现上述目的,本专利技术采用W下技术方案;包括W下步骤: 1)判断用户初始词汇量; 2)计算用户眼球区域时间; 3)根据用户眼球在该区域停留的时间和用户的词汇量判断用户不认识的单词并 列表;[000引 4)用户阅读完后,对列表中的单词进行筛选,选出陌生单词并更新分类器。 所述的1)判断用户初始词汇量的具体方法为: (1-1)通过录入若干相关度高的英语文章,统计每个常用单词的词频; (1-。对统计出来的词频进行排序;[001引 (1-扣将出现频率高的词库录入词典中; (1-4)对每个词库我们随机抽取单词作为该词库的样本单词; (l-W根据用户填写自己的个人信息后,我们将对应词库的样本单词给用户,让其 进行判断,根据其答题情况,通过决策树算法判断出用户的词汇量; (1-6)判断出用户词汇量后,将用户的正确率统计出来,通过第二步的单词频率, 推断出用户在该词汇量下对单词的掌握程度。 所述的2)计算用户眼球区域时间的具体方法为: (2-1)定义电脑屏幕分为m*n个区域,每个区域Area;用(Xbi,Ybi,Xei,Yei)表示;[001引 (2-。用电脑摄像头拍摄用户脸部,通过Viola人脸检测器检测出人脸位置; (2-3)对人脸位置区域进行图像去噪预处理操作; (2-4)利用AAM人脸模型找到人眼球中屯、坐标,通过坐标映射算法算出人眼注视 在屏幕的区域(Area,)和当前注视的时刻t; (2-5)通过在一个区域Area,内计算当前注视时刻的最大值和最小值算眼球在该 区域内的注视时间。 所述3)根据用户眼球在该区域停留的时间判断用户不认识的单词并列表的方式 为;当用户该注视时间大于设定的阔值时提取该区域内的单词。 所述选4)选出陌生单词的方法为: (4-1)通过上一步所知道的用户的区域我们将该区域内所有的单词提取出来; (4-2)依靠用户的词汇量,利用我们之前训练好的一个分类模型将该区域内所有 的单词进行分类; (4-3)对分类的结果为陌生词的单词进行词典查找为用户列出该单词的释义列 表。 所述4)中选出陌生单词的方法为;分类用户的陌生词和已知词选取的特征为单 词的词频和其长度还有单词之间的相似度作为特征,训练SVM分类器判断用户所注视区域 内的所有单词是否有用户的陌生词。[002引所述训练SVM分类器的训练步骤为: (5-1)通过logistic函数将特征值归一化【主权项】1. ,其特征在于:包括以下步骤: 1) 判断用户初始词汇量; 2) 计算用户眼球区域时间; 3) 根据用户眼球在该区域停留的时间和用户的词汇量判断用户不认识的单词并列 表; 4) 用户阅读完后,对列表中的单词进行筛选,选出陌生单词并更新分类器。2. 根据权利要求1所述的,其特征在于:所述的1) 判断用户初始词汇量的具体方法为: (1-1)通过录入若干相关度高的英语文章,统计每个常用单词的词频; (1-2)对统计出来的词频进行排序; (1-3)将出现频率高的词库录入词典中; (1-4)对每个词库我们随机抽取单词作为该词库的样本单词; (1-5)根据用户填写自己的个人信息后,我们将对应词库的样本单词给用户,让其进行 判断,根据其答题情况,通过决策树算法判断出用户的词汇量; (1-6)判断出用户词汇量后,将用户的正确率统计出来,通过(1-2)的单词频率,推断 出用户在该词汇量下对单词的掌握程度。3. 根据权利要求1所述的,其特征在于:所述的2) 计算用户眼球区域时间的具体方法为: (2-1)定义电脑屏幕分为m*n个区域,每个区域八^81用(XbDYbDX e^YeJ表示; (2-2)用电脑摄像头拍摄用户脸部,通过Viola人脸检测器检测出人脸位置; (2-3)对人脸位置区域进行图像去噪预处理操作; (2-4)利用AAM人脸模型找到人眼球中心坐标,通过坐标映射算法算出人眼注视在屏 幕的区域(Areai)和当前注视的时刻t ; (2-5)通过在一个区域Areai内计算当前注视时刻的最大值和最小值算眼球在该区域 内的注视时间。4. 根据权利要求1所述的,其特征在于:所述3)根 据用户眼球在该区域停留的时间判断用户不认识的单词并列表的方式为:当用户该注视时 间大于设定的阈值时提取该区域内的单词。5. 根据权利要求1所述的,其特征在于:所述选4) 选出陌生单词的方法为: (4-1)通过上一步所知道的用户的区域我们将该区域内所有的单词提取出来; (4-2)依靠用户的词汇量,利用我们之前训练好的一个分类模型将该区域内所有的单 词进行分类; (4-3)对分类的结果为陌生词的单词进行词典查找为用户列出该单词的释义列表。6. 根据权利要求1所述的,其特征在于:所述4)中 选出陌生单词的方法为:分类用户的陌生词和已知词选取的特征为单词的词频和其长度还 有单词之间的相似度作为特征,训练SVM分类器判断用户所注视区域内的所有单词是否有 用户的陌生词。7. 根据权利要求6所述的,其特征在于:所述训练 SVM分类器的训练步骤为: (5-1)通过logistic函数将特征值归一化(5-5)选择真阳性率(true positive rate, TPR)从而确定向量机参数进行训练; (5-6)将用户所注视区域的单词输入训练模型进行计算,将所得结果与模型的参数进 行比较,当误差值小于定义的误差时,则判定该单词为陌生词,否则为已知词。8.根据权利要求1所述的,其特征在于:所述4)完 成后,用于对用户将该列表中认识的单词打钩,然后提交;系统根据该列表的内容,生成新 的训练数据对我们的分类模型进一步的训练;更新分类器以供用户的下一次使用。【专利摘要】本专利技术涉及,包括以下步骤:1)判断用户初始词汇量;2)计算用户眼球区域时间;3)根据用户眼球在该区域停留的时间和用户的词汇量判断用户不认识的单词并列表;4)用户阅读完后,对列表中的单词进行筛选,选出陌生单词并分类。通过眼睛定位屏幕区域的时间来推测本文档来自技高网...
一种<a href="http://www.xjishu.com/zhuanli/55/CN104866470.html" title="一种基于用户眼球的单词查询方法原文来自X技术">基于用户眼球的单词查询方法</a>

【技术保护点】
一种基于用户眼球的单词查询方法,其特征在于:包括以下步骤:1)判断用户初始词汇量;2)计算用户眼球区域时间;3)根据用户眼球在该区域停留的时间和用户的词汇量判断用户不认识的单词并列表;4)用户阅读完后,对列表中的单词进行筛选,选出陌生单词并更新分类器。

【技术特征摘要】

【专利技术属性】
技术研发人员:惠维张哲蒋志平韩劲松魏尧赵季中
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1