一种自动识别用户阅读兴趣区的方法技术

技术编号：14081180 阅读：100 留言：0更新日期：2016-11-30 17:36

本发明专利技术公开了一种自动识别用户阅读兴趣区的方法，通过眼动仪实时抓取用户阅读时的访问时间、注视次数、瞳孔直径等指标，并结合利用回视次数的关系矩阵，自动挖掘用户阅读的关注点和兴趣所在。本发明专利技术提高了用户阅读兴趣识别的准确度和针对性，可应用于识别用户的阅读兴趣，从而给用户更准确地推送其所感兴趣的阅读内容。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于用户心理学和信息学领域，具体涉及基于用户阅读心理和阅读行为分析的用户兴趣发现技术。
技术介绍
用户对内容的关注点或兴趣，体现为他们某一方面的需求。Cho-Wei Shih等提出的信息需求雷达模型，量化了内容的需求程度。为帮助用户区分关注点，方便阅读，国家知识产权局在专利文献查看页面中，利用了高亮、高密、聚焦功能；针对用户兴趣的表达，缪涵琴开发出融合本体和用户兴趣的专利信息检索系统，并设计了专利检索领域本体、国际专利分类表和用户兴趣模型的本体表示。眼动技术是一种可靠、有效的方法，可分析读者在阅读过程中的注意力分配情况。浏览、访问或阅读中的眼动研究可充分挖掘用户潜在需求，其已在网站可用性、软硬件测试、教学研究、交互研究[20]及广告研究等方面得到广泛的应用。现有研究往往通过用户浏览点击下载等来发现有用户的阅读兴趣，也有仅利用用户阅读过程中注视、凝视时间指标来计算用户的阅读兴趣，不能很好地挖掘用户的兴趣和需求所在，缺少一个一般地有效准确地识别用户阅读兴趣区的方法。本专利技术为国家自然科学基金青年项目“专利文献的要素组合拓朴结构及向量空间语义表示与相似度计算研究”(项目编号：71403107)，中国博士后科学基金第七批特别资助项目“综合位置和语义的专利文献核函数构造及相似度计算研究”(项目编号：2014T70491)的研究成果之一。
技术实现思路
本专利技术的目的在于提供一种自动识别用户阅读兴趣区的方法，为用户阅读兴趣区的识别提供一般方法，并提高识别的精准率和召回率。一种自动识别用户阅读兴趣区的方法，其特征在于包括以下步骤：步骤一，采集用户阅读过程中眼...

【技术保护点】
一种自动识别用户阅读兴趣区的方法，其特征在于包括以下步骤：步骤一，采集用户阅读过程中眼动行为数据；步骤二，清洗眼动行为数据基于眼动速度识别的基准值算法，I‑VT处理工具自动将原始数据处理成注视点；当阅读区域变换的移动速度低于基准值30°/s时，数据被标记成注视点；系统将高于持续时间基准值60ms的注视点保留下来用于做进一步的分析，将低于持续时间基准值60ms的注视点去除不用于识别；利用Tobii眼动仪自动根据将眼动行为数据中对瞳孔信息的识别准确度进行标识：代码0为准确值、代码1为估计值、代码2表示不确定值、代码3为数据缺失；剔除代码2、代码3所对应的数据值，只保留代码0和代码1对应的眼动行为数据，得清洗后的眼动行为数据；步骤三，确定阅读眼动行为指标：相对访问时间、相对注视次数、瞳孔直径缩放比；步骤四，计算所述阅读眼动行为指标权重；步骤五，利用所述清洗后的眼动行为数据、阅读眼动行为指标、阅读眼动行为指标权重，计算用户对阅读区域的兴趣度；步骤六，根据所述兴趣度的大小范围，判别用户感兴趣的阅读区域，从而识别用户阅读兴趣区，分为高兴趣区、一般兴趣区、低兴趣区。

【技术特征摘要】
1.一种自动识别用户阅读兴趣区的方法，其特征在于包括以下步骤：步骤一，采集用户阅读过程中眼动行为数据；步骤二，清洗眼动行为数据基于眼动速度识别的基准值算法，I-VT处理工具自动将原始数据处理成注视点；当阅读区域变换的移动速度低于基准值30°/s时，数据被标记成注视点；系统将高于持续时间基准值60ms的注视点保留下来用于做进一步的分析，将低于持续时间基准值60ms的注视点去除不用于识别；利用Tobii眼动仪自动根据将眼动行为数据中对瞳孔信息的识别准确度进行标识：代码0为准确值、代码1为估计值、代码2表示不确定值、代码3为数据缺失；剔除代码2、代码3所对应的数据值，只保留代码0和代码1对应的眼动行为数据，得清洗后的眼动行为数据；步骤三，确定阅读眼动行为指标：相对访问时间、相对注视次数、瞳孔直径缩放比；步骤四，计算所述阅读眼动行为指标权重；步骤五，利用所述清洗后的眼动行为数据、阅读眼动行为指标、阅读眼动行为指标权重，计算用户对阅读区域的兴趣度；步骤六，根据所述兴趣度的大小范围，判别用户感兴趣的阅读区域，从而识别用户阅读兴趣区，分为高兴趣区、一般兴趣区、低兴趣区。2.根据权利要求1所述的一种自动识别用户阅读兴趣区的方法，其特征在于所述阅读眼动行为指标还包括相对回视次数；用户对阅读区域x的相对回视次数ri为该用户对阅读区域x与阅读区域y之间的回视次数，r为该用户对阅读区域所有的回视次数，I′y为该用户对阅读区域y不考虑回视次数时的兴趣度，q为该用户对阅读区域x有回视关系的其他阅读区域数；所述回视次数为：眼跳是注视之间飞快的扫视动作；所述回视是指回溯性的眼跳，是指用户在对阅读区域的第一遍注视后，对该阅读区域进行再阅读；用回溯性的眼跳和眼跳路线揭示用户对所述阅读区域的内容对照和兴趣联系的情况；所述回视次数包括回视出次数和回视入次数；所述回视出次数指注视点从所述阅读区域移出到其它区域的次数；回视入次数指注视点从其它区域移入到所述阅读区域的次数。3.根据权利要求1所述的一种自动识别用户阅读兴趣区的方法，其特征在于所述步骤一的具体过程如下：利用TobiiStudio眼动仪记录用户阅读过程中眼动行为，所述眼动行为数据包括刺激材料名称、记录的时间、阅读区域面积、总访问时间、注视点、注视次数、左瞳孔直径、右瞳孔直径、左瞳孔有效性、右瞳孔有效性、眼动事件的持续时间、Hit；所述Hit表示阅读区域激活及注视点在该阅读区域情况：0代表阅读区域被激活，但注视点未在阅读区域内，1代表阅读区域被激活且注视点在阅读区域内；所述注视点为当所述眼动的速度低于基准值30°/s时，所述眼动的数据被标记成注视点。4.根据权利要求1所述的一种自动识别用户阅读兴趣区的方法，其特征在于步骤三中所述的访问时间为：从首次注视阅读区域至注视移出该区的时间片段，统计阅读区域中的所有注视点的持续时间之和，包含回视时间；用户对阅读区域x的相对访问时间t为所述用户对阅读区域x的总访问时间，Sx为阅读区域x的面积，用像素表示，t′为该用户对所有阅读区域的单位面积访问时间之和，即k为阅读区域总数；所述的注视次数为：各阅读区域内的所述注视点的个数表示用户在该阅读区域的注视次数；当用户眼球对注视的内容加工结束时，出现眼跳，开始下一次注视；利用注视次数反映用户阅读的熟练程度、加工策略以及阅读材料对用户的难易程度，估计用户阅读兴趣；注视点即信息块，信息块愈多表明用户关注的机会愈多、理解的可能性愈大；用户对阅读区域x的相对注视次数c为用户对阅读区域x的注视次数，c′为该用户对所有阅读区域的单位面积注视次数之和，即所述瞳孔直径缩放比为：将用户在某一阅读区域内所有注视点的瞳孔直径的平均值作为平均瞳孔直径；所述的瞳孔直径是用户左眼瞳孔直径和右眼瞳孔直径的平均；将所述阅读区域内的平均瞳孔直径除以该阅读区域所在整篇阅读对象内的平均瞳孔直径，作为所述阅读区域的瞳孔直径缩放比；用户对阅读区域x的瞳孔直径缩放比e为用户在阅读区域x的平均瞳孔直径，e′为用户在阅读区域x的总的平均瞳孔直径。5.根据权利要求1所述的一种自动识别用户阅读兴趣区的方法，其特征在于所述步骤四中阅读眼动行为指标权重计算具体过程如下：过程一，建立模糊互补矩阵F＝(fij)n×n f i j = 0.5 s ( i ) = s ( j ) 1.0 s ( ...

【专利技术属性】
技术研发人员：袁银池，王秀红，倪华，张梦雅，
申请(专利权)人：江苏大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人