一种现实场景下的阅读综合行为的识别方法及系统技术方案

技术编号：26172373 阅读：38 留言：0更新日期：2020-10-31 13:49

本发明专利技术涉及阅读综合行为识别的技术领域，提供了一种现实场景下的阅读综合行为的识别方法及系统，其方法包括：S1：获取真实阅读场景下的信息载体图像；S2：对信息载体图像进行定位和边缘位置检测，对书本内部的图像内容进行检测，实现对翻页行为的识别；S3：针对页面范围内的信息进行随机采样，对候选焦点语言特征点图片组进行综合分析，实现对焦点页面语言的识别；S4：对行的信息进行定位，获得行数和每一行的行宽，估算出每一行的文字数量和页面内的文字总数量；S5：获取两次翻页事件之间的时间间隔内阅读文字的总数量，计算出单位时间内的阅读文字总量。能够对读者的阅读行为，尤其是针对于阅读纸质书本的阅读行为进行实时的分析。

全部详细技术资料下载

【技术实现步骤摘要】
一种现实场景下的阅读综合行为的识别方法及系统
本专利技术涉及阅读综合行为识别的
，尤其涉及一种现实场景下的阅读综合行为的识别方法及系统。
技术介绍
在当前的人工智能
中，人类在阅读书本时，经常会与人工智能进行交互，以利于通过书本进行学习时，能够学习理解的更快，人工智能也能够对人类的阅读行为进行分析，后续推荐一个与读者更加适应的学习计划。此时，就涉及到需要对读者的阅读行为进行分析，在现有技术中，并没有找到一种合适的方法能够识别并分析读者的阅读行为。市面上，能够分析读者阅读行为的应用背景，基本上都是基于电子阅读设备来提供给读者进行阅读，通过电子设备阅读的记录来分析阅读行为。然而，很多时候，我们还是需要通过传统的纸质书本进行阅读学习，如何分析纸质书本的阅读行为，就很难了。在“CN103186665A-一种纸质图书数字化辅助阅读软件”中，公开：“提出了一种纸质图书数字化辅助阅读软件。通过该软件的使用可以减少实体书签的使用，以及实体书签丢失带来的不便；可以为图书添加更为丰富的书签、并能够对书签进行检...

【技术保护点】
1.一种现实场景下的阅读综合行为的识别方法，其特征在于，包括以下步骤：/nS1：通过包括摄像头在内的AI设备获取真实阅读场景下的信息载体图像，并对所述信息载体图像进行深度神经网络学习获得所述信息载体图像的载体类型，当所述载体类型为书本时，跳转到步骤S2，否则，终止阅读综合行为的识别；/nS2：通过对所述AI设备获取的连续的所述信息载体图像使用页面监控的静态图像深度学习神经网络进行定位和边缘位置检测，使用可以进行时间序列处理的深度学习神经网络对书本范围内部的图像内容进行检测，实现对翻页行为的识别；/nS3：针对页面范围内的信息进行随机采样，作为候选焦点语言特征点图片组，对所述候选焦点语言特征点图...

【技术特征摘要】
1.一种现实场景下的阅读综合行为的识别方法，其特征在于，包括以下步骤：
S1：通过包括摄像头在内的AI设备获取真实阅读场景下的信息载体图像，并对所述信息载体图像进行深度神经网络学习获得所述信息载体图像的载体类型，当所述载体类型为书本时，跳转到步骤S2，否则，终止阅读综合行为的识别；
S2：通过对所述AI设备获取的连续的所述信息载体图像使用页面监控的静态图像深度学习神经网络进行定位和边缘位置检测，使用可以进行时间序列处理的深度学习神经网络对书本范围内部的图像内容进行检测，实现对翻页行为的识别；
S3：针对页面范围内的信息进行随机采样，作为候选焦点语言特征点图片组，对所述候选焦点语言特征点图片组进行综合分析，实现对焦点页面语言的识别，同时输出每一个单字或单词的宽度尺寸；
S4：通过处理静态图像的深度学习神经网络对行的信息进行定位，获得行数和每一行的行宽，与步骤S3中输出的每一个单字或单词的宽度尺寸进行计算，估算出每一行的文字数量和页面内的文字总数量，实现焦点页面内文字总量的分析；
S5：获取两次翻页事件之间的时间间隔内阅读文字的总数量，计算出单位时间内的阅读文字总量，实现阅读速度的分析。

2.根据权利要求1所述的现实场景下的阅读综合行为的识别方法，其特征在于，在步骤S2中，实现对翻页行为的识别，具体为：
S21：在连续的所述AI设备获取的所述信息载体图像中，通过所述页面监控的静态图像深度学习神经网络对所述信息载体图像进行定位和边缘位置检测，实现书本的尺寸和位置信息的实时更新，其中，所述位置信息包括左右边缘和书中缝线，所述左右边缘包括书本的真实边缘和所述AI设备视界的边缘在内的任意一种形式；
S22：默认翻页行为发生位置为书本的左边缘和右边缘，使用所述可以进行时间序列处理的深度学习神经网络对书本范围内部的图像内容进行检测，当书本从左边缘改变页面内容时，翻页行为被检测为向上一页翻，当书本从右边缘改变页面内容时，翻页行为被检测为向下一页翻；
S23：在所述可以进行时间序列处理的深度学习神经网络工作完成之后，所述页面监控的静态图像深度学习神经网络持续工作，确认页面与翻页动作发生之前产生了明确的区别，确认翻页动作。

3.根据权利要求1所述的现实场景下的阅读综合行为的识别方法，其特征在于，在步骤S3中，实现对焦点页面语言的识别，具体为：
S31：对页面范围内的信息进行随机采样，随机采样后的数据作为所述候选焦点语言特征点图片组；
S32：使用图像文字切割深度学习神经网络对所述候选焦点语言特征点图片组进行逐一切割，获得候选语言文本图像组，同时输出每一个单字或单词的宽度尺寸；
S33：使用图像文本识别深度学习神经网络对所述候选语言文本图像组进行分类，获得文本的具体内容，从而获得焦点页面的目标语言候选信息；
S34：在获得多页面、多点位候选信息之后，进行综合分析以确认书本中所含有的语言的总数量，确定文本中的主题语言和其他占比大的语言种类。

4.根据权利要求1所述的现实场景下的阅读综合行为的识别方法，其特征在于，在步骤S4中，实现焦点页面内文字总量的分析，具体为：
S41：针对于焦点页面语言的识别方案进行分析，获取书本的主题语言；
S42：使用所述处理静态图像的深度学习神经网络对行的信息进行定位，获得行数和每一行的行宽；
S43：与焦点页面语言的识别中输出的每一个单字或单词的宽度尺寸进行计算，估算出每一行的文字数量，进一步计算出页面内的文字总数量。

5.根据权利要求1所述的现实场景下的阅读中和行为的识别方法，其特征在于，在步骤S5中，实现阅读速度的分析，具体为：
S51：通过翻页行为识别到两次翻页事件，计算出两次翻页事件之间的时间间隔；
S52：通过焦点页面内文字总量的分析获得页面内的文字总量；
S53：计算出两次翻页事件之间的时间间隔内阅读文字的总数量，进一步计算出单位时间内阅读文字总量，实现阅读速度的分析。

6.一种现实场景下的阅读综合行为的识别系统，其特征在于，包括：信息载体获取模块，翻页行为识别模块，语言识别模块，文字总量分析模块，阅读速度分析模块；
所述信息载体获取模...

【专利技术属性】
技术研发人员：范骁骏，高旻昱，
申请(专利权)人：上海翎腾智能科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人