页码定位方法、基于其的辅助阅读方法及应用技术

技术编号：35870105 阅读：18 留言：0更新日期：2022-12-07 11:04

本发明专利技术的实施方式提供了一种页码定位方法、基于其的辅助阅读方法及应用。该页码定位方法包括：获取指读图像；提取指读图像的图像特征向量和页面文本信息；根据图像特征向量在预先建立的图像特征表中检索，以确定第一页码定位结果；根据页面文本信息在预先建立的页面数据表中检索，以确定第二页码定位结果；根据第一页码定位结果和第二页码定位结果得到定位页码。通过本发明专利技术的页码定位方法，能够基于两种特征类型识别得到的页码定位结果进行分析，确定出指读图像对应的定位页码，进而提高页码定位的准确性和鲁棒性，从而显著地降低了页码定位的出错率，为用户带来了更好的体验。为用户带来了更好的体验。为用户带来了更好的体验。

全部详细技术资料下载

【技术实现步骤摘要】
页码定位方法、基于其的辅助阅读方法及应用

[0001]本专利技术的实施方式涉及数据处理领域，更具体地，本专利技术的实施方式涉及页码定位方法、基于其的辅助阅读方法及应用。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念，但不一定是之前已经想到或者已经探究的概念。因此，除非在此指出，否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术，并且并不因为包括在本部分中就承认是现有技术。
[0003]在整个阅读过程中，当文字阅读出现困难时，阅读者常常需要借助外力，例如字典等的帮助，这使得阅读的连贯性被破坏，也容易导致阅读者的注意力被分散。针对以上情况，辅助阅读技术能够很好地解决上述问题。
[0004]使用辅助阅读时，阅读书本放置好后，将通过摄像头采集书本的对应画面，通过算法分析判断画面中的图书是哪本书籍的哪一页。如果阅读者指向了书本中某个文本所在的位置，辅助阅读还可以判断指向的文本内容，将该文本内容进行语音播放，帮助阅读者认识文字。
[0005]在现有技术中，已经出现一些页码识别方法，其根据指读图像在数据库中查找多张相似的存储页面后，提取针对存储页面和指读图像中预先标记区域的特征信息，以确定所述指读图像对应的存储页面，进而确定对应的页码。但该方法需基于图像特征来完成，对于文字信息较多、用户涂改信息多的情况，存在识别的页码错误率高的现象，效果不鲁棒。

技术实现思路

[0006]现有技术中的页码识别方法...

【技术保护点】

【技术特征摘要】
1.一种页码定位方法，其特征在于，包括：获取指读图像；提取所述指读图像的图像特征向量和页面文本信息；根据所述图像特征向量在预先建立的图像特征表中检索，以确定第一页码定位结果；根据所述页面文本信息在预先建立的页面数据表中检索，以确定第二页码定位结果；根据所述第一页码定位结果和所述第二页码定位结果得到定位页码。2.根据权利要求1所述的页码定位方法，其特征在于，所述根据所述第一页码定位结果和所述第二页码定位结果得到定位页码，包括：若所述第一页码定位结果和所述第二页码定位结果不一致，则当所述页面文本信息满足预设条件时，以所述第二页码定位结果作为所述定位页码；其中，所述预设条件包括：所述页面文本信息中的文本数量大于或等于数量阈值。3.根据权利要求1所述的页码定位方法，其特征在于，所述页面文本信息为所述指读图像中的双页文本信息；所述页面数据表包括：单页数据表和双页数据表；相应地，所述页码定位方法，包括：获取指读图像；提取所述指读图像的图像特征向量和双页文本信息；根据所述图像特征向量在预先建立的图像特征表中检索，以确定第一双页页码定位结果；根据所述双页文本信息在所述双页数据表中检索，以确定第二双页页码定位结果；根据所述第一双页页码定位结果和所述第二双页页码定位结果得到定位双页页码；对所述指读图像进行页面检测；若页面检测得到双页的页面信息，则执行第一定位策略在所述定位双页页码中确定所述定位页码；若页面检测得到单页的页面信息或页面检测未得到页面信息，则执行第二定位策略在所述定位双页页码中确定所述定位页码。4.一种基于页码定位的辅助阅读方法，其特征在于，包括：获取指读图像；所述指读图像中含有用户反馈的指读对象的定位信息；提取所述指读图像的图像特征向量和页面文本信息；根据所述图像特征向量在预先建立的图像特征表中检索，以确定第一页码定位结果；根据所述页面文本信息在预先建立的页面数据表中检索，以确定第二页码定位结果；根据所述第一页码定位结果和所述第二页码定位结果得到定位页码；根据所述定位信息确定所述定位页码中的目标阅读文本；对所述目标阅读文本进行语音播放。5.根据权利要求4所述的基于页码定位的辅助阅读方法，其特征在于，所述根据所述定位信息确定所述定位页码中的目标阅读文本，包括：根据所述定位信息和/或局部文本信息，在所述页面数据表中所述定位页码对应的页面数据中定位出所述目标阅读文本；其中，所述局部文本信...

【专利技术属性】
技术研发人员：贾若然，董士琪，肖云龙，李翌昕，林辉，段亦涛，
申请(专利权)人：网易有道信息技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人