一种快速取词搜索的方法和装置制造方法及图纸

技术编号:29979084 阅读:25 留言:0更新日期:2021-09-08 10:08
本发明专利技术公开了一种快速取词搜索的方法和装置,利用本发明专利技术,用户在遇到需要搜索的内容时,只需要在屏幕上框出来即可,本发明专利技术方法可以通过图片和OCR技术的结合搜索得到相关的资源,从而用户能够在任何页面搜索不认识的字和词,极大地提高了学习效率。极大地提高了学习效率。极大地提高了学习效率。

【技术实现步骤摘要】
一种快速取词搜索的方法和装置


[0001]本专利技术涉及数据处理
,具体涉及一种快速取词搜索的方法和装置。

技术介绍

[0002]目前市面绝大多数学习应用都不具备取词功能,用户在学习的工程中遇到不认识的字、词需要退出当前应用,然后再进入浏览器去搜索,而浏览器搜索出来的资源又很杂乱,用户还需要花费特别多的时间和精力和时间去筛选,过程复杂,效率低下。特别是一些低龄段的学生,如果遇到不认识的汉字,不知道怎么去搜索,就无法完全理解某些知识点。

技术实现思路

[0003]针对现有技术的不足,本专利技术旨在提供一种快速取词搜索的方法和装置。
[0004]为了实现上述目的,本专利技术采用如下技术方案:
[0005]一种快速取词搜索的方法,具体过程为:
[0006]当用户使用电子设备进行阅读的过程中,遇到不认识的字、词或句子时,通过触控笔在电子设备的屏幕上将需要搜索的内容用框框起来,形成一个闭合区域;
[0007]取能够包含闭合区间的最小矩形图片,然后将闭合区域以外的部分填充空白;/>[0008]对所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种快速取词搜索的方法,其特征在于,具体过程为:当用户使用电子设备进行阅读的过程中,遇到不认识的字、词或句子时,通过触控笔在电子设备的屏幕上将需要搜索的内容用框框起来,形成一个闭合区域;取能够包含闭合区间的最小矩形图片,然后将闭合区域以外的部分填充空白;对所述最小矩形图片进行OCR识别;对OCR识别结果分别进行两方面的预处理,一方面是将OCR识别结果中的每个汉字或单词分开,另一方面是对OCR识别结果进行分词处理,将其中的常用词提取出来;将两方面预处理得到的字和词进行去重处理,去掉重复的词和字;利用去重后的字、词和原始的OCR识别结果搜索相关的资源;将搜索的结果进行分类,并将分类后的搜索结果以列表的形式显示给用户。2.根据权利要求1所述的方法,其特征在于,预先设置框的起点和终点的横向和纵向未能形成闭合区域的最大误差,分别记作maxXOffset和maxYOffset;记录触控笔在屏幕上的滑动轨迹,起点为(X1,Y1)、终点为(X2,Y2);判断触控笔的滑动轨迹中是否包含闭合区域,如果不包含,则将终点和起点的X轴和Y轴分别相减取绝对值,即xOffset=|X2
‑<...

【专利技术属性】
技术研发人员:黄泉彪
申请(专利权)人:读书郎教育科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1