一种题目匹配的方法和系统技术方案

技术编号:25309755 阅读:33 留言:0更新日期:2020-08-18 22:28
本发明专利技术实施例涉及题目收集技术领域,公开了一种题目匹配的方法和系统。该方法包括:智能终端获取目标页面图像并发送给服务器;服务器识别目标页面图像中页眉部分和页脚部分,并根据页眉部分和页脚部分确定搜索关键词;服务器利用搜索关键词遍历索引集合,确定目标索引,并根据目标索引获取目标题目资源;服务器识别出页码,并根据页码获取关系页面;智能终端接收操作轨迹并发送给服务器;服务器根据操作轨迹和预设规则确定框题区域,在关系页面中获取框题内容。实施本发明专利技术实施例,可以得到更为清晰的框题内容图片或字符文本,可保证后续错题收集的清晰度或搜索答案的准确性。

【技术实现步骤摘要】
一种题目匹配的方法和系统
本专利技术涉及题目收集
,具体涉及一种题目匹配的方法和系统。
技术介绍
为了解决中小学的作业难题,目前,市场上出现了很多解决学生作业难题的搜题或错题汇总类应用程序,这些应用程序都是通过摄像头拍摄题目图片,然后通过裁剪和框选等方式得到框题内容,进而用于错题保存或用来搜索对应的答案。因为框题内容为图片,用于错题保存,在打印重做时,因为摄像头像素以及其他原因,可能会导致打印不清晰。用于搜索答案时,需要字符识别找到该题目对应的答案,过程繁琐的同时,如果框题内容不清楚,很可能使得搜索失败或搜索到其他题的答案。
技术实现思路
针对所述缺陷,本专利技术实施例公开了一种题目匹配的方法和系统,通过语音获得待收集题目的图片,操作简单,效率高。本专利技术实施例第一方面公开一种题目匹配的方法,应用于智能终端中,所述方法包括:智能终端获取目标页面图像,并将所述目标页面图像发送给服务器;服务器识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述根据所述页眉部分和页脚部分确定搜索关键词,包括:识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件;检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件;在存在第二条件时,将第一条件和第二条件作为搜索关键词。作为一种可选的实施方式,在本专利技术实施例第一方面中,服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源,包括:利用所述搜索关键词遍历题目资源库的索引集合;将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引;根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述智能终端接收用户在承载体上的操作轨迹,之前,还包括:服务器识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源;所述在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包括:在所述匹配资源的关系页面中获取与所述框题区域位置相同的内容作为框题内容。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述智能终端获取目标页面图像,包括:接收用户发送的触发指令,智能终端根据所述触发指令启动摄像头对承载体进行拍照,获取目标页面图像。作为一种可选的实施方式,在本专利技术实施例第一方面中,所述服务器根据所述操作轨迹和预设规则确定框题区域,包括:服务器将在承载体上的操作轨迹通过坐标转换到在目标页面图像中上,得到在目标页面图像上的运行轨迹;服务器根据所述运行轨迹以及预设规则确定对目标页面图像的框题区域。作为一种可选的实施方式,在本专利技术实施例第一方面中,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包括:获取关系页面对应的所有标识,从所述所有标识中选择所述框题区域对应位置的目标标识;根据所述目标标识和映射关系获取关系页面中所述目标标识对应的内容;将所述目标标识对应的内容作为框题内容。本专利技术实施例第二方面公开一种题目匹配的系统,其包括智能终端和服务器;所述智能终端,包括:第一获取单元,用于获取目标页面图像,并将所述目标页面图像发送给服务器;接收单元,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;所述服务器,包括:第一识别单元,用于识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;搜索单元,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;第二识别单元,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;第二获取单元,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述第一识别单元,包括:第一筛选子单元,用于识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;第二筛选子单元,检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件;第三筛选子单元,检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件;判断子单元,用于在存在第二条件时,将第一条件和第二条件作为搜索关键词。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述搜索单元,包括:查询子单元,用于利用所述搜索关键词遍历题目资源库的索引集合;第一确定子单元,用于将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引;映射子单元,用于根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。作为一种可选的实施方式,在本专利技术实施例第二方面中,所述服务器还包括匹配单元,用于识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源。作为一种可选的实施方式本文档来自技高网...

【技术保护点】
1.一种题目匹配的方法,其特征在于,包括:/n智能终端获取目标页面图像,并将所述目标页面图像发送给服务器;/n服务器识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;/n服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;/n服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;/n智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;/n所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。/n

【技术特征摘要】
1.一种题目匹配的方法,其特征在于,包括:
智能终端获取目标页面图像,并将所述目标页面图像发送给服务器;
服务器识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;
服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;
服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;
智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;
所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。


2.根据权利要求1所述的方法,其特征在于,所述根据所述页眉部分和页脚部分确定搜索关键词,包括:
识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;
检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件;
检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件;
在存在第二条件时,将第一条件和第二条件作为搜索关键词。


3.根据权利要求1所述的方法,其特征在于,服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源,包括:
利用所述搜索关键词遍历题目资源库的索引集合;
将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引;
根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。


4.根据权利要求1所述的方法,其特征在于,所述智能终端接收用户在承载体上的操作轨迹,之前,还包括:
服务器识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页面对应的目标题目资源为目标页面图像对应的匹配资源;
所述在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包括:
在所述匹配资源的关系页面中获取与所述框题区域位置相同的内容作为框题内容。


5.根据权利要求1-4任一项所述的方法,其特征在于,所述智能终端获取目标页面图像,包括:
接收用户发送的触发指令,智能终端根据所述触发指令启动摄像头对承载体进行拍照,获取目标页面图像。


6.根据权利要求5所述的方法,其特征在于,所述服务器根据所述操作轨迹和预设规则确定框题区域,包括:
服务器将在承载体上的操作轨迹通过坐标转换到在目标页面图像中上,得到在目标页面图像上的运行轨迹;
服务器根据所述运行轨迹以及预设规则确定对目标页面图像的框题区域。


7.根据权利要求5所述的方法,其特征在于,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包括:
获取关系页面对应的所有标识,从所述所有标识中选择所述框题区域对应位置的目标标识;
根据所述目标标识和映射关系获取关系页面中所述目标标识对应的内容;
将所述目标标识对应的内容作为框题内容。


8.一种题目匹配的系统,其特征在于,其包括智能终端和服务器;
所述智能终端,包括:
第一获取单元,用于获取目标页面图像,并将所述目标页面图像发送给服务器;
接收单元,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器;
所述服务器,包括:
第一识别单元,用于识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种;
搜索单元,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源;
第二识别单元,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目资源的关系页面;
第二获取单元,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容。


9.根据权利要求8所述的系统,其特征在于,所述第一识别单元,包括:
第一筛选子单元,用于识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为第一条件;
第二筛选子单元,检测所述页眉部分或/和页脚部分中的字符...

【专利技术属性】
技术研发人员:曾菲
申请(专利权)人:广东小天才科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1