System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及图像数据处理,具体涉及一种拍照搜题方法、题库组织方法、电子装置及计算机可读存储介质。
技术介绍
1、随着移动互联网的发展和智能手机的普及,拍照搜题应用开始逐渐受到关注并得到快速发展。特别是在中小学阶段,学生的学习需求多样化,传统的教学方式可能无法满足他们的个性化学习需求。因此,能够提供快速、准确答案的拍照搜题应用受到了广大学生和家长的欢迎。
2、目前,市面上的很多电子教育产品都具备拍照搜题的功能,用户通过操控终端的摄像头对着纸面上的题目进行拍照,在终端完成拍照之后,用户通过操控终端界面中显示的选框,在图片中截取需要搜索答案的题目,这样一来,终端通过选框中截取的图像区域分析出题目内容并上传,从而完成拍照搜题的功能。另一种是通过专用的扫描仪或者扫描笔对纸面上题目进行逐行扫描,来实现搜索。
3、但是现有技术仍存在如下技术问题: 现有的拍照搜题方法主要依赖于题目的文本信息,而没有充分利用题目的图像信息。因此,当题目的文本信息很少、文本信息质量不高或者多个题目的文本信息相似的时候,搜题的准确率较低。
技术实现思路
1、本专利技术目的在于提供一种拍照搜题方法、题库组织方法、电子装置及计算机可读存储介质,充分利用题目的图像信息,能显著提高题目在文本信息很少、文本信息质量不高或者多个题目的文本信息相似情况下的拍照搜题准确率,从而为用户带来更好的使用体验。
2、本专利技术提供一种拍照搜题方法,包括步骤:
3、s10,获取拍摄的待搜题目的影
4、s20,根据所述待搜题目的影像信息获取待搜题目文本信息;
5、s30,根据所述待搜题目文本信息在题库中进行文本搜索,获得初筛题目集合,所述初筛题目集合包括至少一个目标题目;
6、s41,在所述目标题目包含有题目插图时,将所述题目插图与所述待搜题目的影像信息进行图像分析,获取所述待搜题目的影像信息包含所述题目插图的概率值;
7、s42,在所述目标题目无题目插图时,将所述目标题目的图像信息与所述待搜题目的影像信息进行图像分析,获取所述待搜题目的影像信息与所述目标题目的图像信息的相似度值;
8、s5,根据所述概率值和/或所述相似度值,对所述初筛题目集合中的所述目标题目进行排序,并输出排序后的结果作为搜索结果。
9、优选的,所述步骤s30之后,还包括:
10、s201,判断所述待搜题目是否包含插图;
11、s2021,若是,则进入步骤s41或者步骤s42;
12、s2022,若否,则进入步骤s60;
13、s60,将步骤s30中的初筛题目集合作为搜索结果输出。
14、优选的,所述步骤s41还包括,在所述目标题目包含有多张题目插图时,将逐一将所述题目插图与所述待搜题目的影像信息进行图像分析,获取每张所述题目插图对应的所述概率值,并取平均概率值作为所述待搜题目的影像信息包含所述题目插图的概率值。
15、优选的,还包括步骤,将所述待搜题目的影像信息中的待搜题目的文本区域替换为预设颜色,得到待搜题目的图片;其中,所述预设颜色为所述待搜题目的影像信息的背景色、黑色或者白色;
16、所述步骤s41包括,在所述目标题目包含有题目插图时,将所述题目插图与所述待搜题目的图片进行图像分析,获取所述待搜题目的图片包含所述题目插图的概率值;
17、所述步骤s42包括,在所述目标题目无题目插图时,将所述目标题目的图像信息与所述待搜题目的图片进行图像分析,获取所述待搜题目的图片与所述目标题目的图像信息的相似度值。
18、优选的,所述步骤s30具体包括,提取所述待搜题目文本信息中的关键词,根据所述关键词在题库中进行文本搜索,获得所述初筛题目集合。
19、优选的,所述步骤s30具体包括,根据所述关键词在题库中进行文本模糊搜索,获得所述初筛题目集合。
20、优选的,所述步骤s20具体包括,根据所述待搜题目的影像信息,通过光学字符识别技术获取待搜题目文本信息。
21、本专利技术还提供一种题库组织方法,所述题库中存储有多个题目,每个所述题目被存储为包括:
22、插图数量字段,所述插图数量字段为非负整数;
23、文本数据字段,包含题目的文本信息;
24、插图存储路径字段,包括题目的插图的存储的位置,以供读取;
25、唯一的题目编号字段。
26、本专利技术还提供一种电子装置,包括存储器、处理器、存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任一项所述的拍照搜题方法或者题库组织方法的步骤。
27、本专利技术还提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的拍照搜题方法或者题库组织方法的步骤。
28、与现有技术相比,本专利技术实施例具有以下有益效果:
29、1、本专利技术充分利用题目的插图信息,能显著提高题目在文本信息很少、文本信息质量不高或者多个题目的文本信息相似情况下的拍照搜题准确率。
30、2、本专利技术所述题库组织方法将文本信息和图像信息分开存储,在执行搜题时能够按需快速获取信息。
31、3、使用文本信息的关键字进行模糊搜索而不是直接使用文本信息进行相似度匹配,能够提高文本搜索准确率。
32、3、在题库规模很大时(千万数量级),使用分布式集群提高效率。
本文档来自技高网...【技术保护点】
1.一种拍照搜题方法,其特征在于,包括步骤:
2.根据权利要求1所述的拍照搜题方法,其特征在于,所述步骤S30之后,还包括:
3.根据权利要求1所述的拍照搜题方法,其特征在于,所述步骤S41还包括,在所述目标题目包含有多张题目插图时,将逐一将所述题目插图与所述待搜题目的影像信息进行图像分析,获取每张所述题目插图对应的所述概率值,并取平均概率值作为所述待搜题目的影像信息包含所述题目插图的概率值。
4.根据权利要求1所述的拍照搜题方法,其特征在于,还包括步骤,将所述待搜题目的影像信息中的待搜题目的文本区域替换为预设颜色,得到待搜题目的图片;其中,所述预设颜色为所述待搜题目的影像信息的背景色、黑色或者白色;
5.根据权利要求1所述的拍照搜题方法,其特征在于,所述步骤S30具体包括,提取所述待搜题目文本信息中的关键词,根据所述关键词在题库中进行文本搜索,获得所述初筛题目集合。
6.根据权利要求5所述的拍照搜题方法,其特征在于,所述步骤S30具体包括,根据所述关键词在题库中进行文本模糊搜索,获得所述初筛题目集合。
7.
8.一种题库组织方法,所述题库中存储有多个题目,其特征在于,每个所述题目被存储为包括:
9.一种电子装置,其特征在于,包括存储器、处理器、存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8中任一项所述的拍照搜题方法或者题库组织方法的步骤。
10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的拍照搜题方法或者题库组织方法的步骤。
...【技术特征摘要】
1.一种拍照搜题方法,其特征在于,包括步骤:
2.根据权利要求1所述的拍照搜题方法,其特征在于,所述步骤s30之后,还包括:
3.根据权利要求1所述的拍照搜题方法,其特征在于,所述步骤s41还包括,在所述目标题目包含有多张题目插图时,将逐一将所述题目插图与所述待搜题目的影像信息进行图像分析,获取每张所述题目插图对应的所述概率值,并取平均概率值作为所述待搜题目的影像信息包含所述题目插图的概率值。
4.根据权利要求1所述的拍照搜题方法,其特征在于,还包括步骤,将所述待搜题目的影像信息中的待搜题目的文本区域替换为预设颜色,得到待搜题目的图片;其中,所述预设颜色为所述待搜题目的影像信息的背景色、黑色或者白色;
5.根据权利要求1所述的拍照搜题方法,其特征在于,所述步骤s30具体包括,提取所述待搜题目文本信息中的关键词,根据所述关键词在题库中进行文本搜索,获得所述初筛题目集合...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。