System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书涉及识别,特别涉及基于ocr的用户材料识别方法、系统、装置及介质。
技术介绍
1、ocr(optical character recognition,光学字符识别)技术是一种文字识别技术,目前ocr技术主要应用于车牌检测等较为单一、简单的场景中。当前,对着无纸化办公的提倡,电子材料逐渐增多,对于电子材料中文字的识别有了数量和质量的双重要求。
2、因此,希望提供一种基于ocr的用户材料识别方法,能够增加ocr技术的应用场景,并且提高检测的准确度和速度。
技术实现思路
1、本说明书提供一种基于ocr的用户材料识别方法,能够增加ocr技术的应用场景,并且提高各场景下检测的准确度和速度。
2、本说明书一个或多个实施例提供一种基于ocr的用户材料识别方法,该方法包括:获取用户材料;基于用户材料判断用户材料的内容类型;基于内容类型确定对应的用户材料的预处理方式,确定待处理材料信息;基于内容类型对待处理材料信息进行ocr识别,确定初步文本信息;对初步文本信息进行后处理,确定目标文本信息。
3、本说明书一个或多个实施例提供一种基于ocr的用户材料识别系统,该系统包括:获取模块,用于获取用户材料;判断模块,用于基于用户材料判断用户材料的内容类型;预处理模块,用于基于内容类型确定对应的用户材料的预处理方式,确定待处理材料信息;ocr处理模块,用于基于内容类型对待处理材料信息进行ocr识别,确定初步文本信息;后处理模块,用于对初步文本信息进行后处理,确定目标文
4、本说明书一个或多个实施例提供一种基于ocr的用户材料识别装置,该装置包括至少一个处理器以及至少一个存储器;该至少一个存储器用于存储计算机指令;该至少一个处理器用于执行该计算机指令中的至少部分指令以实现如上述的基于ocr的用户材料识别方法。
5、本说明书一个或多个实施例提供一种计算机可读存储介质,该存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如如上述的基于ocr的用户材料识别方法。
本文档来自技高网...【技术保护点】
1.一种基于OCR的用户材料识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用户材料识别方法,其特征在于,所述内容类型包括第一内容类型和第二内容类型,所述基于所述内容类型确定对应的所述用户材料的预处理方式,确定待处理材料信息,包括:
3.根据权利要求1所述的用户材料识别方法,其特征在于,所述基于所述内容类型对所述待处理材料信息进行OCR识别,确定初步文本信息,包括:
4.根据权利要求1所述的用户材料识别方法,其特征在于,所述对所述初步文本信息进行后处理,确定目标文本信息,包括:
5.一种基于OCR的用户材料识别系统,其特征在于,所述系统包括:
6.根据权利要求5所述的用户材料识别系统,其特征在于,
7.根据权利要求5所述的用户材料识别系统,其特征在于,所述OCR处理模块包括识别模型,所述识别模型用于对所述待处理材料信息进行OCR识别,确定所述初步文本信息。
8.根据权利要求5所述的用户材料识别系统,其特征在于,所述后处理模块包括:
9.一种基于OCR的用户材料识别装置,其
10.一种计算机可读存储介质,所述存储介质存储计算机指令,当计算机读取存储介质中的计算机指令后,计算机执行如权利要求1至4中任意一项所述的基于OCR的用户材料识别方法。
...【技术特征摘要】
1.一种基于ocr的用户材料识别方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用户材料识别方法,其特征在于,所述内容类型包括第一内容类型和第二内容类型,所述基于所述内容类型确定对应的所述用户材料的预处理方式,确定待处理材料信息,包括:
3.根据权利要求1所述的用户材料识别方法,其特征在于,所述基于所述内容类型对所述待处理材料信息进行ocr识别,确定初步文本信息,包括:
4.根据权利要求1所述的用户材料识别方法,其特征在于,所述对所述初步文本信息进行后处理,确定目标文本信息,包括:
5.一种基于ocr的用户材料识别系统,其特征在于,所述系统包括:
【专利技术属性】
技术研发人员:吴珂皓,杨光,刘超,
申请(专利权)人:上海简答数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。