The invention provides a method for intelligently extracting image and text information, which comprises the following steps: step S1, calling image and text detection and recognition model, extracting key fields in output results of image and text detection and recognition model; step S2, labeling image and text detection and recognition results with a certain amount of labels as training set of image and text information intelligent extraction model, and setting the relevant to be extracted Key field category number and other parameters are sent to the image text information intelligent extraction model for training to obtain the model parameters; step S3 and step S2 are used as the parameters of the image text information intelligent extraction system reasoning to input the image data to be processed into the image text information intelligent extraction model. The convolution neural network is designed by using the deep learning method to automatically extract the key information in the image text content, and the more accurate intelligent extraction effect of image text information can be obtained under the premise of simple operation.
【技术实现步骤摘要】
一种智能提取图像文字信息的方法
本专利技术涉及人工智能领域中的图像文字信息提取
,具体地讲,本专利技术涉及一种智能提取图像文字信息的方法。
技术介绍
图像文字信息智能提取是指利用人工智能方法与模型,对图像进行处理和分析,判断图像内的文字的具体所在位置和内容,之后对图像文字内容中的关键信息进行判断和提取。图像文字信息智能提取有助于提高文字智能理解的自动化,快速定位关键信息,并且能够帮助解决实际问题;例如帮助实现自动化关键字段提取、敏感文字信息鉴别等。图像文字信息提取一般需要确定在图像文字检测与图像文字识别的基础上确定关键信息的位置,从而进行关键字段提取。待提取的关键字段内容是未知的,但是其位置一般在某些标志性字段附近,目前,现有技术是根据识别结果定位标志性字段位置,再根据关键字段与标志性字段的相对位置设计某些规则来提取关键字段,例如,对身份证、增值税发票等固定样式定义标志性字段位置并进行识别的过程。然而,通过定位标志性字段再根据相对位置确定待提取的关键字段缺点之一是这种方法非常依赖识别结果,要求识别模型输出的标志性字段结果与定义的标志性字段完全一致才能定位到标志性字段的位置,当识别模型输出结果不太精确时可能使这种方法完全失效;另一个缺点是这种方法只适合版面固定的某类图像,因为这种方法中标志性字段和待提取的关键字段相对位置是固定的,一旦两者位置有偏移或者图像版面有微小变化也会导致这种方法失效;另外,这种方法开发成本高,对于每一类版面不同的图像都需要重新开发一套适用该类图像的规则。因此,本领域 ...
【技术保护点】
1.一种智能提取图像文字信息的方法,其特征在于,包括以下步骤:/n步骤S1、调用图像文字检测识别模型,提取图像文字检测识别模型输出结果中的关键字段,根据图像文字检测识别结果的复杂程度判断是否将其作为训练数据;/n步骤S2、为图像文字检测识别结果标注一定量的标签,作为图像文字信息智能提取模型的训练集,设置待提取关键字段类别数等参数,送入图像文字信息智能提取模型进行训练,得到模型参数;/n步骤S3、获取步骤S2中训练得到的模型参数,作为图像文字信息智能提取系统推理时的参数,将待处理的图像数据输入图像文字信息智能提取模型,图像文字信息智能提取系统输出即为图像文字信息提取的结果。/n
【技术特征摘要】
1.一种智能提取图像文字信息的方法,其特征在于,包括以下步骤:
步骤S1、调用图像文字检测识别模型,提取图像文字检测识别模型输出结果中的关键字段,根据图像文字检测识别结果的复杂程度判断是否将其作为训练数据;
步骤S2、为图像文字检测识别结果标注一定量的标签,作为图像文字信息智能提取模型的训练集,设置待提取关键字段类别数等参数,送入图像文字信息智能提取模型进行训练,得到模型参数;
步骤S3、获取步骤S2中训练得到的模型参数,作为图像文字信息智能提取系统推理时的参数,将待处理的图像数据输入图像文字信息智能提取模型,图像文字信息智能提取系统输出即为图像文字信息提取的结果。
2.如权利要求1所述的智能提取图像文字信息的方法,其特征在于,还包括以下步骤:
步骤S4、图像文字检测:调用图像文字检测模型,检测图像中的文字内容所在的区域;
步骤S5、图像文字识别:调用图像文字识别模型,识别输入的图像局部区域或整张图像,并提取其中的文字内容;
步骤S6、提取关键信息:将图像送入文字信息智能提取系统,确定步骤S5中的图像文字内容哪些是关键信息,以{关键字:内容}的形式,输出关键信息提取结果。
3.如权利要求1所述的...
【专利技术属性】
技术研发人员:周钊,郑莹斌,叶浩,
申请(专利权)人:上海兑观信息科技技术有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。