一种基于自然语言语义分析的文本识别方法技术

技术编号:25523127 阅读:52 留言:0更新日期:2020-09-04 17:13
本发明专利技术公开了一种基于自然语言语义分析的文本识别方法,该方法包括:采集待识别的文本;获取目标检测及识别网络,其中,所述目标检测及识别网络能够执行文本检测和文本识别任务;通过所述目标检测及识别网络对所述待识别文本进行文本检测及基于自然语言语义分析的文本识别。通过本发明专利技术的技术方案,能够将文本检测和文本识别结合起来,进而有效的降低文本识别时计算的消耗。

【技术实现步骤摘要】
一种基于自然语言语义分析的文本识别方法
本专利技术涉及文本识别
,特别涉及一种基于自然语言语义分析的文本识别方法。
技术介绍
文本识别主要是分为两个阶段,第一阶段是文本检测,首先利用文本检测技术定位到图片中文本所在的位置,然后框出文本,剪裁出文本区域;第二阶段是文本识别,对通过文本检测方法所剪裁好的文本区域进行识别,即得到识别文本框中所包含的文本。目前,对于文本识别中文本检测和文本识别之间的关联度很高,但是还没有很好的方式同时完成文本检测和文本识别,计算的消耗比较大。
技术实现思路
本专利技术提供一种基于自然语言语义分析的文本识别方法,所述技术方案如下:采集待识别的文本;获取目标检测及识别网络,其中,所述目标检测及识别网络能够执行文本检测和文本识别任务;通过所述目标检测及识别网络对所述待识别文本进行文本检测及基于自然语言语义分析的文本识别。在一个实施例中,所述采集待识别的文本,包括:利用预设工具获取目标图片;根据所述目标图片的图片格式进行格式转换,以得到格式转换后的目标图片;对所述格式转换后的目标图片进行句子提取,得到若干条语句;根据所述若干条语句判断所述目标图片是否满足预设需求,当所述目标图片满足预设需求时,根据所述目标图片确定所述待识别的文本。在一个实施例中,在所述根据所述目标图片的图片格式进行格式转换,以得到格式转换后的目标图片之前,还包括:对所述目标图片进行降噪处理;降噪处理完成后,根据目标图片本身的属性进行归一化处理,其中,所述目标图片本身的属性包括分辨率、像素深度、真/伪彩色中的任意一种或多种。在一个实施例中,对目标图片进行降噪处理,其步骤如下:步骤A1,根据以下公式计算目标图片的像素值的均值:其中,ΔT表示目标图片像素值的平均值;n,m衡量目标图片像素值的个数,n代表横坐标,m代表纵坐标,x(i,j)代表横坐标为i纵坐标为j的目标图片像素值大小;步骤A2,根据以下公式求出衡量正常像素点与噪声点的阈值:其中,p(i,j)代表目标图片临近区域内的像素值的均值,s(i,j)代表目标图片像素值标准方差,L代表标准方差的动态范围内选取的数值,s(i,j)≤L≤s(i,j)+1,q(i,j)代表衡量正常像素点与噪声点的阈值,k是定义的一个修正参数,0<k<1;步骤A3,根据下述公式对目标图片的噪声点进行处理;其中,q(i,j)代表衡量正常像素点与噪声点的阈值,ΔT代表目标图片像素的平均值,x(i,j)代表横坐标为i纵坐标为j的去噪前目标图片像素值大小,r(i,j)代表去噪后的目标图片像素值大小。步骤A4,根据所述处理后目标图片各个坐标点的像素值xij重构处理后的目标图片所述目标图片就是去噪归一化后的目标图片。在一个实施例中,所述根据所述目标图片的图片格式进行格式转换,以得到格式转换后目标图片,包括提取出所述目标图片的图片格式标识;基于所述图片格式标识,对所述目标图片的图片格式进行格式转换,以得到所述格式转换后的目标图片。在一个实施例中,所述获取目标检测及识别网络,包括:获取基于注意力机制的文本检测及识别网络;获取预设文本检测和文本识别的训练数据集;根据所述训练数据集对所述基于注意力机制的文本检测及识别网络进行训练,且在训练的过程中通过预设算法进行网络参数的调整,以得到所述目标检测及识别网络。在一个实施例中,所述获取基于注意力机制的文本检测及识别网络包括:通过卷积神经网络模型和循环神经网络模型,且结合注意力机制进行网络模型的构建,以得到所述基于注意力机制的文本检测及识别网络。在一个实施例中,根据所述训练数据集对所述基于注意力机制的文本检测及识别网络进行训练,且在训练的过程中通过预设算法进行网络参数的调整,以得到所述目标检测及识别网络,包括:获取预设的文本检测和文本识别的测试数据集;对所述基于注意力机制的文本检测及识别网络中由所述卷积神经网络构成的文件检测部分进行预训练,且在预训练的过程中通过所述预设算法进行优化;对所述基于注意力机制的文本检测及识别网络中的文本检测部分和文本识别部分统一进行训练,且通过所述测试数据集进行测试,从测试的过程中确定所述目标检测及识别网络。在一个实施例中,所述通过所述目标检测及识别网络对所述待识别文本进行文本检测及基于自然语言语义分析的文本识别,包括通过所述目标检测及识别网络中的文本检测部分对所述待识别文本进行检测,得到待识别的文本区域;通过所述目标检测及识别网络中的文本识别部分对所述待识别的文本区域进行基于自然语言语义分析的文本识别,得到文本识别结果。在一个实施例中,所述预设算法包括梯度下降算法和/或反传播算法。本专利技术实施例提供的技术方案可以包括以下有益效果:采集待识别的文本,获取目标检测及识别网络,进而通过所述目标检测及识别网络对所述待识别文本进行文本检测及基于自然语言语义分析的文本识别。通过本专利技术的技术方案,能够将文本检测和文本识别高效的结合起来,不用再将文本检测和文本识别分为两个单独的任务,能够有效的降低文本识别时计算的消耗。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书以及附图中所特别指出的结构来实现和获得。下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。附图说明附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:图1为本专利技术一实施例中一种基于自然语言语义分析的文本识别方法的流程图;图2为本专利技术一实施例中另一种基于自然语言语义分析的文本识别方法的流程图;图3为本专利技术一实施例中又一种基于自然语言语义分析的文本识别方法的流程图;图4为本专利技术一实施例中再一种基于自然语言语义分析的文本识别方法的流程图。具体实施方式以下结合附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图1为本专利技术一实施例中一种基于自然语言语义分析的文本识别方法的流程图,如图1所示,该方法可被实施为以下步骤S11-S13:在步骤S11中,采集待识别的文本;待识别的文本是图片格式的,待识别文本中可能包含有大量的图片、文字、报表和文本。在步骤S12中,获取目标检测及识别网络,其中,目标检测及识别网络能够执行文本检测和文本识别任务;目标检测及识别网络是指网络模型,能够同时的进行文本检测和文本识别,并且目标检测及识别网络在构建的时候,结合了能够进行基于自然语言语义分析的文本识别的功能,对自然语音语义作如下解释:语言所蕴含的意义就是语本文档来自技高网...

【技术保护点】
1.一种基于自然语言语义分析的文本识别方法,其特征在于,包括:/n采集待识别的文本;/n获取目标检测及识别网络,其中,所述目标检测及识别网络能够执行文本检测和文本识别任务;/n通过所述目标检测及识别网络对所述待识别文本进行文本检测及基于自然语言语义分析的文本识别。/n

【技术特征摘要】
1.一种基于自然语言语义分析的文本识别方法,其特征在于,包括:
采集待识别的文本;
获取目标检测及识别网络,其中,所述目标检测及识别网络能够执行文本检测和文本识别任务;
通过所述目标检测及识别网络对所述待识别文本进行文本检测及基于自然语言语义分析的文本识别。


2.如权利要求1所述的方法,其特征在于,所述采集待识别的文本,包括:
利用预设工具获取目标图片;
根据所述目标图片的图片格式进行格式转换,以得到格式转换后的目标图片;
对所述格式转换后的目标图片进行句子提取,得到若干条语句;
根据所述若干条语句判断所述目标图片是否满足预设需求,
当所述目标图片满足预设需求时,根据所述目标图片确定所述待识别的文本。


3.如权利要求2所述的方法,其特征在于,在所述根据所述目标图片的图片格式进行格式转换,以得到格式转换后的目标图片之前,还包括:
对所述目标图片进行降噪处理;
降噪处理完成后,根据目标图片本身的属性进行归一化处理,其中,所述目标图片本身的属性包括分辨率、像素深度、真/伪彩色中的任意一种或多种。


4.如权利要求3所述的方法,其特征在于,对目标图片进行降噪处理,其步骤如下:
步骤A1,根据以下公式计算目标图片的像素值的均值:



其中,ΔT表示目标图片像素值的平均值;n,m衡量目标图片像素值的个数,n代表横坐标,m代表纵坐标,x(i,j)代表横坐标为i纵坐标为j的目标图片像素值大小;
步骤A2,根据以下公式求出衡量正常像素点与噪声点的阈值:



其中,p(i,j)代表目标图片临近区域内的像素值的均值,s(i,j)代表目标图片像素值标准方差,L代表标准方差的动态范围内选取的数值,s(i,j)≤L≤s(i,j)+1,q(i,j)代表衡量正常像素点与噪声点的阈值,k是定义的一个修正参数,0<k<1;
步骤A3,根据下述公式对目标图片的噪声点进行处理;



其中,q(i,j)代表衡量正常像素点与噪声点的阈值,ΔT代表目标图片像素的平均值,x(i,j)代表横坐标为i纵坐标为j的去噪前目标图片像素值大小,r(i,j)代表去...

【专利技术属性】
技术研发人员:刘如君刘志杰陈乔尚雪松
申请(专利权)人:北京微智信业科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1