一种文字提取方法、图像处理设备和计算机可读存储介质技术

技术编号：25709966 阅读：29 留言：0更新日期：2020-09-23 02:56

本发明专利技术公开了一种文字提取方法、图像处理设备和计算机可读存储介质。该方法包括：获取待提取图像；将待提取图像的每个像素点的R值、G值和B值调整为灰度值，生成灰度图像；获取灰度图像中每个像素点的灰度像素值，将灰度像素值大于或等于预设阈值的像素点赋予第一数值，将灰度像素值小于预设阈值的像素点赋予第二数值，生成二值图像；根据具有第一数值的像素点的行坐标对二值图像进行行提取，获取行文字图像；获取每个文字的宽度，根据每个文字的宽度获取行文字图像中的单个文字图像；提取单个文字图像中的待提取文字。通过上述方式，本发明专利技术能够有效提升了文字提取的准确性和可靠性，也有效提升了工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种文字提取方法、图像处理设备和计算机可读存储介质
本专利技术涉及图像处理领域，特别是涉及一种文字提取方法、图像处理设备和计算机可读存储介质。
技术介绍
对于OCR(OpticalCharacterRecognition，光学字符识别)来说，能否准确地对文字进行提取，是非常重要的一个环节。目前针对文字提取中，首先完成行切分，然后再行切分出来基础上再做字的切分。对于行切分根据行与行的空白间隙处的水平积分投影理论值为0，而文字行的水平积分投影不为0的原理。对文字的各行进行水平投影积分而获取对应文字行位置。然后再每一行文字的基础上逐个切分文字。这里面有2个小的不足。一是对行的水平投影积分，需要做逻辑判断，占用计算资源和效率不高；二是对于文字的分割，对文字的切割宽度采用经验值，如果一个印刷体既有文字，又有数字，在默认文字切割宽度下就会进行反复手动调整，造成效率不高。
技术实现思路
本专利技术主要解决的技术问题是能够有效提升了文字提取的准确性和可靠性，也有效提升了工作效率。为解决上述技术问题，本专利...

【技术保护点】
1.一种文字提取方法，其特征在于，包括：/n获取待提取图像，所述待提取图像包括至少一行待提取文字行，每行所述待提取文字行包括至少一个待提取文字；/n将所述待提取图像的每个像素点的R值、G值和B值调整为灰度值，生成灰度图像；/n获取所述灰度图像中每个像素点的灰度像素值，将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值，将所述灰度像素值小于所述预设阈值的像素点赋予第二数值，生成二值图像；/n根据具有第一数值的像素点的行坐标对所述二值图像进行行提取，获取行文字图像；/n获取每个文字的宽度，根据所述每个文字的宽度获取所述行文字图像中的单个文字图像；/n提取所述单个文字图像中的所述待提取文字。/n

【技术特征摘要】
1.一种文字提取方法，其特征在于，包括：
获取待提取图像，所述待提取图像包括至少一行待提取文字行，每行所述待提取文字行包括至少一个待提取文字；
将所述待提取图像的每个像素点的R值、G值和B值调整为灰度值，生成灰度图像；
获取所述灰度图像中每个像素点的灰度像素值，将所述灰度像素值大于或等于预设阈值的像素点赋予第一数值，将所述灰度像素值小于所述预设阈值的像素点赋予第二数值，生成二值图像；
根据具有第一数值的像素点的行坐标对所述二值图像进行行提取，获取行文字图像；
获取每个文字的宽度，根据所述每个文字的宽度获取所述行文字图像中的单个文字图像；
提取所述单个文字图像中的所述待提取文字。

2.根据权利要求1所述的方法，其特征在于，所述将所述待提取图像的每个像素点的R、G和B值调整为灰度值的步骤，包括：
为所述R值、G值和B值赋予不同的权重，将每个所述像素点的所述R值、G值和B值分别乘以各自的权重后相加，获取每个所述像素点的灰度值。

3.根据权利要求1所述的方法，其特征在于，所述获取所述灰度图像中每个像素点的灰度像素值的步骤之后，包括：
采用OTSU算法计算出所述灰度图像的预设阈值。

4.根据权利要求1所述的方法，其特征在于，所述根据具有第一数值的像素点的行坐标对所述二值图像进行行提取的步骤，包括：
获取所有具有第一数值的所述像素点的第一行坐标，统计所述第一行坐标在每一行的分布频数，根据所述分布频数生成分布向量；
计算所述分布向量和单位向量的卷积，根据所述卷积获取每一行文字图像的初始行坐标。

5.根据权利要求4所述的方法，其特征在于，所述根据所述卷积获取每一行文字图像的初始行坐标的步骤，包括：
获取所述卷积值为2时的第二行坐标，将所述第一行坐标除去所述第二行坐标获取第三行坐标，所述第三行坐标为所述每一行文字...

【专利技术属性】
技术研发人员：李佳，杨阳，刘旭东，
申请(专利权)人：遥相科技发展北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人