一种5G消息中图片内文字实时提取的管控方法技术

技术编号:33246569 阅读:12 留言:0更新日期:2022-04-27 17:59
本发明专利技术公开一种5G消息中图片内文字实时提取的管控方法,引入基于图形学的预处理,针对5G消息垃圾图片的特征进行优化,以图形学运算的少量时间代价获得光学字符识别阶段的大量效率提升。本发明专利技术可以根据图片变体现状控制样本图片灵活选择模型训练的方向,提高识别准确率。在预处理算法、识别模型上进行合理优化,将速度和准确度提高到合理的阈值,实现实时图片鉴权要求。提取出的文本,交由普通文本过滤环节处理,返回最终判定结果,以实现对该类垃圾图片消息的管控。圾图片消息的管控。圾图片消息的管控。

【技术实现步骤摘要】
一种5G消息中图片内文字实时提取的管控方法


[0001]本专利技术涉及5G技术应用领域,尤其涉及一种5G消息中图片内文字实时提取的管控方法。

技术介绍

[0002]随着5G时代来临,各运营商纷纷推出基于RCS(富媒体通信)的5G消息,以期在传统短彩信通信外的拓展更丰富的消息类业务。然而垃圾信息是一个从短信彩信到5G消息都无法根除的问题。完善垃圾信息管控平台是运营商与发送者间的长期赛跑。
[0003]有别于IM软件,5G消息的弱客户端特性导致信息管控能力需在设备端实现。而5G消息的实时场景又要求管控具备低时延。5G消息支持的媒体类型中,文本实时监控技术已很成熟;流媒体在目前的算力下很难做到实时过滤;而图片实时通信在5G消息之前主要是彩信,目前各运营商彩信业务量很低,低负荷使得设备资源可较好应付实时图片处理;且彩信很少处在实时交互的场景中,故对处理速度的要求不苛刻。

技术实现思路

[0004]本专利技术的目的在于提供一种5G消息中图片内文字实时提取的管控方法。
[0005]本专利技术采用的技术方案是:
[0006]一种5G消息中图片内文字实时提取的管控方法,其包括以下步骤:
[0007]步骤1,图形学处理在opencv框架下对图片进行预处理;具体包括以下步骤:
[0008]步骤1

1,图片灰度化;灰度图是一幅只含亮度信息不含色彩信息的单通道图像,每个像素就是其亮度值;
[0009]步骤1

2,灰度图片阈值分割和二值化;
[0010]鉴于不同图片的灰度构成不同,如对所有图片二值化都使用一个固定阈值,那么有可能出现主体被融入背景或噪声被突出显示等干扰情况。所以需要对划分阈值进行计算。
[0011]步骤1

3,对二值化后的图片进行降噪处理;
[0012]通过大量样本分析发现垃圾图片的噪点多为孤立的小点,大量分布在图片的非主体区域中。该情况通常是制造者使用算法为图片加入各类噪音,为信息监控方制造障碍。所以需要使用降噪算法有效去除独立噪点。
[0013]步骤1

4,进行边缘检测得到文字轮廓,并在形态学上膨胀和腐蚀后获得文本区块;
[0014]二值图中对无用的图形信息干扰文字识别的效率和准确性;同时cnocr的分行识别能力很容易受到文本在图中复杂的布局影响而变得不准确。所以首先对二值图进行边缘检测获得文字的边缘高亮图;随后从形态学上进行腐蚀和膨胀以平整色块区域;
[0015]步骤1

5,获得文本区块外缘所占据的最大矩形的四角坐标,在二值图中获得各个文本块;
[0016]识别色块轮廓的像素坐标;再用获得的矩形区域坐标到原二值图上取出对应部分子图。因cnocr对图片进行扫描以文件为单位,故而我们对扫描获得的子图还需要拼成一个整齐的分行大图,这样速度和识别率最优。
[0017]步骤1

6,将各个文本块整齐拼接为一个图片;
[0018]步骤2,光学字符识别在cnocr套件下根据5G消息垃圾图片特征训练好模型;提高光学字符识别对非规范文字和垃圾信息图片常见字体的识别,以提升管控效果。
[0019]步骤3,管控业务流程将提取出的文本进行关键词匹配并实时返回管控结果;同时将文本送统计模块进行自然语言识别以发现嫌疑和生成推荐策略。
[0020]进一步地,步骤1

2中阈值分割采用OTSU法。
[0021]进一步地,步骤1

3中采用八邻域算法进行降噪处理;或采用八邻域算法结合连通域算法进行降噪处理。
[0022]进一步地,步骤1

4中采用Sobel算子进行边缘检测。
[0023]进一步地,步骤1的预处理还根据分析特征数据,将明显不具备含文本特征的图片剔除出处理流程,以减轻处理负荷。
[0024]进一步地的,步骤2的训练包含以下流程:
[0025]步骤2

1,选取大量样本图片统一二值化处理;
[0026]步骤2

2,生成训练集和测试集并转换二进制文件;
[0027]步骤2

3,使用训练脚本执行训练集;
[0028]步骤2

4,使用测试脚本在测试集上验证效果并导入新模型。
[0029]本专利技术采用以上技术方案,引入基于图形学的预处理,针对5G消息垃圾图片的特征进行优化,以图形学运算的少量时间代价获得光学字符识别阶段的大量效率提升。本专利技术可以根据图片变体现状控制样本图片灵活选择模型训练的方向,提高识别准确率。
[0030]本专利技术与现有技术相比,主要优势在于:1.识别速度快,在有GPU硬件支持的条件下可以通过架构优化支持大量并发的实时处理。在非GPU的条件下也可做到大量并发的准实时处理和小业务量系统的实时处理。2.光学字符识别建立在国产开源套件上,中文识别率远高于业界通用的Tesseract。3.根据大量现有的样本图片案例进行模型训练,对非标准字体的识别率较高。
附图说明
[0031]以下结合附图和具体实施方式对本专利技术做进一步详细说明;
[0032]图1为本专利技术一种5G消息中图片内文字实时提取的管控方法的流程示意图。
具体实施方式
[0033]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图对本申请实施例中的技术方案进行清楚、完整地描述。
[0034]在5G消息里,图片将以类似IM的方式直接发送和融入交互场景。且5G消息不像IM一样维护通信实体的名单,5G消息的受话方是可以基于号码的。故在管控不能位于终端的限制下,平台对图片监控的实时性准确率需求较彩信有了巨大的提高。
[0035]根据彩信平台和IM平台数据反馈显示,实时通信中的垃圾图片信息主要是以图片
的方式固化相关文本,并在图中添加干扰因子以逃避平台监控。对该类垃圾信息,本专利技术提出了一套基于opencv图像预处理和cnocr光学字符识别的文字提取方法,并在预处理算法、识别模型上进行合理优化,将速度和准确度提高到合理的阈值,实现实时图片鉴权要求。提取出的文本,交由普通文本过滤环节处理,返回最终判定结果,以实现对该类垃圾图片消息的管控。
[0036]OpenCV是一套基于BSD许可的开源的计算机视觉库,利用它提供的接口和函数可以很方便地对图像进行处理,是业界应用最广泛的视觉库之一。
[0037]cnocr是一款基于循环神经网络(CNN)和卷积神经网络(RNN)的国产轻量级开源OCR库,预置了对GPU硬件的支持,且在中文的识别和模型训练上要优于业界使用较多的谷歌开源库Tesseract。
[0038]如图1所示,本专利技术公开了一种5G消息中图片内文字实时提取的管控方法,其包括以下步骤:
[0039]步骤1,图形学处理在opencv框架下使用自写算法和封装本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种5G消息中图片内文字实时提取的管控方法,其特征在于:其包括以下步骤:步骤1,图形学处理在opencv框架下对图片进行预处理;具体包括以下步骤:步骤1

1,图片灰度化;灰度图是一幅只含亮度信息不含色彩信息的单通道图像,每个像素就是其亮度值;步骤1

2,灰度图片阈值分割和二值化;步骤1

3,对二值化后的图片进行降噪处理有效去除独立噪点;步骤1

4,进行边缘检测得到文字的边缘高亮图,并从形态学上膨胀和腐蚀后获得文本区块;步骤1

5,获得文本区块外缘所占据的最大矩形的四角坐标,在二值图中获得各个文本块;步骤1

6,将各个文本块整齐拼接为一个图片;步骤2,光学字符识别在cnocr套件下根据5G消息垃圾图片特征训练好模型;提高光学字符识别对非规范文字和垃圾信息图片常见字体的识别;步骤3,管控业务流程将提取出的文本进行关键词匹配并实时返回管控结果;同时将文本送统计模块进行自然语言识别以发现嫌疑和生成推荐策略。2.根据权利要求1所述的一种5G消息中图片内文字...

【专利技术属性】
技术研发人员:黄书涵陈淼生郑仲嵩
申请(专利权)人:中电福富信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1