一种5G消息中图片内文字实时提取的管控方法技术

技术编号：33246569 阅读：12 留言：0更新日期：2022-04-27 17:59

本发明专利技术公开一种5G消息中图片内文字实时提取的管控方法，引入基于图形学的预处理，针对5G消息垃圾图片的特征进行优化，以图形学运算的少量时间代价获得光学字符识别阶段的大量效率提升。本发明专利技术可以根据图片变体现状控制样本图片灵活选择模型训练的方向，提高识别准确率。在预处理算法、识别模型上进行合理优化，将速度和准确度提高到合理的阈值，实现实时图片鉴权要求。提取出的文本，交由普通文本过滤环节处理，返回最终判定结果，以实现对该类垃圾图片消息的管控。圾图片消息的管控。圾图片消息的管控。

全部详细技术资料下载

【技术实现步骤摘要】
一种5G消息中图片内文字实时提取的管控方法

[0001]本专利技术涉及5G技术应用领域，尤其涉及一种5G消息中图片内文字实时提取的管控方法。

技术介绍

[0002]随着5G时代来临，各运营商纷纷推出基于RCS(富媒体通信)的5G消息，以期在传统短彩信通信外的拓展更丰富的消息类业务。然而垃圾信息是一个从短信彩信到5G消息都无法根除的问题。完善垃圾信息管控平台是运营商与发送者间的长期赛跑。
[0003]有别于IM软件，5G消息的弱客户端特性导致信息管控能力需在设备端实现。而5G消息的实时场景又要求管控具备低时延。5G消息支持的媒体类型中，文本实时监控技术已很成熟；流媒体在目前的算力下很难做到实时过滤；而图片实时通信在5G消息之前主要是彩信，目前各运营商彩信业务量很低，低负荷使得设备资源可较好应付实时图片处理；且彩信很少处在实时交互的场景中，故对处理速度的要求不苛刻。

技术实现思路

[0004]本专利技术的目的在于提供一种5G消息中图片内文字实时提取的管控方法。
[0005]本专利技术采用的技术方案是：
[0006]一种5G消息中图片内文字实时提取的管控方法，其包括以下步骤：
[0007]步骤1，图形学处理在opencv框架下对图片进行预处理；具体包括以下步骤：
[0008]步骤1
‑
1，图片灰度化；灰度图是一幅只含亮度信息不含色彩信息的单通道图像,每个像素就是其亮度值；
[0009]步骤1
‑
2，灰度图片阈值分割和二值化；...

【技术保护点】

【技术特征摘要】
1.一种5G消息中图片内文字实时提取的管控方法，其特征在于：其包括以下步骤：步骤1，图形学处理在opencv框架下对图片进行预处理；具体包括以下步骤：步骤1
‑
1，图片灰度化；灰度图是一幅只含亮度信息不含色彩信息的单通道图像,每个像素就是其亮度值；步骤1
‑
2，灰度图片阈值分割和二值化；步骤1
‑
3，对二值化后的图片进行降噪处理有效去除独立噪点；步骤1
‑
4，进行边缘检测得到文字的边缘高亮图，并从形态学上膨胀和腐蚀后获得文本区块；步骤1
‑
5，获得文本区块外缘所占据的最大矩形的四角坐标，在二值图中获得各个文本块；步骤1
‑
6，将各个文本块整齐拼接为一个图片；步骤2，光学字符识别在cnocr套件下根据5G消息垃圾图片特征训练好模型；提高光学字符识别对非规范文字和垃圾信息图片常见字体的识别；步骤3，管控业务流程将提取出的文本进行关键词匹配并实时返回管控结果；同时将文本送统计模块进行自然语言识别以发现嫌疑和生成推荐策略。2.根据权利要求1所述的一种5G消息中图片内文字...

【专利技术属性】
技术研发人员：黄书涵，陈淼生，郑仲嵩，
申请(专利权)人：中电福富信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人