一种基于黑名单智能识别的交通信息发布安全检测方法技术

技术编号:22658831 阅读:14 留言:0更新日期:2019-11-28 03:24
本发明专利技术公开一种基于黑名单智能识别的交通信息发布安全检测方法,属于交通信息发布安全检测技术领域。本发明专利技术包括图像或者文字提取有效信息、建立敏感词库、计算哈希值、检索敏感词汇首字符和计算字符串哈希值判断是否匹配等操作步骤,它能够与黑名单中的敏感词汇快速检索匹配,深层检索,过滤敏感词,杜绝了窃入网络或前端设备发布违法信息的隐患,积极打造文明健康社会。

A traffic information release security detection method based on blacklist intelligent recognition

The invention discloses a traffic information release safety detection method based on blacklist intelligent recognition, which belongs to the technical field of traffic information release safety detection. The invention includes the operation steps of extracting effective information from image or text, building sensitive word bank, calculating hash value, retrieving the first character of sensitive word and calculating string hash value to determine whether to match. It can quickly retrieve and match sensitive words in blacklist, deeply retrieve and filter sensitive words, eliminate the hidden danger of stealing into network or front-end equipment to release illegal information, and actively Build a civilized and healthy society.

【技术实现步骤摘要】
一种基于黑名单智能识别的交通信息发布安全检测方法
本专利技术属于交通信息发布安全检测
,尤其涉及一种基于黑名单智能识别的交通信息发布安全检测方法。
技术介绍
交通信息发布属于面对公众的信息发布途径,目前交通信息发布系统基本上采用网络化设计,通过控制系统远程实现信息发布和设备控制,存在窃入网络或前端设备发布违法信息的隐患,造成不良社会影响。针对信息安全,目前多数方案采用信息加密、校验等手段,但对于脱离系统直接窃入前端进行非法信息发布缺少必要的防护手段。因此,需要一种基于黑名单智能识别的交通信息发布安全检测方法。
技术实现思路
针对现有技术的需求,本专利技术提供基于黑名单智能识别的交通信息发布安全检测方法。本专利技术的具体技术方案为:一种基于黑名单智能识别的交通信息发布安全检测方法,包括步骤(1)对文字传输方式或图片传输方式的指令,进行文字识别提取;步骤(2)将敏感词录入,并计算敏感词的哈希值;步骤(3)以哈希值作为检索索引存储敏感词;步骤(4)在带匹配文字串中检索敏感词首字母匹配位置,并记录;步骤(5)在有首字母的配位文字串中提取敏感词相同长度字符,并计算哈希值;步骤(6)对比提取文字哈希值与敏感词哈希值,若不同则跳转下一位置比对,若相同则逐字比对;步骤(7)若与黑名单中的敏感词不匹配,则移动到下一位置比对;若与黑名单中的敏感词匹配,则结束匹配。进一步的,所述步骤(1)中针对文字方式传输的发布指令,采用直接解码提取有效文字信息。进一步的,所述步骤(1)中针对图片方式传输的发布指令,首先采用图像语义分析算法,分析图片中包含文字的部分,并对于包含文字的图片进行文字识别提取。进一步的,采用YOLOV3算法,对检测文字在识别之前进行调整,其步骤包括:步骤(1.1)修改YOLO算法输出向量长度为12:2个boundingbox,2种对象,输出向量长度=2+2*(4+1)=12;步骤(1.2)公路行驶车辆可视能力和终端设备分辨率限制,有效可视发布内容在终端上采用单一13*13和26*26两种特征图,同时分别设置先验框为13*13特征图先验框(90x100),(312x302),(104x410)26*26特征图先验框(35x320),(36x36),(67x72);步骤(1.3)backbone网络选用tiny—darknet。进一步的,选用attention—mechanism模型用来识别图片传输方式的文字,其包括输入向量Icoarse、Glimpse网络、递归网络、Emission网络、Context网络和Classificayion网络;所述输入向量Icoarse包括单文字图片xn和位置ln;所述Glimpse网络,能够接收输入向量,输出向量为yn;其功能是从原始视觉输入向量中位置ln中提取一组特征:gn=Gimage(xn|Wimage)Gloc(ln|Wloc),其中Gimage(·)由三个卷积隐藏层组成,没有池层,最后一层为完全连接,位置向量由全连接隐含层网络Glod(ln|Wloc)处理;所述递归网络能够汇总个体Glimpse网络中提取的信息,并通过相干方法整合信息得出特殊信息;递归网络的输入为Glimpse网络输出gn;递归网络由两个具有非线性函数的递归层组成,输出为r(1)和r(2);所述Emission网络根据递归网络的当前内部状态控制输入;输入为递归网络当前状态,预测在何处为glimpse网络提取下一个输入;它由一个完全连接的隐藏层组成:所述Context网络:用于标识输入图片中的关键信息区域位置,为递归网络提供初始状态,其输出用于emission网络预测初始循环中Glimpse网络输入位置;网络使用三个卷积层,输入为原始文字图片,输出固定长度的向量cI;所述Classificayion网络根据最终特征向量rN(1)对类标签y进行预测:网络由全连接的隐藏层和SoftMax输出层组成。有益效果:本专利技术能够将文字传输方式和图片传输方式中的文字信息提取,与黑名单中的敏感词汇快速检索匹配,深层检索,过滤敏感词,杜绝了窃入网络或前端设备发布违法信息的隐患,积极打造文明健康社会。附图说明图1为本专利技术的逻辑结构示意图;图2为本专利技术的attention-mechanism模型结构示意图。具体实施方式下面结合附图和具体实施例,进一步阐明本专利技术,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。本种基于黑名单智能识别的交通信息发布安全检测方法,首先对收到的发布指令首先采取不同的处理方法提取有效内容。当收到的发布指令为文字方式传输的发布指令时,采用直接解码提取有效文字信息。当收到的发布指令为图片方式传输的发布指令时,采用图像语义分析算法,分析图片中包含文字的部分,并对于包含文字的图片进行文字识别提取。针对交通信息情报板发布设备的显示能力范围、分辨率、行驶车辆可视能力等方面特点,采用对YOLOV3算法调整来检测识别文字,以提高检测速度,适应前端嵌入式计算需求。调整算法如下:交通信息发布内容考虑图文发布的支持,需要对发布图片中图形和文字进行分类提取,因此修改YOLO算法输出向量长度为12:2个boundingbox,2种对象,输出向量长度=2+2*(4+1)=12。发布消息考虑公路行驶车辆可视能力和终端设备分辨率限制,有效可视发布内容在终端上需要为大尺寸显示因此采用单一13*13和26*26两种特征图,同时分别设置先验框为13*13特征图先验框(90x100),(312x302),(104x410);26*26特征图先验框(35x320),(36x36),(67x72)。backbone网络选用tiny-darknet以进一步降低对计算资源的要求,并提高速度。本实施例中采用一种设计的attention-mechanism模型来识别文字:其中各组成部分为:1)Icoarse:输入向量2)Glimpse网络:接收输入向量(单文字图片xn和位置ln),输出向量为yn,功能是从原始视觉输入向量中位置ln中提取一组有用的特征。gn=Gimage(xn|Wimage)Gloc(ln|Wloc)Gimage(·)通常由三个卷积隐藏层组成,没有池层,最后一层为完全连接,位置向量由全连接隐含层网络Gloc(ln|Wloc)处理。3)递归网络:汇总个体Glimpse网络中提取的信息,并通过相干方法整合信息得出特殊信息。递归网络的输入为Glimpse网络输出gn。递归网络由两个具有非线性函数的递归层组成,输出为r(1)和r(2)本文档来自技高网...

【技术保护点】
1.一种基于黑名单智能识别的交通信息发布安全检测方法,其特征在于:/n包括/n步骤(1)对文字传输方式或图片传输方式的发布指令,进行文字识别提取;/n步骤(2)将敏感词录入,建立敏感词库,并计算每个敏感词的哈希值;/n步骤(3)以哈希值作为检索索引敏感词;/n步骤(4)在带匹配文字串中检索敏感词首字母匹配位置,并记录;/n步骤(5)在有首字母的配位文字串中提取敏感词相同长度字符,并计算哈希值;/n步骤(6)对比提取文字哈希值与敏感词哈希值,若不同则跳转下一个首字母位置,返回步骤(5);若相同则进入步骤(7);/n步骤(7)将提取文字与敏感词逐字比对,若不匹配,则移动到下一个首字母位置返回步骤(5);若与黑名单中的敏感词匹配,则结束匹配。/n

【技术特征摘要】
1.一种基于黑名单智能识别的交通信息发布安全检测方法,其特征在于:
包括
步骤(1)对文字传输方式或图片传输方式的发布指令,进行文字识别提取;
步骤(2)将敏感词录入,建立敏感词库,并计算每个敏感词的哈希值;
步骤(3)以哈希值作为检索索引敏感词;
步骤(4)在带匹配文字串中检索敏感词首字母匹配位置,并记录;
步骤(5)在有首字母的配位文字串中提取敏感词相同长度字符,并计算哈希值;
步骤(6)对比提取文字哈希值与敏感词哈希值,若不同则跳转下一个首字母位置,返回步骤(5);若相同则进入步骤(7);
步骤(7)将提取文字与敏感词逐字比对,若不匹配,则移动到下一个首字母位置返回步骤(5);若与黑名单中的敏感词匹配,则结束匹配。


2.根据权利要求1所述的基于黑名单智能识别的交通信息发布安全检测方法,其特征在于:所述步骤(1)中针对文字方式传输的发布指令,采用直接解码提取有效文字信息。


3.根据权利要求1所述的基于黑名单智能识别的交通信息发布安全检测方法,其特征在于:
所述步骤(1)中针对图片方式传输的发布指令,采用图像语义分析算法,分析图片中包含文字的部分,并对于包含文字的图片进行文字识别提取。


4.根据权利要求3所述的基于黑名单智能识别的交通信息发布安全检测方法,其特征在于:所述图像语义分析算法采用YOLOV3算法,对检测文字在识别之前进行调整,其步骤包括:
步骤(1.1)修改YOLO算法输出向量长度为12:2个boundingbox,2种对象,输出向量长度=2+2*(4+1)=12;
步骤(1.2)公路行驶车辆可视能力和终端设备分辨率限制,有效可视发布内容在终端上采用单一13*13和26*26两种特征图,同时分别设置先验框为13*13特征图先验框(90x100),(312x302),(104x410);
26*26特征图先验框(35x320),...

【专利技术属性】
技术研发人员:李涛陆超韩光威
申请(专利权)人:南京逸杰软件科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1