字符级自注意力网络模型及字符型验证码安全检测方法技术

技术编号：39411394 阅读：11 留言：0更新日期：2023-11-19 16:03

本发明专利技术公开了一种字符级的自注意力网络模型及字符型验证码安全检测方法，模型包括：堆叠多尺度卷积主干网络能对输入的字符型验证码图片进行初步的特征提取并输出特征向量以及下采样操作；字符级自注意力Transformer网络与堆叠多尺度卷积主干网络输出端连接，其编码器用于对所述堆叠卷积主干网络输出的特征向量进行表征，解码器用于根据输入字符型验证码图片对应的右移字符序列和编码器的输出，得出对所述字符型验证码图片的字符序列的预测概率输出。该模型通过针对性地学习相邻字符之间的相关性，实现对字符序列更高效鲁棒的表征，在小训练数据集上表现出良好的泛化性能，大幅降低了识别验证码所需的时间和人力开销。大幅降低了识别验证码所需的时间和人力开销。大幅降低了识别验证码所需的时间和人力开销。

全部详细技术资料下载

【技术实现步骤摘要】
字符级自注意力网络模型及字符型验证码安全检测方法

[0001]本专利技术涉及计算机视觉及网络安全领域，尤其涉及一种字符级自注意力网络模型及字符型验证码安全检测方法。

技术介绍

[0002]字符型验证码是一类含有复杂的背景噪声和扭曲字符的图片，人类容易识别其中的字符，而机器难以识别。这类字符型验证码被广泛应用于各种网络的安全性保护。为了客观评估字符型验证码的安全性能，现有技术主要设计端到端的深度神经网络尝试识别字符型验证码，通过识别率对该字符型验证码的安全性进行度量。
[0003]目前基于深度网络模型的字符型验证码的识别方法主要有：
[0004](1)基于卷积神经网络的识别方法。参见对比文献1：Wang,J.,et al.“CAPTCHA recognition based on deep convolutional neural network”.Mathematical Biosciences and Engineering 2019。
[0005](2)基于循环神经网络
‑
注意力机制的识别方法。参见对比文献2：Yang,Z.,et al.“An End
‑
to
‑
End Attack on Text CAPTCHAs”.IEEE Transactions on Information Forensics and Security 2020。
[0006]现有识别方法中，训练深度网络模型需要搜集和标注大量的字符型验证码图片，往往需...

【技术保护点】

【技术特征摘要】
1.一种字符级的自注意力网络模型，其特征在于，包括：堆叠多尺度卷积主干网络、字符级自注意力Transformer网络；其中，所述堆叠多尺度卷积主干网络的输入端输入所识别字符型验证码图片，该堆叠多尺度卷积主干网络能对输入的字符型验证码图片进行初步的特征提取并输出特征向量，以及进行下采样操作；所述字符级自注意力Transformer网络，与所述堆叠多尺度卷积主干网络的输出端连接，该字符级自注意力Transformer网络由编码器连接解码器构成，所述编码器用于对所述堆叠卷积主干网络输出的初级特征向量进行表征，所述解码器以所识别字符型验证码图片对应标注的字符序列向右移一位处理后的右移字符序列作为输入，同时根据所述编码器的输出，得出对所述字符型验证码图片的字符序列的预测概率输出。2.根据权利要求1所述的字符级的自注意力网络模型，其特征在于，所述堆叠多尺度卷积主干网络是由多个堆叠的卷积神经网络组成的多尺度卷积的ResNet网络；所述字符级自注意力Transformer网络的编码器由依次连接的位置编码模块和多层堆叠的编码器字符级自注意力层组成，其中，所述位置编码模块的输入连接所述堆叠多尺度卷积主干网络的输出端；所述多层堆叠的编码器字符级自注意力层包括：依次连接的多头自注意力层、字符级掩码层、合并归一化层、前馈网络层和合并归一化层；所述字符级自注意力Transformer网络的解码器由依次连接的字符标签向量嵌入层、位置编码模块、单层的解码器字符级自注意力层、多层堆叠的编码器
‑
解码器自注意力层线性变换层和softmax层组成，其中，所述字符标签向量嵌入层的输入端，用于输入以所识别字符型验证码图片对应标注的字符序列向右移一位处理后的右移字符序列；所述单层的解码器字符级自注意力层包括：依次连接的多头自注意力层、字符级掩码层和合并归一化层；所述多层堆叠的编码器
‑
解码器多头自注意力层包括：依次连接的多头自注意力层、合并归一化层、前馈网络层和合并归一化层；所述编码器的输出连接所述解码器的多层堆叠的编码器
‑
解码器自注意力层的输入端。3.根据权利要求1所述的字符级的自注意力网络模型，其特征在于，所述多尺度卷积的ResNet网络包括：1
×
1卷积、5
×
5卷积、3
×
3卷积和2
×
2最大池化层；其中，所述1
×
1卷积代表映射短路连接，3
×
3卷积和5
×
5卷积分别提取不同邻域范围内的字符结构特征；所述1
×
1卷积、5
×
5卷积、3
×
3卷积的组合输入端连接作为该多尺度卷积的ResNet网络的输入端，该1
×
1卷积、5
×
5卷积、3
×
3卷积的输出组合端与2
×
2最大池化层连接；所述2
×
2最大池化层以步长为2、窗口大小为2
×
2对卷积输出在组合后进行下采样。4.根据权利要求3所述的字符级的自注意力网络模型，其特征在于，所述5
×
5卷积由两个叠加的3
×
3卷积组成。
5.根据权利要求1至4任一项所述的字符级的自注意力网络模型，其特征在于，所述字符级自注意力Transformer网络的编码器按以下方式对所述堆叠卷积主干网络输出的初级特征向量进行表征，包括：所述编码器的位置编码模块用以下公式(1)表示的绝对位置编码将位置信息嵌入到所述初级特征向量中得出对应于不同位置i的向量f
i
′
，所述公式(1)为：所述公式(1)中，为特征向量中对应于位置i的向量；中对应于位置i的向量；为第i个元素为1，其余元素均为0的独热编码向量[0,0,
…
,0,1,0,
…
0]；为权值参数矩阵，用于对独热编码向量进行线性变换；l
f
、d
h
分别为特征向量f对应的特征长度和特征通道数；将对应于不同位置i的向量f
i
′
组合成位置编码后的特征向量f
′
；所述编码器的多头自注意力层对所述位置编码后的特征向量f
′
分别通过线性变换映射为查询矩阵Q、键矩阵K和值矩阵V，用所述查询矩阵Q和的键矩阵的转置矩阵K
T

【专利技术属性】
技术研发人员：卿轲，张荣，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人