【技术实现步骤摘要】
敏感词识别方法、装置、电子设备及存储介质
[0001]本专利技术涉及智能决策领域,尤其涉及一种敏感词识别方法、装置、电子设备及计算机可读存储介质。
技术介绍
[0002]现有的敏感词识别算法都是基于纯文本的单模态算法,这种单模态算法无法很好地识别视觉上比较相似的敏感词,从而导致敏感词的识别准确度不高。
技术实现思路
[0003]本专利技术提供一种敏感词识别方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高敏感词的识别准确度。
[0004]为实现上述目的,本专利技术提供的一种敏感词识别方法,包括:
[0005]接收待识别文本及其对应的文本图片,对所述待识别文本进行字符切割,得到文本字符序列,并对所述文本图片进行尺寸重置,得到重置文本图片;
[0006]利用文字语义识别模型对所述文本字符序列进行语义编码,得到语义编码序列;
[0007]利用图片字形识别模型对所述重置文本图片进行字形编码,得到字形编码序列;
[0008]将所述语义编码序列和所述字形编码序列进行融合, ...
【技术保护点】
【技术特征摘要】
1.一种敏感词识别方法,其特征在于,所述方法包括:接收待识别文本及其对应的文本图片,对所述待识别文本进行字符切割,得到文本字符序列,并对所述文本图片进行尺寸重置,得到重置文本图片;利用文字语义识别模型对所述文本字符序列进行语义编码,得到语义编码序列;利用图片字形识别模型对所述重置文本图片进行字形编码,得到字形编码序列;将所述语义编码序列和所述字形编码序列进行融合,得到融合编码序列;利用字符类别识别模型识别所述融合编码序列的字符序列类别,并根据所述字符序列类别,识别所述待识别文本中的敏感词。2.如权利要求1所述的敏感词识别方法,其特征在于,所述利用文字语义识别模型对所述文本字符序列进行语义编码,得到语义编码序列,包括:利用所述文字语义识别模型中的位置编码层对所述文本字符序列进行位置编码,得到位置编码字符序列;利用所述文字语义识别模型中的注意力编码层对所述位置编码字符序列进行上下文语义识别,得到语义字符序列;利用所述文字语义识别模型中的残差连接层将所述语义字符序列和所述文本字符序列进行连接,并利用所述字语义识别模型中的全连接层输出连接后的所述语义字符序列和所述文本字符序列,得到语义编码序列。3.如权利要求2所述的敏感词识别方法,其特征在于,所述利用所述文字语义识别模型中的位置编码层对所述文本字符序列进行位置编码,得到位置编码字符序列,包括:利用所述位置编码层中的字符嵌入模块对所述文本字符序列进行字符位置编码,得到字符位置序列;利用所述位置编码层中的词嵌入模块对所述文本字符序列进行词位置编码,得到词位置序列;利用所述位置编码层的位置编码函数标记所述文本字符序列的指针位置序列;根据所述字符位置序列、词位置序列以及指针位置序列,生成所述位置编码字符序列。4.如权利要求2所述的敏感词识别方法,其特征在于,所述利用所述文字语义识别模型中的注意力编码层对所述位置编码字符序列进行上下文语义识别,得到语义字符序列,包括:利用所述注意力编码层中的压缩模块对所述位置编码字符序列进行降维;利用所述注意力编码层中的编码器对降维后的所述位置编码字符序列进行语义编码;利用所述注意力编码层中的解码器对语义编码后的所述位置编码字符序列进行语义识别,得到语义编码序列。5.如权利要求1所述的敏感词识别方法,其特征在于,所述利用图片字形识别模型对所述重置文本图片进行字形编码,得到字形编码序列,包括:利用所述图片字形识别模型中的卷积...
【专利技术属性】
技术研发人员:吴晓东,
申请(专利权)人:平安国际智慧城市科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。