【技术实现步骤摘要】
一种信息识别方法、装置、设备及计算机可读存储介质
[0001]本申请涉及信息处理领域,涉及但不限于一种信息识别方法、装置、设备及计算机可读存储介质。
技术介绍
[0002]随着移动终端的不断普及,移动终端已经成为人们日常生活中必不可少的一部分,在移动终端带来高效、便捷的同时,也存在一些安全隐患,举例来说,手机短信成为接收银行、支付软件、云盘以及其他各种平台信息的重要通道,诈骗短信模仿官方机构通过发送包含诈骗网络链接的手机短信的方式对用户的金钱、支付密码及其他重要隐私进行诈骗。
[0003]在相关技术中,一些使用已知短信文本特征向量及其对应诈骗类别训练出一个文本多分类模型,并使用该模型对诈骗短信进行识别,该方法只利用了诈骗短信的文本信息特征,对文本信息和官方短信极为相似的诈骗短信容易漏判,从而影响诈骗短信的识别准确率;另一些使用Word2Vec将分词后的词语转换成词向量,对短信文本进行特征抽取,该方法只利用了诈骗短信的文本信息特征,并未利用诈骗短信的网络链接特征,从而影响诈骗短信的识别精度,且该方法使用长短期记忆(Long Short
‑
Term Memory,LSTM)神经网络对文本进行处理,速度较慢,无法适用第五代移动通信技术(5th Generation Mobile Communication Technology,5G)海量数据场景下的诈骗短信识别;还有一些相关技术除短信文本外还需要获取包括发送侧地址、发送基站、发送频率、接收侧地址等等多个维度的特征,这些特征获取难度较大、成本较高, ...
【技术保护点】
【技术特征摘要】
1.一种信息识别方法,其特征在于,所述方法包括:获取待处理信息,对所述待处理信息进行分离处理,得到文本数据和链接数据;分别对所述文本数据和所述链接数据进行特征提取,得到对应的文本特征和链接特征;基于所述链接数据和预先构建好的链接知识库确定所述链接数据的相似度属性信息;基于所述文本特征、所述链接特征和所述相似度属性信息确定所述待处理信息的识别结果。2.根据权利要求1中所述的方法,其特征在于,在所述获取待处理信息,对所述待处理信息进行分离处理,得到文本数据和链接数据之前,所述方法还包括:获取训练好的识别模型,所述训练好的识别模型包括训练好的文本特征提取子模型、训练好的链接特征提取子模型、训练好的相似度处理子模型和训练好的融合特征子模型;所述分别对所述文本数据和所述链接数据进行特征提取,得到对应的文本特征和链接特征,包括:利用所述训练好的文本特征提取子模型,对所述文本数据进行特征提取,得到所述文本特征;利用所述训练好的链接特征提取子模型,对所述链接数据进行特征提取,得到所述链接特征;所述基于所述链接数据和预先构建好的链接知识库确定所述链接数据的相似度属性信息,包括:利用所述训练好的相似度处理子模型,对所述链接数据和所述链接知识库进行相似度处理,得到所述相似度属性信息;所述基于所述文本特征、所述链接特征和所述相似度属性信息确定所述待处理信息的识别结果,包括:利用所述训练好的融合特征子模型,对所述文本特征、所述链接特征和所述相似度属性信息进行融合处理,得到所述待处理信息的识别结果。3.根据权利要求2中所述的方法,其特征在于,所述利用所述训练好的文本特征提取子模型,对所述文本数据进行特征提取,得到所述文本特征,包括:对所述文本数据进行文本规范化处理,得到处理后的文本数据;对所述处理后的文本数据进行向量化处理,得到文本向量;对所述文本向量进行卷积、池化处理,得到所述文本特征。4.根据权利要求2中所述的方法,其特征在于,所述利用所述训练好的链接特征提取子模型,对所述链接数据进行特征提取,得到所述链接特征,包括:对所述链接数据进行卷积处理,得到卷积结果;对所述卷积结果进行池化处理,得到所述链接特征。5.根据权利要求2中所述的方法,其特征在于,所述链接知识库中包括多个参考链接数据,所述利用所述训练好的相似度处理子模型,对所述链接数据和所述链接知识库进行相似度处理,得到所述相似度属性信息,包括:确定所述链接知识库中包括与所述链接数据满足匹配条件的目标参考链接数据时,获取所述目标参考链接数据的第一标签信息;将所述链接数据和所述链接知识库之间的相似度值设置为预设值;将所述预设值和所述第一标签信息确定为所述相似度属性信息。6.根据权利要求5中所述的方法,其特征在于,所述利用所述训练好的相似度处理子模型,对所述链接数据和所述链接知识库进行相似度处理,得到所述相似度属性信息,还包
括:确定所述链接知识库中不包括与所述链接数据满足匹配条件的目标链接数据时,确定所述链接数据和所述链接知识库各个参考链接数据之间的各个相似度值;确定所述各个相似度值中的最大相似度值,并将所述最大相似度值对应的参...
【专利技术属性】
技术研发人员:孙祥训,程宝平,谢小燕,
申请(专利权)人:中国移动通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。