一种社交媒体敏感信息识别方法、装置、设备及存储介质制造方法及图纸

技术编号:37807190 阅读:9 留言:0更新日期:2023-06-09 09:37
本申请公开了一种社交媒体敏感信息识别方法、装置、设备及存储介质、涉及信息识别技术领域,包括:在社交媒体上抓取用户发送的内容以得到待识别信息;通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;将所述目标画像对应的所述第二敏感信息确定最终敏感信息。这样一来,本申请可以根据预设用户画像识别模型对敏感信息对应的用户行为画像进行识别判断,可以提高最终敏感信息的可信度。最终敏感信息的可信度。最终敏感信息的可信度。

【技术实现步骤摘要】
一种社交媒体敏感信息识别方法、装置、设备及存储介质


[0001]本专利技术涉及信息识别
,特别涉及一种社交媒体敏感信息识别方法、装置、设备及存储介质。

技术介绍

[0002]近几年,社交媒体中的视频图像数据量迅速增长,并且通过对社交媒体上的图片、视频等内容进行分析预测,可以获取很多有价值的信息;但目前对于社交媒体中信息的筛选过程中,容易受到其中伪造信息的干扰,这样导致最终分析得到的结果不准确,在某些领域,例如军事领域,可能会导致严重的后果。由此可见,如何识别社交媒体中敏感信息的可靠性是本领域要解决的问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种社交媒体敏感信息识别方法、装置、设备及存储介质,可以结合用户画像提高敏感信息的可信度。其具体方案如下:
[0004]第一方面,本申请提供了一种社交媒体敏感信息识别方法,包括:
[0005]在社交媒体上抓取用户发送的内容以得到待识别信息;
[0006]通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;
[0007]根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;
[0008]将所述目标画像对应的所述第二敏感信息确定最终敏感信息。
[0009]可选的,所述通过预设敏感信息识别技术对所述待识别信息进行判断以得到第一敏感信息,包括:
[0010]根据预设敏感关键字集合对所述待识别信息进行筛选以得到包含敏感关键字的待识别信息;
[0011]通过预设图像识别技术以及预设语义识别技术分别对所述待识别信息中的图像以及语义进行判断以得到包含敏感图像和/或敏感语义的待识别信息;
[0012]基于所述包含敏感关键字的待识别信息以及包含敏感图像和/或敏感语义的待识别信息得到所述第一敏感信息。
[0013]可选的,所述将基于预设伪造信息识别模型对所述第一敏感信息进行判断得到为非伪造的信息确定为第二敏感信息,包括:
[0014]基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息;
[0015]基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息;
[0016]基于所述多媒体文件伪造敏感信息以及所述语义修改敏感信息得到所述第二敏感信息。
[0017]可选的,所述基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息之前,还包括:
[0018]利用生成对抗网络的生成器根据现有自然人用户发送的初始多媒体文件生成新的多媒体向量序列;
[0019]利用生成对抗网络的辨别器对所述新的多媒体向量序列以及所述初始多媒体文件对应的初始多媒体向量序列进行迭代训练,以得到用于识别多媒体向量序列对应的多媒体文件是否为凭空产生文件的所述预设多媒体文件伪造识别模型,以便基于所述预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息。
[0020]可选的,所述基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息之前,还包括:
[0021]对现有自然人用户发送的初始多媒体文件进行语义级别修改以得到修改后多媒体向量序列;
[0022]根据所述修改后多媒体向量序列利用生成对抗网络的生成器生成新的修改多媒体向量序列,并利用辨别器对所述新的修改多媒体向量序列以及所述修改后多媒体向量序列进行迭代训练以得到用于识别多媒体向量序列对应的多媒体文件是否为语义修改文件的所述语义修改识别模型,以便基于所述预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息。
[0023]可选的,所述根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像之前,还包括:
[0024]收集现有自然人用户信息,并根据所述自然人用户信息生成原始个体行为画像,以根据所述原始个体行为画像得到相应的原始用户信息向量序列;
[0025]利用生成对抗网络的生成器根据所述原始用户信息向量序列生成新的用户信息向量序列,并利用辨别器对所述新的用户信息向量序列以及所述原始用户信息向量序列进行迭代训练以得到用于识别个体行为画像的所述预设用户画像识别模型,以便利用所述预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像。
[0026]可选的,所述将所述目标画像对应的所述第二敏感信息确定最终敏感信息之后,还包括:
[0027]分别对个体行为画像为目标画像的所述最终敏感信息以及个体行为画像为非目标画像的敏感信息进行保存,以便工作人员进行处理。
[0028]第二方面,本申请提供了一种社交媒体敏感信息识别装置,包括:
[0029]信息抓取模块,用于在社交媒体上抓取用户发送的内容以得到待识别信息;
[0030]敏感信息识别模块,用于通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;
[0031]画像识别模块,用于根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;
[0032]敏感信息确定模块,用于将所述目标画像对应的所述第二敏感信息确定最终敏感
信息。
[0033]第三方面,本申请提供了一种电子设备,包括:
[0034]存储器,用于保存计算机程序;
[0035]处理器,用于执行所述计算机程序以实现如上述的社交媒体敏感信息识别方法。
[0036]第四方面,本申请提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现如上述的社交媒体敏感信息识别方法。
[0037]由此可见,本申请可以在社交媒体上抓取用户发送的内容以得到待识别信息;然后通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;再根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;然后将所述目标画像对应的所述第二敏感信息确定最终敏感信息。由此可见,本申请可以在通过预设敏感信息识别技术以及预设伪造信息识别模型判断出敏感信息之后,再结合敏感信息对应的个体行为画像判断出最终敏感信息,这样一来,可以提高最终敏感信息的可信度,以便后续进行敏感信息分析的操作。
附图说明
[0038]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社交媒体敏感信息识别方法,其特征在于,包括:在社交媒体上抓取用户发送的内容以得到待识别信息;通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息,并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息;根据所述第二敏感信息生成相应用户的个体行为画像,并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像;将所述目标画像对应的所述第二敏感信息确定最终敏感信息。2.根据权利要求1所述的社交媒体敏感信息识别方法,其特征在于,所述通过预设敏感信息识别技术对所述待识别信息进行判断以得到第一敏感信息,包括:根据预设敏感关键字集合对所述待识别信息进行筛选以得到包含敏感关键字的待识别信息;通过预设图像识别技术以及预设语义识别技术分别对所述待识别信息中的图像以及语义进行判断以得到包含敏感图像和/或敏感语义的待识别信息;基于所述包含敏感关键字的待识别信息以及包含敏感图像和/或敏感语义的待识别信息得到所述第一敏感信息。3.根据权利要求1所述的社交媒体敏感信息识别方法,其特征在于,所述将基于预设伪造信息识别模型对所述第一敏感信息进行判断得到为非伪造的信息确定为第二敏感信息,包括:基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息;基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息;基于所述多媒体文件伪造敏感信息以及所述语义修改敏感信息得到所述第二敏感信息。4.根据权利要求3所述的社交媒体敏感信息识别方法,其特征在于,所述基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息之前,还包括:利用生成对抗网络的生成器根据现有自然人用户发送的初始多媒体文件生成新的多媒体向量序列;利用生成对抗网络的辨别器对所述新的多媒体向量序列以及所述初始多媒体文件对应的初始多媒体向量序列进行迭代训练,以得到用于识别多媒体向量序列对应的多媒体文件是否为凭空产生文件的所述预设多媒体文件伪造识别模型,以便基于所述预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息。5.根据权利要求3所述的社交媒体敏感信息识别方法,其特征在于,所述基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息之前,还包括:对现有自然人用户发送的初始多媒体文件进行语义级别修改以得到修改后多媒体向量序列;...

【专利技术属性】
技术研发人员:李彬贾荫鹏李圣伟孙善宝罗清彩李锐
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1