一种社交媒体敏感信息识别方法、装置、设备及存储介质制造方法及图纸

技术编号：37807190 阅读：24 留言：0更新日期：2023-06-09 09:37

本申请公开了一种社交媒体敏感信息识别方法、装置、设备及存储介质、涉及信息识别技术领域，包括：在社交媒体上抓取用户发送的内容以得到待识别信息；通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息，并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息；根据所述第二敏感信息生成相应用户的个体行为画像，并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像；将所述目标画像对应的所述第二敏感信息确定最终敏感信息。这样一来，本申请可以根据预设用户画像识别模型对敏感信息对应的用户行为画像进行识别判断，可以提高最终敏感信息的可信度。最终敏感信息的可信度。最终敏感信息的可信度。

全部详细技术资料下载

【技术实现步骤摘要】
一种社交媒体敏感信息识别方法、装置、设备及存储介质

[0001]本专利技术涉及信息识别
，特别涉及一种社交媒体敏感信息识别方法、装置、设备及存储介质。

技术介绍

[0002]近几年，社交媒体中的视频图像数据量迅速增长，并且通过对社交媒体上的图片、视频等内容进行分析预测，可以获取很多有价值的信息；但目前对于社交媒体中信息的筛选过程中，容易受到其中伪造信息的干扰，这样导致最终分析得到的结果不准确，在某些领域，例如军事领域，可能会导致严重的后果。由此可见，如何识别社交媒体中敏感信息的可靠性是本领域要解决的问题。

技术实现思路

[0003]有鉴于此，本专利技术的目的在于提供一种社交媒体敏感信息识别方法、装置、设备及存储介质，可以结合用户画像提高敏感信息的可信度。其具体方案如下：
[0004]第一方面，本申请提供了一种社交媒体敏感信息识别方法，包括：
[0005]在社交媒体上抓取用户发送的内容以得到待识别信息；
[0006]通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏...

【技术保护点】

【技术特征摘要】
1.一种社交媒体敏感信息识别方法，其特征在于，包括：在社交媒体上抓取用户发送的内容以得到待识别信息；通过预设敏感信息识别技术识别所述待识别信息中的敏感信息以得到第一敏感信息，并将基于预设伪造信息识别模型从所述第一敏感信息中确定出非伪造的敏感信息以得到第二敏感信息；根据所述第二敏感信息生成相应用户的个体行为画像，并利用预设用户画像识别模型从所述个体行为画像中识别出预设可靠个体的目标画像；将所述目标画像对应的所述第二敏感信息确定最终敏感信息。2.根据权利要求1所述的社交媒体敏感信息识别方法，其特征在于，所述通过预设敏感信息识别技术对所述待识别信息进行判断以得到第一敏感信息，包括：根据预设敏感关键字集合对所述待识别信息进行筛选以得到包含敏感关键字的待识别信息；通过预设图像识别技术以及预设语义识别技术分别对所述待识别信息中的图像以及语义进行判断以得到包含敏感图像和/或敏感语义的待识别信息；基于所述包含敏感关键字的待识别信息以及包含敏感图像和/或敏感语义的待识别信息得到所述第一敏感信息。3.根据权利要求1所述的社交媒体敏感信息识别方法，其特征在于，所述将基于预设伪造信息识别模型对所述第一敏感信息进行判断得到为非伪造的信息确定为第二敏感信息，包括：基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息；基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息；基于所述多媒体文件伪造敏感信息以及所述语义修改敏感信息得到所述第二敏感信息。4.根据权利要求3所述的社交媒体敏感信息识别方法，其特征在于，所述基于预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息之前，还包括：利用生成对抗网络的生成器根据现有自然人用户发送的初始多媒体文件生成新的多媒体向量序列；利用生成对抗网络的辨别器对所述新的多媒体向量序列以及所述初始多媒体文件对应的初始多媒体向量序列进行迭代训练，以得到用于识别多媒体向量序列对应的多媒体文件是否为凭空产生文件的所述预设多媒体文件伪造识别模型，以便基于所述预设多媒体文件伪造识别模型对所述第一敏感信息进行判断得到多媒体文件伪造敏感信息。5.根据权利要求3所述的社交媒体敏感信息识别方法，其特征在于，所述基于预设语义修改识别模型对所述第一敏感信息进行判断得到语义修改敏感信息之前，还包括：对现有自然人用户发送的初始多媒体文件进行语义级别修改以得到修改后多媒体向量序列；...

【专利技术属性】
技术研发人员：李彬，贾荫鹏，李圣伟，孙善宝，罗清彩，李锐，
申请(专利权)人：山东浪潮科学研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人