【技术实现步骤摘要】
社交媒体认知威胁检测方法及系统
[0001]本专利技术属于网络安全
,特别涉及一种社交媒体认知威胁检测方法及系统。
技术介绍
[0002]认知,是指人们获得知识或应用知识的过程,或信息加工的过程,它包括感觉、知觉、记忆、思维、想象和语言等。认知威胁基于对个体输入具有目的性、煽动性、隐蔽性、方向性、非真实性的信息,通过对个体认知过程不断的影响、固化而达到使个体形成扭曲、非常规、反向负面的认知,或是改变个体已有正常认知体系,使之背离社会核心价值体系。自媒体平台、社交平台的新兴为认知威胁的滋生、传播提供了温床。网络空间俨然已成为认知威胁对抗的主战场。社交网络具有身份匿名、言论“自由”、实时性高、传播快等特点,用户多是年轻人,对社会问题不敏感,极易被认知渗透。而认知威胁隐蔽性高、溯源难度大、跨平台监管困难等问题亟待解决,从技术上对认知威胁信息进行识别、溯源和对抗已经迫在眉睫。针对认知威胁隐蔽性高、溯源难度大、跨平台监管困难等问题,如何从技术上遏制认知威胁成为净化网络空间的迫切需求。
技术实现思路
[0003]为 ...
【技术保护点】
【技术特征摘要】
1.一种社交媒体认知威胁检测方法,其特征在于,包含如下内容:采集网络平台敏感话题文本数据并对数据进行预处理操作;针对预处理后的敏感话题文本数据,通过多层级认知威胁检测来获取认知威胁话题文本,其中,多层级认知威胁检测包含:将敏感话题文本数据划分为认知威胁话题文本和初始疑似认知威胁话题文本的初级检测,将初始疑似认知威胁话题文本分类为认知威胁话题文本、疑似认知威胁话题文本和非认知威胁话题文本的中级检测,和通过人工标注从疑似认知威胁话题文本来获取认知威胁话题文本的终极检测;通过对认知威胁话题文本的命名实体识别和实体关系抽取来构建认知威胁传播知识图谱;基于认知威胁传播知识图谱对认知威胁话题文本传播进行用户溯源、事件溯源以及组织溯源。2.根据权利要求1所述的社交媒体认知威胁检测方法,其特征在于,采集网络平台敏感话题文本数据并对数据进行预处理操作,包含:首先,根据用户授权信息库分布式采集网络平台敏感话题文本信息及相关用户数据;然后,针对采集的文本信息,将标题与正文进行合并,利用冗余检测算法去除冗余信息,将相关评论进行去重处理,对文本噪声数据进行清洗转换,并利用分词系统对文本进行分词处理。3.根据权利要求1所述的社交媒体认知威胁检测方法,其特征在于,初级检测中,利用情感分析方法将敏感话题文本数据划分为认知威胁话题文本和初始疑似认知威胁话题文本,其中,情感分析方法划分的过程包含:首先,依据已知情感词典并运用词频统计方法来构建基础情感词典,通过将文本数据中词语与基础情感词典中词汇进行相关性统计来扩充情感词典;接着,以敏感话题文本数据中文本为单位、以情感词为分隔符,对每个分隔符之间的断句进行情感权值统计,依据负向情感权值在所有情感词权值中的比重来判断文本的情感极性;然后,依据文本的情感极性将敏感话题文本数据划分为认知威胁话题文本和初始疑似认知威胁话题文本。4.根据权利要求3所述的社交媒体认知威胁检测方法,其特征在于,依据已知情感词典并运用词频统计方法来构建基础情感词典,包含:首先,在已知情感词典中选取系列情感词,依据系列情感词中搜索引擎点击量来对情感词进行排序,依据点击量热度来选取若干情感词;接着,基于词频统计选取与主题相关度最高的情感词汇,利用选取的若干情感词和情感词汇共同构成基础情感字典;然后,利用同义词及带情感倾向候选词对基础情感字典进行扩充。5.根据权利要求3所述的社交媒体认知威胁检测方法,其特征在于,对每个分隔符之间的断句进行情感权值统计,依据负向情感权值在所有情感词权值中的比重来判断文本的情感极性,包含:首先,针对分隔符之间的断句,分别通过情感词分析、否定词分析、副词分析、固定搭配词分析、转折词分析及感叹句分析来统计情感倾向;
然后,统计文本包含所有子句的负向情感倾向值总和与总体情感权值绝对值总和,并利用负向情感词权值在文本所有情感词权重纵占比来判断文本的情感极性。6.根据权利要求1所述的社交媒体认知威胁检测方法,其特征在于,中级检测中,利用深度学习方法将初始疑似认知威胁话...
【专利技术属性】
技术研发人员:李飞扬,姜迎畅,胡浩,吴疆,张玉臣,李炳龙,周洪伟,汪永伟,董书琴,谭晶磊,
申请(专利权)人:中国人民解放军战略支援部队信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。