【技术实现步骤摘要】
一种面向黑客论坛的用户画像构建方法
本专利技术提出了一种面向黑客论坛的用户画像构建方法,用于对国外著名黑客论坛的成员构建用户画像。该面向黑客论坛的用户画像构建方法分为用户基本信息构建、用户研究领域提取、用户技术能力评估三个模块。用户基本信息构建模块基于统计学方法和数据挖掘技术,实现用户身份信息的采集和黑客活跃度的统计。用户研究领域提取模块基于机器学习算法,通过对黑客论坛中的用户数据进行聚类、分类,提取出用户的研究领域。用户技术能力评估模块基于机器学习算法,对用户的社交网络影响力和其发言质量进行分析进而评估其技术能力。该面向黑客论坛的用户画像构建方法通过对公开的论坛讨论数据进行处理,合理多方位的对黑客论坛中的用户的技术水平、研究方向、活跃程度、社交网络影响等多个属性进行刻画,提供一个较为精准的用户画像方法。
技术介绍
随着网络安全形势日益严峻,在社交网络中也出现了一些专门用来交流黑客技术的论坛。这些黑客论坛中聚集大量的资深黑客以及安全研究者。其行为包括交流黑客技术;传播黑客工具、源代码;组织黑客攻击行动等。对这些黑客论坛中的用 ...
【技术保护点】
1.一种面向黑客技术社区的用户画像构建方法,其特征在于:包括:用户基本信息构建模块,用户研究领域提取模块,用户技术能力评估模块。/n
【技术特征摘要】
1.一种面向黑客技术社区的用户画像构建方法,其特征在于:包括:用户基本信息构建模块,用户研究领域提取模块,用户技术能力评估模块。
2.根据权利要求1所述的一种面向黑客技术社区的用户画像构建方法,其特征在于:用户基本信息构建模块分析步骤具体包括:
A、采集国内外著名黑客论坛的用户发言数据、以及用户的基本信息;
B、从用户基本信息中提取用户名、注册时间、用户等级等基本信息;
C、根据用户发言的来源收集其所属论坛名,同一用户可以来源于多个论坛,不同论坛相同用户名(不区分大小写)属于同一用户;
D、从发言数据中统计用户的活跃度,包括其参与讨论的发言数量和发起讨论的发言数量,按照一定比例确定黑客的活跃度高低;
E、用户基本信息构建结果展示于用户画像中。
3.根据权利要求1所述的一种面向黑客技术社区的用户画像构建方法,其特征在于:用户研究领域提取模块分析步骤具体包括:
A、将所有采集的用户发言以讨论群组为单位进行合并,得到每个讨论群组的用户发言集合;
B、以所有的讨论群组为数据集使用LDA算法进行聚类分析,提取主要的研究领域类型;
C、以...
【专利技术属性】
技术研发人员:黄诚,郭勇延,孙鹏,孙宇强,郭文博,
申请(专利权)人:四川大学,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。