【技术实现步骤摘要】
一种基于多维度的网络空间人物画像方法
[0001]本专利技术属于计算机领域,尤其涉及一种基于多维度的网络空间人物画像评估方法。
技术介绍
[0002]随着计算机技术快速发展,互联网服务广泛普及,使人类社会逐步进入到网络化时代。2020年9月,我国互联网信息中心发布了第46次《中国互联网络发展状况统计报告》,其内容显示我国的网民规模达到9.4亿,普及率达67.0%。随着网民数量的不断增长,各类网络论坛、微博平台等社交媒体日益发展成熟,成为继报纸、电视等传统媒体之后传递各类信息的主要载体。开展对互联网中重点关注人物的全方位画像分析,对维护社会的稳定具有重要的应用价值。
[0003]按照人物画像过程中人物数据和应用方向的不同,现有技术的人物画像可以划分为基于行为数据的画像、基于社交媒体的画像。
[0004]基于行为数据的画像,是将人物的行为作为描绘人物画像模型构建的依据。人物行为是指人物为满足特定的信息需求在信息行为中采取的各种动作和表现,研究主要包括人物的信息检索行为、信息浏览行为等,来源多为访问日志。研究学者们主要从人物的访问信息中挖掘出其行为的规律与特征,构建画像模型。根据画像模型,信息服务提供者可以预测人物的行动,实现精准信息服务的目的。但该类人物画像领域性较强,且数据较难获取。
[0005]基于社交媒体数据的画像,是将人物在社交网络中的言论和交互行为作为描绘画像模型构建的依据。社交网络中的人物由于评论、转发、点赞等行为在网络世界构建了各种各样的社会化联系,这种联系具有纽带的作用,增强了人与 ...
【技术保护点】
【技术特征摘要】
1.一种基于多维度的网络空间人物画像方法,其步骤包括:1)构建网络空间的人物画像体系,所述人物画像体系包括人物的基本信息、个人经历、社交信息、用户标签和社会关系;2)对于一目标人物,从百度百科、维基百科爬取该目标人物的基本信息和社交信息;然后从社交信息中获取该目标人物的社交账号和关联人物,并根据社交账号从社交媒体采集该目标人物的用户注册信息、关注与被关注信息、用户发布信息和关注粉丝信息,用于补充该目标人物的社交信息;然后根据该目标人物在社交账号中的相关信息计算该目标人物的社交影响指数;3)依据该目标人物的姓名、所在单位搜集人物简历,获取该目标人物的个人经历;4)利用该目标人物的年龄阶段、职业所涉及行业作为目标人物标记身份标签;5)根据该目标人物在社交媒体Twitter中发布的消息数量,计算社交媒体Twitter相对于该目标人物的权重γ
Twitter
,并计算该目标人物在社交媒体Twitter中发布的消息中词语的TF
‑
IDF值,选取TF
‑
IDF值靠前的N个词语Twitter_Words(w1,w2,
…
,w
N
),然后将所选N个词语的TF
‑
IDF值与权重γ
Twitter
相乘,得到更新后的词语TF
‑
IDF值;6)根据该目标人物在微博中发布的消息数量,计算微博相对于该目标人物的权重γ
Weibo
,并计算该目标人物在微博中发布的消息中词语的TF
‑
IDF值,选取TF
‑
IDF值靠前的N个词语Weibo_Words(w1,w2,
…
,w
N
);然后将所选N个词语的TF
‑
IDF值与权重γ
Weibo
相乘,得到更新后的词语TF
‑
IDF值;7)根据步骤5)、6)所得更新后的词语TF
‑
IDF值对词语进行排序,选取TF
‑
IDF值靠前若干词语作为该目标人物的兴趣标签。2.如权利要求1所述的方法,其特征在于,计算该目标人物的用户社交影响力的方法为:2
‑
1)根据该目标人物的社交信息计算用户消息参与度其中n代表该目标人物最近一段时间T内发布的消息数量,SpreDegree
i
代表第i条消息的传播度,CoNum
i
代表第i条消息的评论数量,SuNum
i
代表第i条消息的点赞数量;2
‑
2)计算该目标人物的粉丝的认证情况和最新动态评估得出该目标人物的活跃粉丝数ActiveFan
′
;2
‑
3)根据该目标人物在Twitter和微博中的属性信息计算得出该目标人物的用户可信度Reliability;2
‑
4)利用层次分析法计算该目标人物的用户消息参与度Participation、活跃粉丝数ActiveFan
′
、可信度Reliability相对用户影响的权重,分别为w
par
,w
fan
,w
rel
;2
‑
5)计算该目标人物的在Twitter、微博的影响力Influence
t∈{Twitter,Weibo}
=w
par
×
Participation+w
fan
×
ActiveFan
′
+w
rel
×
Reliability;2
‑
6)基于D
‑
S理论构建用户社交影响指数评估框架,将该目标人物在Twitter和微博中的影响力分别做归一化处理后作为用户社交影响指数评估框架的基本信任分配;2
‑
...
【专利技术属性】
技术研发人员:彭媛媛,张海霞,连一峰,黄克振,刘倩,
申请(专利权)人:中国科学院软件研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。