当前位置: 首页 > 专利查询>武汉大学专利>正文

基于事件态势与用户认知的危机信息推送方法及系统技术方案

技术编号:34764777 阅读:19 留言:0更新日期:2022-08-31 19:12
本发明专利技术公开了一种基于事件态势与用户认知的危机信息推送方法及系统,利用数据挖掘方法来识别用户对危机事件的认知状态,构建完整的危机事件信息库,并通过危机信息与目标用户之间的匹配关系,发现用户存在的信息缺口与极端情绪,有针对性地动态识别信息发送的目标用户以及填补其信息缺口、调整极端情绪的重要信息。由于随着新信息的吸收,用户对危机情境的认知是一种迭代式的、循序渐进的状态,因此本发明专利技术会针对用户不断变更的认知而“随机应变”,依据具体的认知需求提供相应的推荐信息,从而对用户认知起到补充或调节作用。对用户认知起到补充或调节作用。对用户认知起到补充或调节作用。

【技术实现步骤摘要】
基于事件态势与用户认知的危机信息推送方法及系统

技术介绍

[0001]本专利技术属于大数据信息匹配及推送
,涉及一种危机信息推送方法及系统,具体涉及一种基于事件态势与用户认知的危机信息推送方法及系统。
[0002]
技术介绍

[0003]社交媒体环境下,公共危机信息服务可能面临两难局面,一方面某些群体因信息闭塞而低估事件的严重性,另一方面某些群体因信息过载而陷入恐惧与焦虑。因此,如何根据用户之间差异化的危机认知,向用户进行个性化的危机信息发送,及时补充其所需的危机信息,具有十分重要的意义。
[0004]在已有的个性化信息推荐中,平台往往只依托用户的历史兴趣去推荐符合用户偏好的信息,无法对用户的需求产生正确的、真实的、完整的认识,并不完全适用于危机情境下的信息服务。公共危机发生后,如果大众仅关注其感兴趣的内容,长时间处于同质、重复信息的茧房与桎梏之中,就无法形成对危机情境的完整与正确认知。

技术实现思路

[0005]鉴于此,本专利技术旨在面向公共危机情境,为社交媒体平台提供一种以用户认知为基础,能够快速响应用户个性化、动态化需求的信息发送方法,即根据用户不断变更的认知状态,动态识别目标用户、调整推荐信息,并向有需求的目标用户及时敏捷地发送与危机相关的信息。
[0006]本专利技术的方法所采用的技术方案是:一种基于事件态势与用户认知的危机信息推送方法,包括以下步骤:
[0007]步骤1:检索社交媒体中与危机事件相关的关键词,获取社交媒体中所有相关数据及用户数据,并对数据进行预处理;/>[0008]步骤2:危机事件画像,在此基础上建立完整的危机事件信息库;
[0009]步骤3:社交媒体用户对危机认知画像;
[0010]建立社交媒体用户对危机认知画像的标签体系,按照原始数据—事实标签—画像标签的路径进行用户画像;
[0011]所述标签体系分为三个部分:用户基础属性、用户情境属性与用户认知属性;所述用户基础属性包括用户性别、年龄和是否认证信息;所述用户情境属性包括用户的空间属性和行业属性;所述用户认知属性包括用户认知的话题完整性、情绪极端性和观点影响力;
[0012]步骤4:识别出目标用户,通过危机信息与目标用户之间的匹配关系,进行危机信息的敏捷推送。
[0013]本专利技术的系统所采用的技术方案是:一种基于事件态势与用户认知的危机信息推送系统,包括以下模块:
[0014]模块1,用于检索社交媒体中与危机事件相关的关键词,获取社交媒体中所有相关数据及用户数据,并对数据进行预处理;
[0015]模块2,用于危机事件画像,在此基础上建立完整的危机事件信息库;
[0016]模块3,用于社交媒体用户对危机认知画像;
[0017]建立社交媒体用户对危机认知画像的标签体系,按照原始数据—事实标签—画像标签的路径进行用户画像;
[0018]所述标签体系分为三个部分:用户基础属性、用户情境属性与用户认知属性;所述用户基础属性包括用户性别、年龄和是否认证信息;所述用户情境属性包括用户的空间属性和行业属性;所述用户认知属性包括用户认知的话题完整性、情绪极端性和观点影响力;
[0019]模块4,用于识别出目标用户,通过危机信息与目标用户之间的匹配关系,进行危机信息的敏捷推送。
[0020]本专利技术的有益效果为:
[0021](1)提出测量用户对危机事件的涉入度计算方法,建立各类用户对危机事件的基本信息知晓标准。
[0022]将用户的空间属性、行业属性和危机事件的背景信息进行关联分析,将用户划分为高、中、低三类危机涉入度人群;针对各类危机涉入度的用户,计算关注每个话题的用户数量,它反映各类涉入度用户对于每个话题的现实需求程度,按照关注用户数对所有话题进行降序排列,以排序前n的话题类别作为某类用户信息知晓的最低标准。
[0023](2)构建用户认知状态分析方法,确定敏捷信息发送的目标用户。
[0024]本专利技术利用数据画像方法,设计用户认知的动态画像,确立危机情境下用户认知状态的分析方法,通过对比用户认知和基本信息知晓标准,来确定危机信息敏捷发送的三类目标用户,即话题缺口型、情绪极端型以及观点引导型。
[0025](3)针对当前个性化信息推荐存在的信息茧房问题,提出根据用户认知状态与事件情境的信息敏捷发送策略。
[0026]目前的无差别危机信息服务存在针对性不足的问题,而个性化信息推荐方法大多是仅根据用户兴趣进行信息推荐,容易导致用户陷入信息茧房,忽略重要信息。本专利技术通过度量用户的认知缺口、极端情绪与观点影响力,对现有的用户偏好导向的个性化信息推荐方法进行优化,综合话题、情感、热度、时间等指标进行加权计算与匹配,以用户认知为核心进行信息的敏捷发送,实现了推送信息与用户差异化、动态化认知需求的契合,,提高了危机信息发送的效率与针对性,更加适用于危机响应及信息服务场景,使公众全面、科学地认知危机情境。
附图说明
[0027]图1为本专利技术实施例的方法流程图。
具体实施方式
[0028]为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0029]请见图1,本专利技术提供的一种基于事件态势与用户认知的危机信息推送方法,包括以下步骤:
[0030]步骤1:对政府门户网站和社交媒体平台上的危机事件数据与用户数据进行实时
采集与预处理。
[0031]本实施例首先,通过微博(或其它社交媒体平台)检索与危机事件相关的关键词,获取所有相关微博数据。相关微博数据包括博主id、博文、发布时间、获得的转发/评论/点赞数量等信息。然后,进一步获取每条微博下的评论及转发数据。根据获取到的微博网址,得到评论用户id、评论内容、评论时间、评论获回复/点赞数等评论数据,以及转发用户id、转发评论内容、转发时间、转发获点赞/转发数等转发数据。最后,利用获取的所有发布微博用户、转发用户、评论用户的微博主页网址,抓取用户个人信息,包括用户名、性别、认证信息、个人简介、标签、关注数、粉丝数、微博数、所在地、大学、职业、注册时间等个人信息数据。
[0032]本实施例数据预处理包括两个部分:对微博数据的预处理和对用户数据的预处理。对微博数据进行预处理主要包括过滤与清洗微博数据、构建自定义用户分词词典、微博文本分词与去停用词。对用户数据进行预处理的主要目的是对用户进行分类,将官方账户、个人用户以及他们发布的微博区分开来。
[0033]步骤2:基于官方账户发布的事件相关微博信息,提取事件的关键信息,包括话题、评价、热度、背景等,勾勒事件态势并构建事件的危机信息库。
[0034]本实施例通过提取事件主副线信息链,完成危机事件画像。其中,主线信息链是核心部分,它们刻画事件的“情节”特征,主要包括话题信息。副线信息链是补充部分,它们刻画事件的“细节”特征,主要包括背景信息、评价信息本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于事件态势与用户认知的危机信息推送方法,其特征在于,包括以下步骤:步骤1:检索社交媒体中与危机事件相关的关键词,获取社交媒体中所有相关数据及用户数据,并对数据进行预处理;步骤2:危机事件画像,在此基础上建立完整的危机事件信息库;步骤3:社交媒体用户对危机认知画像;建立社交媒体用户对危机认知画像的标签体系,按照原始数据—事实标签—画像标签的路径进行用户画像;所述标签体系分为三个部分:用户基础属性、用户情境属性与用户认知属性;所述用户基础属性包括用户性别、年龄和是否认证信息;所述用户情境属性包括用户的空间属性和行业属性;所述用户认知属性包括用户认知的话题完整性、情绪极端性和观点影响力;步骤4:识别出目标用户,通过危机信息与目标用户之间的匹配关系,进行危机信息的敏捷推送。2.根据权利要求1所述的基于事件态势与用户认知的危机信息推送方法,其特征在于:步骤1中所述对数据进行预处理,对社交媒体数据进行预处理包括过滤与清洗社交媒体数据、构建自定义用户分词词典、社交媒体文本分词与去停用词;对用户数据进行预处理包括对用户进行分类,将官方账户、个人用户以及他们发布的信息区分开来。3.根据权利要求1所述的基于事件态势与用户认知的危机信息推送方法,其特征在于:步骤2中,通过提取危机事件主副线信息链,完成危机事件画像;其中,主线信息链用于刻画事件的“情节”特征,包括事件的话题信息;副线信息链用于刻画事件的“细节”特征,包括事件的背景信息、评价信息、热度信息;通过抽取以上特征信息,最终得到完整的事件画像。4.根据权利要求1所述的基于事件态势与用户认知的危机信息推送方法,其特征在于:步骤3中,所述用户情境属性,其识别过程主要包括以下三个步骤:(1)对用户原始数据进行统计分析与自然语言处理,得到用户地理位置与行业的事实标签;(2)将用户的地理位置、行业分别与危机事件的波及地区、行业进行关联分析,判断用户是否处于风险地区或行业;(3)综合用户与事件的空间关联和行业关联,识别出用户的危机涉入度特征。5.根据权利要求4所述的基于事件态势与用户认知的危机信息推送方法,其特征在于:所述将用户的地理位置、行业分别与危机事件的波及地区、行业进行关联分析;其中,地区关联的判断规则为:其中,user
r_dist
为用户与危机事件的地区关联,其值为2时代表用户地理位置user
district
位于与危机事件同省的危机事件地区Event
district1
,值为1时代表用户地理位置user
district
位于与危机事件地理相邻的相关地区Event
district2
,值为0时代表用户位于其他地区Event
district
;当用户地理位置user
district
在危机事件可能波及的范围之内时,用户与事件间存在地区关联;所述将用户的地理位置、行业分别与危机事件的波及地区、行业进行关联分析;其中,
行业关联的判断规则为:其中,user
r_indus
为用户与危机事件的行业关联,其值为1时代表用户的行业属性user
industry
处于受危机事件影响的行业Event
industry
,值为0时代表用户的行业属性user
industry
处于未受危机事件影响的行业;当用户的行业类别在危机事件的影响群体之内时,用户与事件间存在行业关联。6.根据权利要求1所述的基于事件态势与用户认知的危机信息推送方法,其特征在于:步骤3中,为了刻画用户认知的话题完整性,通过判断每位用户生成和获取的社交媒体所包含的话题,来识别用户的话题认知状态,构建用户话题认知矩阵Cog
user_topic
为:其中,n为社交媒体用户数量,k为话题数量,t
ij
表示第i个用户发布的信息在第j个主题上的分布,若存在则为1,否则为0;i=1,2,...,n;j=1,2,...,k;为了刻画用户认知的情绪极端性,对于任一用户,将其在某一话题上的信息集合表示为F=(f1,f2,...,f
l
,...,f),识别得到的对应的情感值表示为E=(e1,e2,...,e
l
,...,e);考虑到时间因素对用户情感的影响,对时间越近的信息赋予较越大的权重,信息f
l
的时间因子u
l
的定义为:等式(4)中,t
l
是用户获取或发布信息f
l
的时间,t0是当前时间,α是时间衰减参数,通过实验确定;则用户在该话题上的综合情感倾向与强度为:其中,e
l
是用户在第l个主题上的情感倾向与强度;利用等式(5)计算所有用户在各话题上的综合情感倾向与强度,通过构建话题

情感关系矩阵(6),来表示用户目前对危机认知的情绪状态:其中,n为社交媒体用户数量,k为事件话题数量,e
ij
表示第i个用户在第j个话题上的情感倾向与强度;i=1,2,...,n;j=1,2,...,k;为了刻画用户的观点影响力,根据用户近期所发布信息获...

【专利技术属性】
技术研发人员:安璐周雯静李纲余传明
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1