System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息,具体是一种基于深度学习的校园群体事件预警方法。
技术介绍
1、作为开放性的文化组织,学校集中了大批有思想和热情的青年学生,他们思维活跃,关注社会发展,并表现为这个年龄段特有的热情和冲动,易产生具有公共性和破坏性的校园群体事件。由于信息媒体和网路技术的发展,校园群体事件在爆发之前一般会经过网络进行发酵和放大。因此,分析网络校园相关信息,并构建基于大数据和人工智能技术的校园群体事件预警平台是十分必要和紧迫的。
2、随着近年来人工智能技术的发展,有相关研究提出利用机器学习的方法来预测校园群体事件。然而大部分基于机器学习的方法存在两个问题。首先,网络中的校园群体事件相关内容均为非结构化的文本信息,传统机器学习方法依赖人工定义的特征信息,难以有效获取校园群体事件的深层次特征,从而降低了预测准确度。其次,校园群体事件在发生之前往往存在一定的隐藏期,与事件相关的数据具备一定的时序数据特征,现有方法忽略了之前数据对后续数据的影响关系,导致其难以发现相关数据中隐藏的校园群体事件。
3、因此,需要一种预测准确度高的、易发现问题的校园群体事件预警方法。
技术实现思路
1、本专利技术的目的在于提供一种基于深度学习的校园群体事件预警方法,以解决上述
技术介绍
中提出的问题。
2、为实现上述目的,本专利技术提供如下技术方案:
3、一种基于深度学习的校园群体事件预警方法,包括以下步骤:
4、步骤1:利用网络爬虫从网络交流平台(例如校园论
5、步骤2:对步骤1生成的所有负向评论数据进行聚类,形成候选评论集;
6、步骤3:按照一定的规则构建包含校园实体,事件短句,日期和事件类型的事件模式匹配规则库,并利用规则库中的模版从步骤2生成的候选评论集中提取潜在群体事件;
7、步骤4:以步骤3生成的潜在群体事件关联的评论数据为输入,构建基于注意力机制的深度学习模型获取事件语义特征;
8、步骤5:从步骤3生成的潜在群体事件所关联评论数据中提取负向情感词数量和负向评论数量,从步骤2生成的聚类信息中提取聚类松散度,构建校园群体事件量化指标;
9、步骤6:构建时序深度学习预测模型,利用步骤4生成的事件语义特征和步骤5中生成的校园群体事件量化指标对模型进行训练;
10、步骤7:将新数据输入步骤6得到的时序深度学习预测模型,获得预测指标值,若指标值超过阈值则将该事件作为校园群体事件进行预警提示。
11、作为本专利技术再进一步的方案:所述步骤1具体过程如下:
12、步骤11:对网络爬虫抓取的校园评论进行分词和去停用词,获取每条评论的关键词;
13、步骤12:利用负向情感词库,对每条评论的关键词进行匹配,若负向情感词超出阈值(例如出现5次以上)则判定为负向评论;
14、步骤13:对所获得的负向评论存储,形成校园负向评论数据集p={p1,p2,...,pm},其中pm代表第m个负向评论。
15、作为本专利技术再进一步的方案:所述步骤2具体过程如下:
16、步骤21:以校园负向评论数据集为基础,使用kmeans聚类算法对其进行聚类,其中类簇数目k设置为200,聚类距离计算选择欧几里得距离;
17、步骤22:以每个距离类簇最近的校园负向评论为代表,形成候选评论集b={b1,b2,...,bk}。
18、作为本专利技术再进一步的方案:所述步骤3具体过程如下:
19、步骤31:依据事件句主客体及触发词在句法结构上搭配关系的不同,定义校园事件抽取匹配规则,每一条事件的定义为<校园实体,事件短句,日期和事件类型>;
20、步骤32:根据匹配规则,通过步骤2进行事件抽取(具体表现为对步骤22中得到的候选事件集b={b1,b2,...,bk}中的每一个候选事件进行事件抽取;若事件集中的评论无法抽取事件,则选择步骤21步骤聚类结果中与类簇中心更远的一条评论,对其抽取事件);最终形成潜在群体事件集e={e1,e2,...,en}(其中n≤k),且每个潜在事件en均与一组评论数据集相关联,(该组评论来自于步骤s2.1中潜在事件en所对应类簇的所有评论)。
21、作为本专利技术再进一步的方案:所述步骤4具体过程如下:
22、步骤41:给定任意一条评论数据pi,其中sm为该的第m个句子,使用bert模型获得每个句子的向量表示则评论pi可表示为句子向量矩阵其中dv表示句子向量表示的维度,表示评论数据pi的句子个数;
23、步骤42:将输入注意力层以获得每个句子的筛选参数其过程如下:
24、
25、
26、在上述公式中,和是需要学习的参数,表示评论pi所有句向量的隐藏矩阵,relu()代表rectified激活函数;
27、步骤43:接下来使用生成的来重新给里的每一个句子向量重新赋权重,其过程为:
28、
29、其中,是一个标量值,对应分配给评论pi的第j个句子的权重参数,代表评论pi的第j个句子的原始向量;所有句子向量将形成新的句子向量矩阵
30、步骤44:求句子向量矩阵中所有句子的平均向量,从而获得评论数据pi的向量表示
31、步骤45:以天为单位,将与潜在事件en所关联的所有评论向量取平均,最终获得事件语义特征集e={e1,e2,...,en},其中表示t天内潜在事件en的向量表示集合,表示第t天潜在事件en的向量表示。
32、作为本专利技术再进一步的方案:所述步骤5具体过程如下:
33、步骤51:对潜在群体事件集e={e1,e2,...,en}中的任意一个事件en,统计第t天关联的评论数据集中所有评论的负向情感词数量,记为
34、步骤52:对潜在群体事件集e={e1,e2,...,en}中的任意一个事件en,统计第t天关联的评论数据集中所有负向评论的数量,记为
35、步骤53:对潜在群体事件集e={e1,e2,...,en}中的任意一个事件en,根据在步骤2(具体为步骤21)中所形成的聚类结果,按下列公式计算第t天类内误差
36、
37、其中,表示事件en所属的类簇中心,|·|表示取绝对值;
38、步骤54:按照下式计算第t天校园群体事件量化指标
39、
40、作为本专利技术再进一步的方案:所述步骤6具体过程如下:
41、步骤61:在步骤45所获得的事件语义特征集随机采样数据作为训练数据,每组数据以20天为单位,表示为将输入事件预测神经网络中,按照下式获取向量表示
42、
43、其中,mean(·)表示取向量平均;
44、步骤62:按照下式获取预测结果。
45、
...
【技术保护点】
1.一种基于深度学习的校园群体事件预警方法,其特征在于:
2.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤1包括以下步骤:
3.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤2包括以下步骤:
4.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤3包括以下步骤:
5.根据权利要求1或4所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤4包括以下步骤:
6.根据权利要求4所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤5包括以下步骤:
7.根据权利要求5所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤6包括以下步骤:
8.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤7包括以下步骤:
【技术特征摘要】
1.一种基于深度学习的校园群体事件预警方法,其特征在于:
2.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤1包括以下步骤:
3.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤2包括以下步骤:
4.根据权利要求1所述的基于深度学习的校园群体事件预警方法,其特征在于,步骤3包括以下步骤:
5.根据权利要...
【专利技术属性】
技术研发人员:杨振德,
申请(专利权)人:西咸新区沣西实验学校,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。