【技术实现步骤摘要】
一种预警数据危险性计算方法、装置和计算机设备
[0001]本专利技术涉及计算机
,具体涉及一种预警数据危险性计算方法、装置和计算机设备。
技术介绍
[0002]针对现有舆情,自动预警数据平台会针对负面数据进行预警,对于负面数据中情节较为严重的重大负面事件,客户需要第一时间知晓,并重点关注;对于负面数据中情节不太重要的负面事件,客户只需要了解,并不会重点关注。
[0003]但是,不太重要的负面事件往往在舆情中占比较大,因此如何在众多的负面事件中精准地识别出客户需要重点关注的、情节较为严重的重大负面事件,是亟待解决的问题。
[0004]在一些现有技术中,通过文本分类的方式来识别情节较为严重的重大负面事件,包括:单标签、多标签的方案,这种方式是通过上下文的语义特征来计算事件的标签,并通过标签来区分负面事件的严重程度,这种方法能够实现语义消歧,识别出事件标签;但是这种方法只能计算事件标签,无法结构化事件要点,并且无法准确的做出时间、地点、事件主体等要点的研判。
技术实现思路
[0005]有鉴于此,本专利技术的目的在于提供一种预警数据危险性计算方法、装置和计算机设备,以解决现有技术中通过文本分类的方式对负面事件进行严重程度判断时,无法结构化事件知识点,并且无法对时间、地点、事件主体等要点进行研判的问题。
[0006]根据本专利技术实施例的第一方面,提供一种预警数据危险性计算方法,包括:将预警数据输入至BERT预训练模型中进行词向量转换,得到词向量矩阵;其中,所述词向量矩阵中包括所有 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.一种预警数据危险性计算方法,其特征在于,包括:将预警数据输入至BERT预训练模型中进行词向量转换,得到词向量矩阵;其中,所述词向量矩阵中包括所有预警数据对应的连续子串;根据所述词向量矩阵,构建事件Schema模型,且所述事件Schema模型至少包括:预警数据类型和事件的论元角色;通过指针网络将预警数据切换成连续的子序列,并提取所述子序列中的事件的论元角色;根据所述事件的论元角色对向量序列进行打分,得到预警数据的危险程度。2.根据权利要求1所述的方法,其特征在于,还包括:构建多层并列的指针网络,实现在一个预警数据中抽取多个事件。3.根据权利要求2所述的方法,其特征在于,还包括:对BERT预训练模型融合噪音处理,具体为:其中,表示加入噪音之后的BERT预训练模型参数;w
i
表示BERT预训练模型参数;u(a,b)表示从a到b的均匀分布噪音,且u(a,b)是与w
i
形状相同的矩阵;λ表示控制相对噪音强度的参数,一般取[0.5,1];std代表标准差。4.根据权利要求1所述的方法,其特征在于,所述根据所述事件的论元角色对向量序列进行打分,具体为:设输入的预警数据长度为n,经过BERT预训练模型融合噪音处理,得到token向量序列[h1,h2,h3...hn];通过全连接层对所述token向量序列进行矩阵变换,得到两个形状相同的矩阵q,k,具体为:q
i,s
=w
q,s
h
i
+b
q,s
k
i,s
=w
k,s
h
i
+b
k,s
其中,q
1,s
、w
q,s
、k
i,s
和w
k,s
表示需要学习的参数矩阵;h表示token的向量序列;b
q,s
和b
k,s
表示偏置;矩阵变换后,得到q,k向量序列:[q
1,s
,q
2,s
,...,q
n,s
],[k
1,s
,k
技术研发人员:韩勇,李青龙,骆飞,赵冲,
申请(专利权)人:北京智慧星光信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。