【技术实现步骤摘要】
片段指针交互模型的构建方法及社会传感灾情监测方法
[0001]本专利技术涉及自然语言处理
,具体涉及一种片段指针交互模型的构建方法及社会传感灾情监测方法。
技术介绍
[0002]自然灾害的发生,给人们带来了诸多不便,需要及时开展救灾工作,恢复正常生活秩序。传统的灾情收集工作主要由相关工作人员手工完成,但有限的工作人员很难在短时间内做到对灾情事件的全覆盖,且部分灾情信息需要工作人员实地勘察上报,常常在灾害发生较长时间后才能有效掌握灾情信息,即,传统的灾情收集工作耗费较大的人力物力且及时性差。近年来,随着社交媒体的发展,社交媒体用户可以通过移动设备便捷地发送自己生活状况,而在灾害发生的第一时间,社交媒体用户作为灾害的直接接触群体,扮演着动态传感器的角色,而社交媒体用户发送的短文本充当着社会传感信息的作用,这部分灾害有关的短文本作为社会传感的载体,极大的拓宽了灾情状况的获取途径,且这些信息具有很强的实时性,无需人工再次录入,能够有效提升灾情处理效率。
[0003]基于上述短文本的灾情事件检测,其重点在于灾情事件触发词 ...
【技术保护点】
【技术特征摘要】
1.一种片段指针交互模型的构建方法,其特征在于,所述片段指针交互模型包括基于预训练语言模型的实体感知编码层、指针网络检测层以及区间交互感知层;所述片段指针交互模型的构建方法包括以下步骤:获取训练文本集,其中,所述训练文本集为社交媒体文本数据经过预处理操作后得到的文本数据;将所述训练文本集中的训练文本输入所述实体感知编码层,获得所述实体感知编码层输出所述训练文本的语义表征;将所述训练文本的语义表征输入所述指针网络检测层,获得所述指针网络检测层预测的所述训练文本中每个字的起始区间表示和终止区间表示;将所述起始区间表示和所述终止区间表示输入所述区间交互感知层,由所述区间交互感知层对所述起始区间表示和所述终止区间表示进行特征交互,获得特征交互后的起始类别标签和终止类别标签;基于所述起始类别标签和所述终止类别标签生成对应的起始类别列表和终止类别列表,并基于所述起始类别列表和所述终止类别列表进行解码获得灾情事件触发词。2.如权利要求1所述的片段指针交互模型的构建方法,其特征在于,所述预处理操作包括以下步骤:基于预设分词算法从所述社交媒体文本中抽取实体信息,其中,所述实体信息包括抽取的实体词的实体类型和所述实体词在所述社交媒体文本中的位置信息;将所述从所述社交媒体文本抽取的实体词的实体类型和位置信息附加在所述社交媒体文本后,作为所述训练文本;所述预训练语言模型为BERT模型;所述将所述训练文本集中的训练文本输入所述实体感知编码层,获得所述实体感知编码层输出所述训练文本的语义表征包括输入所述实体感知编码层时的输入编码步骤,具体包括:将所述社交媒体文本编码为上下句形式,其中一句对应所述社交媒体文本全文的顺序编码,另一句对应从所述社交媒体文本抽取的实体词的实体类型和位置信息的编码。3.如权利要求2所述的片段指针交互模型的构建方法,其特征在于,在所述基于预设分词算法从所述社交媒体文本中抽取实体信息的步骤之前,所述预处理操作还包括以下步骤:获取原始的社交媒体文本数据,并采用以下至少一种操作对所述原始的社交媒体文本数据进行处理:对所述原始的社交媒体文本数据进行去重处理;采用预设的关键字模板对所述原始的社交媒体文本数据进行过滤处理,其中,所述关键字模板中的关键字包括灾情事实无关性文本;对所述原始的社交媒体文本数据中的非事件句进行过滤处理。4.如权利要求1所述的片段指针交互模型的构建方法,其特征在于,所述将所述起始区间表示和所述终止区间表示输入所述区间交互感知层,由所述区间交互感知层对所述起始区间表示和所述终止区间表示进行特征交互,获得特征交互后的起始类别标签和终止类别标签包括以下步骤:将所述起始区间表示和所述终止区间表示进行交互后,再融入原始的所述训练文本的
语义表征,得到第一特征;将所述第一特征经过线性处理后,得到第二特征;将所述第一特征和所述第二特征进行交互后,输出起始类别标签或终止类别标签。5.如权利要求4所述的片段指针交互模型的构建方法,其特征在于,所述将所述起始区间表示和所述终止区间表示输入所述区间交互感知层,由所述区间交互感知层对所述起始区间表示和所述终止区间表示进行特征交互,获得特征交互后的起始类别标签和终止类别标签包括:r=tanh(W
D
·
concat(u
s
,u
e
)),
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)m
(1)
=W
(1)
·
concat(h,r)+b
(1)
,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)m
(2)
=W
(2)
·
(LayerNorm(m
(1)
))+b
(2)
,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)P
HIN
(h,u
s
,u
e
)=W
(3)
·
concat(m
(1)
,m
(2)
)+b
(3)
,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,公式(1)包括将所述起始区间表示和所述终止区间表示进行交互;公式(2)包括将所述起始区间表示和所述终止区间表示进行交互后,再融入原始的...
【专利技术属性】
技术研发人员:叶允明,李旭涛,孙玉玺,
申请(专利权)人:哈尔滨工业大学深圳,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。