一种基于文本模式分析的突发事件识别方法技术

技术编号:40318646 阅读:24 留言:0更新日期:2024-02-07 21:01
本发明专利技术公开了一种基于文本模式分析的突发事件识别方法,包括以下步骤:选取突发事件语料库,并对其中包含的突发事件进行事件归类;对已归类的突发事件语料库,按类型进行文本模式分析,得到基础模式表;对基础模式表进行语义扩展,得到扩展模式表;采集待识别的目标文本,进行预处理,并利用扩展模式表对预处理后的目标文本进行事件识别。本发明专利技术在现有的中文突发事件语料库基础上,对事件进行归类,提高特定领域事件匹配模式的权威性;采用的基于模式匹配的方法比单纯基于词语匹配的事件分类技术,分类更加准确;还利用相似词语扩展方法,扩展模式信息,提高了模式覆盖率和事件识别准确率。

【技术实现步骤摘要】

本专利技术涉及一种事件识别方法,特别是一种基于文本模式分析的突发事件识别方法


技术介绍

1、突发事件的定义为:突然发生的,能够或者可能造成严重危害,需要采取紧急处置措施给予应对的事件。在互联网大数据时代,信息海量爆炸增长,在短时间内靠人工方式去发现收集突发事件,其效率低下,错误率高,也是不切实际的。信息抽取技术能够从自然语言文本中识别出一类特殊的事件并提取相关的信息要素,利用信息抽取技术能够自动的从大数据文本中快速抽取突发事件相关信息,为突发事件的预警、发布、应急和跟踪提供信息依据。

2、突发事件抽取技术作为信息抽取的一个重要研究方向,是指从非结构化的自然语言文本中抽取出突发事件的元素信息,包括时间、地点、主体、目标、触发词和事件类型等,并按照特定的格式进行存储的技术。例如抽取自然灾害报道的各项元素:时间、地点、地震、伤亡情况等。

3、突发事件种类繁多,内容复杂,不同类别的突发事件可能造成相同的影响,现有技术中的的突发事件识别技术,识别特定分类的突发事件的准确度不够,覆盖范围低,难以实际应用。


技术实现本文档来自技高网...

【技术保护点】

1.一种基于文本模式分析的突发事件识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤1中所述对进行事件归类,包括:

3.根据权利要求2所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的进行文本模式分析,具体包括:

4.根据权利要求3所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的提取二元组或三元组模式,具体包括:根据主谓宾依存关系对集合中每一个动词抽取三元组,根据其他关系抽取二元组;其中,主语如果是命名实体则仅保留其语义类型;上述抽取得到的...

【技术特征摘要】

1.一种基于文本模式分析的突发事件识别方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤1中所述对进行事件归类,包括:

3.根据权利要求2所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的进行文本模式分析,具体包括:

4.根据权利要求3所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的提取二元组或三元组模式,具体包括:根据主谓宾依存关系对集合中每一个动词抽取三元组,根据其他关系抽取二元组;其中,主语如果是命名实体则仅保留其语义类型;上述抽取得到的二元组或三元组即为一个模式。

5.根据权利要求4所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述计算各模式对应的权重,...

【专利技术属性】
技术研发人员:章迪蔡学波杨岩赵彦杰李圣龙张豹黄颖王康田建芳薛明李文强张磊
申请(专利权)人:中国电子科技集团公司第二十八研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1