【技术实现步骤摘要】
本专利技术涉及一种事件识别方法,特别是一种基于文本模式分析的突发事件识别方法。
技术介绍
1、突发事件的定义为:突然发生的,能够或者可能造成严重危害,需要采取紧急处置措施给予应对的事件。在互联网大数据时代,信息海量爆炸增长,在短时间内靠人工方式去发现收集突发事件,其效率低下,错误率高,也是不切实际的。信息抽取技术能够从自然语言文本中识别出一类特殊的事件并提取相关的信息要素,利用信息抽取技术能够自动的从大数据文本中快速抽取突发事件相关信息,为突发事件的预警、发布、应急和跟踪提供信息依据。
2、突发事件抽取技术作为信息抽取的一个重要研究方向,是指从非结构化的自然语言文本中抽取出突发事件的元素信息,包括时间、地点、主体、目标、触发词和事件类型等,并按照特定的格式进行存储的技术。例如抽取自然灾害报道的各项元素:时间、地点、地震、伤亡情况等。
3、突发事件种类繁多,内容复杂,不同类别的突发事件可能造成相同的影响,现有技术中的的突发事件识别技术,识别特定分类的突发事件的准确度不够,覆盖范围低,难以实际应用。
【技术保护点】
1.一种基于文本模式分析的突发事件识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤1中所述对进行事件归类,包括:
3.根据权利要求2所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的进行文本模式分析,具体包括:
4.根据权利要求3所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的提取二元组或三元组模式,具体包括:根据主谓宾依存关系对集合中每一个动词抽取三元组,根据其他关系抽取二元组;其中,主语如果是命名实体则仅保留其语义
...【技术特征摘要】
1.一种基于文本模式分析的突发事件识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤1中所述对进行事件归类,包括:
3.根据权利要求2所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的进行文本模式分析,具体包括:
4.根据权利要求3所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述的提取二元组或三元组模式,具体包括:根据主谓宾依存关系对集合中每一个动词抽取三元组,根据其他关系抽取二元组;其中,主语如果是命名实体则仅保留其语义类型;上述抽取得到的二元组或三元组即为一个模式。
5.根据权利要求4所述的一种基于文本模式分析的突发事件识别方法,其特征在于:步骤2中所述计算各模式对应的权重,...
【专利技术属性】
技术研发人员:章迪,蔡学波,杨岩,赵彦杰,李圣龙,张豹,黄颖,王康,田建芳,薛明,李文强,张磊,
申请(专利权)人:中国电子科技集团公司第二十八研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。