新闻标题事件名生成方法和装置制造方法及图纸

技术编号:37807089 阅读:25 留言:0更新日期:2023-06-09 09:37
本申请涉及一种新闻标题事件名生成方法和装置,该方法包括如下步骤:输入新闻标题;对新闻标题进行语义角色标注,从中抽取事件名;如果抽取成功,则输出抽取的事件名;如果不成功,则对新闻标题进行依存句法分析,抽取事件名。本方案首先对标题进行语义角色标注,尝试从中抽取事件名;在尝试无效的情况下,再对标题进行依存句法分析;本方法能够尽可能挖掘事件名结构,在准确率和召回率上达到不错的效果;经测试,本方案生成的事件名形式简短、语义丰富、表达连续、语句通顺,达到了实用的水平。达到了实用的水平。达到了实用的水平。

【技术实现步骤摘要】
新闻标题事件名生成方法和装置


[0001]本申请涉及自然语言处理
,具体涉及一种新闻标题事件名生成方法和装置。

技术介绍

[0002]随着互联网技术的飞速发展,网民通过互联网进行意见发表和观点表达已成为常态。因此,及时掌握网络舆情事件,尤其是负面舆情事件,对保护企业品牌、维护企业形象、顺利举办活动等至关重要。
[0003]事件名生成是事件抽取的重要技术,在舆情分析中有很广泛的应用场景。基于句法分析的主谓宾事件短语提取和基于语句压缩的事件描述提取是事件名称生成的两个重要方法。基于句法的主谓宾提取,一方面对句法分析的性能要求较高,在实际的使用过程中常会因为句法分析错误而导致提取错误,并存在召回率差等特点。
[0004]基于语句压缩的事件描述提取方法,从实现的技术来看,可分为基于模版规则的方法、基于统计的方法和基于深度学习的方法。不过,在模板规则上,存在着与句法分析一样的不足;在深度学习方法上,需要大量的标注语料,整体技术仍处于初步阶段。

技术实现思路

[0005]为至少在一定程度上克服相关技术中存在的常因句法分析错误而导致提取错误,且存在召回率差等问题,本申请提供一种新闻标题事件名生成方法和装置。
[0006]根据本申请实施例的第一方面,提供一种新闻标题事件名生成方法,包括如下步骤:
[0007]输入新闻标题;
[0008]对新闻标题进行语义角色标注,从中抽取事件名;
[0009]如果抽取成功,则输出抽取的事件名;如果不成功,则对新闻标题进行依存句法分析,抽取事件名。
[0010]进一步地,对新闻标题进行语义角色标注,包括如下步骤:
[0011]以新闻标题的谓词为中心,分析新闻标题中各成分与谓词之间的关系,确定谓词

论元结构;
[0012]基于谓词

论元结构确定事件名。
[0013]进一步地,基于谓词

论元结构确定事件名,包括如下步骤:
[0014]基于谓词

论元结构,确定谓词以及相应的施事和受事,构造三元组;
[0015]按照施事

谓词

受事的顺序进行拼接,获得事件名。
[0016]进一步地,对新闻标题进行依存句法分析,包括如下步骤:
[0017]分析新闻标题中词语之间的依存关系,确定语句结构;
[0018]基于语句结构形成主谓宾三元组,将主谓宾三元组拼接后获得事件名。
[0019]进一步地,所述语句结构包括:句子的核心的动词,以及相应与该动词有关系的词
语;
[0020]基于语句结构形成主谓宾三元组,包括如下步骤:
[0021]以动词为核心,找到对应的主语和宾语;
[0022]通过修饰关系和并列关系对主语和宾语进行补充,形成主谓宾三元组。
[0023]根据本申请实施例的第二方面,提供一种新闻标题事件名生成装置,包括:
[0024]输入模块,用于输入新闻标题;
[0025]标注模块,用于对新闻标题进行语义角色标注,从中抽取事件名;如果抽取成功,则输出抽取的事件名;
[0026]分析模块,用于在标注模块抽取不成功时,对新闻标题进行依存句法分析,抽取事件名。
[0027]进一步地,所述标注模块对新闻标题进行语义角色标注时,具体用于:以新闻标题的谓词为中心,分析新闻标题中各成分与谓词之间的关系,确定谓词

论元结构;基于谓词

论元结构确定事件名。
[0028]进一步地,所述标注模块基于谓词

论元结构确定事件名时,具体用于:基于谓词

论元结构,确定谓词以及相应的施事和受事,构造三元组;按照施事

谓词

受事的顺序进行拼接,获得事件名。
[0029]进一步地,所述分析模块对新闻标题进行依存句法分析时,具体用于:分析新闻标题中词语之间的依存关系,确定语句结构;基于语句结构形成主谓宾三元组,将主谓宾三元组拼接后获得事件名。
[0030]进一步地,所述语句结构包括:句子的核心的动词,以及相应与该动词有关系的词语;
[0031]所述分析模块基于语句结构形成主谓宾三元组时,具体用于:以动词为核心,找到对应的主语和宾语;通过修饰关系和并列关系对主语和宾语进行补充,形成主谓宾三元组。
[0032]本申请的实施例提供的技术方案具备以下有益效果:
[0033]本方案首先对标题进行语义角色标注,尝试从中抽取事件名;在尝试无效的情况下,再对标题进行依存句法分析;本方法能够尽可能挖掘事件名结构,在准确率和召回率上达到不错的效果;经测试,本方案生成的事件名形式简短、语义丰富、表达连续、语句通顺,达到了实用的水平。
[0034]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
[0035]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0036]图1是本专利技术实施例示出的一种新闻标题事件名生成方法的流程图。
[0037]图2是本专利技术实施例示出的一种事件名生成方法的执行逻辑图。
[0038]图3是本专利技术实施例示出的一种新闻标题事件名生成装置的框图。
[0039]图4是本专利技术实施例示出的一种计算机设备的结构示意图。
具体实施方式
[0040]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的方法和装置的例子。
[0041]针对当前方法存在的问题,本申请提出一种新闻标题事件名生成的方法。新闻标题一般长度较短,同时蕴含的信息丰富,是事件名生成的理想实验对象。
[0042]图1是根据一示例性实施例示出的一种新闻标题事件名生成方法的流程图。该方法可以包括如下步骤:
[0043]步骤S1、输入新闻标题;
[0044]步骤S2、对新闻标题进行语义角色标注,从中抽取事件名;
[0045]步骤S3、如果抽取成功,则输出抽取的事件名;如果不成功,则对新闻标题进行依存句法分析,抽取事件名。
[0046]本方案首先对标题进行语义角色标注,尝试从中抽取事件名;在尝试无效的情况下,再对标题进行依存句法分析;本方法能够尽可能挖掘事件名结构,在准确率和召回率上达到不错的效果;经测试,本方案生成的事件名形式简短、语义丰富、表达连续、语句通顺,达到了实用的水平。
[0047]应当理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种新闻标题事件名生成方法,其特征在于,包括如下步骤:输入新闻标题;对新闻标题进行语义角色标注,从中抽取事件名;如果抽取成功,则输出抽取的事件名;如果不成功,则对新闻标题进行依存句法分析,抽取事件名。2.根据权利要求1所述的方法,其特征在于,对新闻标题进行语义角色标注,包括如下步骤:以新闻标题的谓词为中心,分析新闻标题中各成分与谓词之间的关系,确定谓词

论元结构;基于谓词

论元结构确定事件名。3.根据权利要求2所述的方法,其特征在于,基于谓词

论元结构确定事件名,包括如下步骤:基于谓词

论元结构,确定谓词以及相应的施事和受事,构造三元组;按照施事

谓词

受事的顺序进行拼接,获得事件名。4.根据权利要求1

3任一项所述的方法,其特征在于,对新闻标题进行依存句法分析,包括如下步骤:分析新闻标题中词语之间的依存关系,确定语句结构;基于语句结构形成主谓宾三元组,将主谓宾三元组拼接后获得事件名。5.根据权利要求4所述的方法,其特征在于,所述语句结构包括:句子的核心的动词,以及相应与该动词有关系的词语;基于语句结构形成主谓宾三元组,包括如下步骤:以动词为核心,找到对应的主语和宾语;通过修饰关系和并列关系对主语和宾语进行补充,形成主谓宾三元组。6.一种新闻标题事件名生成装置,其特征在于,包括:输入模...

【专利技术属性】
技术研发人员:郑才松
申请(专利权)人:北京智慧星光信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1