一种用于新闻稿件标注的事件分割方法及系统技术方案

技术编号:36348548 阅读:29 留言:0更新日期:2023-01-14 18:03
本发明专利技术提供了一种用于新闻稿件标注的事件分割方法及系统,应用于新闻稿件标注技术领域,该方法包括:通过采集获得新闻稿件数据。构建初始分级特征,对新闻稿件数据的识别划分,获得初始层级拆分结果。通过新闻稿件数据的拆分前排布构建层级关联关系。对初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合,对初始层级拆分结果进行结构化关联评价,生成结构化关联评价结果。通过层级关联关系、层级特征词标识集合和结构化关联评价结果进行所述初始层级拆分结果的关联度评价。通过关联度评价结果进行事件划分聚合标注。解决了现有技术新闻稿件标注采取人工标注的方式进行,导致标注效率较低且需要耗费大量的时间和人力资源的技术问题。人力资源的技术问题。人力资源的技术问题。

【技术实现步骤摘要】
一种用于新闻稿件标注的事件分割方法及系统


[0001]本专利技术涉及新闻稿件标注
,具体涉及一种用于新闻稿件标注的事件分割方法及系统。

技术介绍

[0002]新闻稿件用于体现新闻的客观事实,一般由题目、引言、主题、背景和结论五个部分组成。在完成新闻稿件后,需要通过计算机根据标注内容生成知识图谱,对稿件中的主旨部分进行标注,使得计算机可以清楚快速的获知稿件的主旨内容。在现有技术中,新闻稿件的标注多为工作人员按照标注经验进行新闻稿件的标注,标注效率较低且需要耗费大量的时间和人力资源。
[0003]因此,在现有技术中新闻稿件标注采取人工标注的方式进行,导致标注效率较低,且需要耗费大量的时间和人力资源的技术问题。

技术实现思路

[0004]本申请提供一种用于新闻稿件标注的事件分割方法及系统,用于针对解决现有技术中新闻稿件标注采取人工标注的方式进行,导致标注效率较低且需要耗费大量的时间和人力资源的技术问题。
[0005]鉴于上述问题,本申请提供了一种用于新闻稿件标注的事件分割方法及系统。
[0006]本申请的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于新闻稿件标注的事件分割方法,其特征在于,所述方法包括:采集获得新闻稿件数据;构建初始分级特征,基于所述初始分级特征进行所述新闻稿件数据的识别划分,获得初始层级拆分结果;通过所述新闻稿件数据的拆分前排布构建层级关联关系;对所述初始层级拆分结果进行逐层级特征词识别,生成层级特征词标识集合;基于结构化特征进行所述初始层级拆分结果的结构化关联评价,生成结构化关联评价结果;通过所述层级关联关系、所述层级特征词标识集合和所述结构化关联评价结果进行所述初始层级拆分结果的关联度评价;通过关联度评价结果进行事件划分聚合标注,将事件划分聚合标注结果反馈至标注用户。2.如权利要求1所述的方法,其特征在于,所述方法还包括:构建结构化特征分类标签,其中,所述结构化特征分类标签包括组成标签、包含标签、种属标签、嵌套标签;通过大数据进行所述结构化特征分类标签的数据特征填充,生成初始特征填充结果;对所述初始特征填充结果进行人工标识修正,通过人工标识修正结果生成所述结构化特征。3.如权利要求1所述的方法,其特征在于,所述方法还包括:构建事件关键词特征;通过所述事件关键词特征进行所述层级特征词标识集合的特征词聚合,获得初始聚合结果;对所述初始层级拆分结果进行指代特征词识别,生成指代特征词识别集合;根据所述层级关联关系进行所述指代特征词识别集合的事件关键词特征匹配,获得匹配结果;通过所述匹配结果进行所述初始聚合结果的聚合补充,得到所述事件划分聚合标注结果。4.如权利要求1所述的方法,其特征在于,所述方法还包括:对所述初始层级拆分结果进行句用识别,生成句用分类识别结果;基于所述句用分类识别结果进行所述初始层级拆分结果的句用标识;将句用标识结果添加至所述事件划分聚合标注结果中。5.如权利要求4所述的方法,其特...

【专利技术属性】
技术研发人员:宋永生王楠
申请(专利权)人:文灵科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1