一种用于体育比赛直播文字的体育新闻构建方法及系统技术方案

技术编号:40541763 阅读:31 留言:0更新日期:2024-03-05 18:57
本发明专利技术涉及新闻构建技术领域,公开了一种用于体育比赛直播文字的体育新闻构建方法及系统。本发明专利技术首先基于直播文字的种类进行术语定义,并根据定义的术语对实时收集的直播文字进行预处理,提取直播文字中的关键词,并计算该关键词在直播文字中的权重。同时,根据实时收集到的直播文字中的关键词判断其与数据库中保存的新闻的相似程度,基于相似程度判断该直播文字是否是独立新闻;进而,通过不断实时收集直播文字和不断更新直播文字的关键词集合,判断该值直播文字所属新闻树情况,并基于所属新闻树情况构建直播新闻,提高了直播新闻的相关性和实时性。

【技术实现步骤摘要】

本专利技术涉及新闻构建,具体为一种用于体育比赛直播文字的体育新闻构建方法及系统


技术介绍

1、体育比赛直播新闻数据的爆炸级增长使得人们难以获得总结性的信息,使人们丧失对信息的全局把控。因此对体育比赛直播新闻事件进行动态追踪并构建其发展脉络是如今迫切需要解决的问题。事件追踪是在后续新闻报道中辨认出给定事件所相关的报道。新闻脉络构建是根据接收到的新闻来对事件发展进行梳理,以一定的形式,比如时间线、事件线索等方式来呈现事件的发展过程。

2、然而现有的直播新闻构建方法存在以下问题:随着时间发展,事件重心会发生偏移,在事件追踪时容易遗漏相关新闻;事件脉络构建仅在时间以及内容相似度等层面做研究,没有从全局的角度来进行脉络构建,造成事件脉络不连贯,整体性较差。

3、现有技术cn105912526a通过在体育直播比赛结束后爬取大量体育比赛直播文字和对应比赛新闻预测该体育直播比赛新闻中直播文字句子的重要性,仅仅是对该体育直播比赛新闻进行构建和预测,没有从全局的角度来进行脉络构建。与cn105912526a相比本专利技术通过实时更新体育直播比赛文字中本文档来自技高网...

【技术保护点】

1.一种用于体育比赛直播文字的体育新闻构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用于体育比赛直播文字的体育新闻构建方法,其特征在于:所述术语定义包括体育术语定义和直播文字术语定义:

3.根据权利要求1所述的一种用于体育比赛直播文字的体育新闻构建方法,其特征在于:所述基于体育直播文字的种类对接收到的直播文字进行数据预处理包括以下步骤:

4.根据权利要求3所述的一种用于体育比赛直播文字的体育新闻构建方法及系统,其特征在于:所述基于提取的候选关键词进一步确定关键词包括:

5.根据权利要求3所述的一种用于体育比赛直播文字的体...

【技术特征摘要】

1.一种用于体育比赛直播文字的体育新闻构建方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种用于体育比赛直播文字的体育新闻构建方法,其特征在于:所述术语定义包括体育术语定义和直播文字术语定义:

3.根据权利要求1所述的一种用于体育比赛直播文字的体育新闻构建方法,其特征在于:所述基于体育直播文字的种类对接收到的直播文字进行数据预处理包括以下步骤:

4.根据权利要求3所述的一种用于体育比赛直播文字的体育新闻构建方法及系统,其特征在于:所述基于提取的候选关键词进一步确定关键词包括:

5.根据权利要求3所述的一种用于体育比赛直播文字的体育新闻构建方法及系统,其特征在于:所述基于提取的直播文字关键词计算其与其他新闻的相似度包括:

6.根据权利要求1所述的一种用于体育比赛直播文字的体育新闻构建方法,其特征...

【专利技术属性】
技术研发人员:孙立平孙洪涛
申请(专利权)人:北京奥邦菲特科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1