一种新闻选题分析方法及装置制造方法及图纸

技术编号:15792139 阅读:28 留言:0更新日期:2017-07-09 23:29
本发明专利技术实施例公开了一种新闻选题分析方法及装置,该方法包括:根据用户输入的新闻选题获取互联网关联数据;根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;根据所述实体信息和/或所述类别标签信息获取新闻事件线索;根据所述互联网关联数据的语义内容提取反馈数据;根据所述反馈数据获取新闻事件评估结果;根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。通过本发明专利技术的技术方案,解决了运用大数据对新闻事件的报道较片面的问题,实现了运用大数据,综合新闻事件发展线索与对新闻事件的评估确定新闻选题内容,能够辅助新闻报道机构针对相关新闻选题进行更为全面的报道。

【技术实现步骤摘要】
一种新闻选题分析方法及装置
本专利技术实施例涉及计算机网络通信
,尤其涉及一种新闻选题分析方法及装置。
技术介绍
随着新闻传媒业的飞速发展,如何挖掘新闻、制作新闻是报业在媒体竞争中立于不败之地的关键。目前报业遵循的仍然是传统的寻找选题、挖掘内容的方法,最新的数字技术并没有完全运用到工作中,如何利用大数据、云计算和自然语言处理技术的最新成就整合新闻资源、推动传统媒体和新兴媒体融合发展成为难题。近年来国内外不少新闻媒体单位都对大数据在新闻行业的应用做了有意义尝试,但基本只是将数据作为辅助分析工具为新闻提供数据支撑,或者是对新闻进行分类推荐及舆情分析。目前,综合新闻事件的发展脉络等信息,为不同阶段的新闻报道提供适合的报道内容还没有成熟完善的产品,使得新闻报道机构对特定新闻选题的报道内容较为单一和片面。
技术实现思路
有鉴于此,本专利技术实施例提供了一种新闻选题方法及系统,以实现运用大数据,综合新闻事件发展脉络与对新闻事件的评估确定新闻选题的内容,辅助新闻报道机构针对相关新闻选题进行更为全面的报道。第一方面,本专利技术实施例提供了一种新闻选题分析方法,包括:根据用户输入的新闻选题获取互联网关联数据;根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;根据所述实体信息和/或所述类别标签信息获取新闻事件线索;根据所述互联网关联数据的语义内容提取反馈数据;根据所述反馈数据获取新闻事件评估结果;根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。进一步地,所述根据用户输入的新闻选题获取互联网关联数据包括:基于模式识别算法与配置策略根据所述用户输入的新闻选题获取互联网关联数据。进一步地,所述根据所述实体信息和/或所述类别标签信息获取新闻事件线索包括:根据所述实体信息和/获所述类别标签信息进行聚类分析获得新闻事件模型;根据所述新闻事件模型与所述实体关系得到所述新闻事件线索。进一步地,所述根据所述反馈数据获取新闻事件评估结果包括:通过对所述反馈数据进行指标统计,获取新闻事件评估结果。进一步地,在所述根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容之后,还包括:对所述新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的所述新闻选题内容确定为待报道新闻选题内容。进一步地,在所述根据用户输入的新闻选题获取互联网关联数据之后,还包括:根据关键标签和/或关键字确定热点新闻事件;所述根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容包括:根据所述热点新闻事件、所述新闻事件线索和所述新闻事件评估结果确定所述新闻选题内容。第二方面,本专利技术实施例还提供了一种新闻选题分析装置,包括:数据获取模块,用于根据用户输入的新闻选题获取互联网关联数据;信息提取模块,用于根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;线索获取模块,用于根据所述实体信息和/或所述类别标签信息获取新闻事件线索;反馈提取模块,用于根据所述互联网关联数据的语义内容提取反馈数据;评估获取模块,用于根据所述反馈数据获取新闻事件评估结果;内容确定模块,用于根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。进一步地,所述数据获取模块具体用于:基于模式识别算法与配置策略根据所述用户输入的新闻选题获取互联网关联数据。进一步地,所述线索获取模块包括:模型分析单元,用于根据所述实体信息和/或所述类别标签信息进行聚类分析获得新闻事件模型;线索获取单元,用于根据所述新闻事件模型与所述实体关系得到所述新闻事件线索。进一步地,所述评估获取模块具体用于:通过对所述反馈数据进行指标统计,获取新闻事件评估结果。进一步地,所述新闻选题分析装置还包括:内容匹配模块,用于对所述新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的所述新闻选题内容确定为待报道新闻选题内容。进一步地,热点结合模块,用于根据关键标签和/或关键字确定热点新闻事件;所述内容确定模块具体用于根据所述热点新闻事件、所述新闻事件线索和所述新闻事件评估结果确定所述新闻选题内容。本专利技术实施例提供了一种新闻选题分析方法及装置,通过根据用户输入的选题获取互联网关联数据,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息以获取新闻事件线索,同时根据互联网关联数据的语义内容提取反馈数据以获取新闻事件评估结果,综合新闻事件线索和新闻事件评估结果,确定新闻选题内容。解决了对新闻事件的报道较为单一和片面的问题,实现了运用大数据,综合新闻事件发展线索与对新闻事件的评估确定新闻选题的内容,能够辅助新闻报道机构针对相关新闻选题进行更为全面的报道。附图说明图1是本专利技术实施例一提供的一种新闻选题分析方法的流程示意图。图2是本专利技术实施例二提供的一种新闻选题分析方法的流程示意图。图3本专利技术实施例三提供的一种新闻选题分析装置的结构示意图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1是本专利技术实施例一提供的一种新闻选题分析方法的流程示意图,本实施例的技术方案可以应用在需要对新闻选题进行分析的场景,可以由本专利技术实施例提供的新闻选题分析装置来执行,该系统可以采用软件和/或硬件的方式来实现。该方法包括:S110,根据用户输入的新闻选题获取互联网关联数据。用户可以输入报道内容待确认的新闻选题,根据用户输入的新闻选题对互联网关联数据进行采集。互联网关联数据可以是与用户输入的新闻选题相互关联的互联网数据,例如用户输入的某一新闻选题,可以根据用户输入的新闻选题在门户网站、论坛或微博等尽可能多的网页中采集与用户输入的新闻选题相关联的互联网数据,最大限度地获取针对用户输入的新闻选题的互联网关联数据。可选的,可以基于模式识别算法与配置策略根据用户输入的新闻选题获取互联网关联数据。模式识别算法可以从海量的互联网数据中抽取相互关联的数据,例如可以基于一定的模式在各个网页中采集关于娱乐类或体育类的互联网数据。互联网关联数据的采集可以通过爬虫的爬取实现,配置策略可以是在进行爬虫的智能爬取以获得所需互联网关联数据时,对爬取的网站、爬虫爬取的模板以及爬虫的调度策略等进行配置。采用模式识别算法与配置策略进行互联关联数据的采集可以有效地过滤与用户输入的新闻选题不相关的无效数据,提高互联网关联数据的采集效率。S120,根据互联网关联数据的语义内容提取实体信息和/或类别标签信息。实体信息可以通过分析互联网关联数据提取得到的诸如时间、人物、地点、行为等的实体信息,通过分析采集的互联网关联数据具体的语义内容,得到采集的互联网关联数据中包含哪些实体信息。例如,在一则报道人工智能新闻的网页中采集互联网关联数据,可以通过对互联网关联数据的语义进行分析得到围棋选手与围棋等实体信息。类别标签信息可以是采集的互联网关联数据中包含的类别标签,例如在报道春运期间火车票售票情况的网页中采集互联网关联数据,通过对互联网关联数据的语义内容进行分析,可以得到春节和车票等类别标签信息。S130,根据实体信息和/或类别标签信息获取新闻事件线索。本文档来自技高网...
一种新闻选题分析方法及装置

【技术保护点】
一种新闻选题分析方法,其特征在于,包括:根据用户输入的新闻选题获取互联网关联数据;根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;根据所述实体信息和/或所述类别标签信息获取新闻事件线索;根据所述互联网关联数据的语义内容提取反馈数据;根据所述反馈数据获取新闻事件评估结果;根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。

【技术特征摘要】
1.一种新闻选题分析方法,其特征在于,包括:根据用户输入的新闻选题获取互联网关联数据;根据所述互联网关联数据的语义内容提取实体信息和/或类别标签信息;根据所述实体信息和/或所述类别标签信息获取新闻事件线索;根据所述互联网关联数据的语义内容提取反馈数据;根据所述反馈数据获取新闻事件评估结果;根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容。2.根据权利要求1所述的方法,其特征在于,所述根据用户输入的新闻选题获取互联网关联数据包括:基于模式识别算法与配置策略根据所述用户输入的新闻选题获取互联网关联数据。3.根据权利要求1所述的方法,其特征在于,所述根据所述实体信息和/或所述类别标签信息获取新闻事件线索包括:根据所述实体信息和/获所述类别标签信息进行聚类分析获得新闻事件模型;根据所述新闻事件模型与所述实体关系得到所述新闻事件线索。4.根据权利要求1所述的方法,其特征在于,所述根据所述反馈数据获取新闻事件评估结果包括:通过对所述反馈数据进行指标统计,获取新闻事件评估结果。5.根据权利要求1所述的方法,其特征在于,在所述根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容之后,还包括:对所述新闻选题内容与待编稿件库中的新闻内容进行匹配,将不同于待编稿件库中新闻内容的所述新闻选题内容确定为待报道新闻选题内容。6.根据权利要求1所述的方法,其特征在于,在所述根据用户输入的新闻选题获取互联网关联数据之后,还包括:根据关键标签和/或关键字确定热点新闻事件;所述根据所述新闻事件线索和所述新闻事件评估结果,确定新闻选题内容包括:根据所述热点新闻事件、所述新闻事件线索和所述新...

【专利技术属性】
技术研发人员:杨进国蒲庆宇王曦陈方云张索
申请(专利权)人:天闻数媒科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1