新闻稿件传播分析方法、计算机可读存储介质及电子设备技术

技术编号:27975610 阅读:35 留言:0更新日期:2021-04-06 14:09
本发明专利技术公开了一种新闻稿件传播分析方法和计算机可读存储介质,该新闻稿件传播分析方法首先基于同一分类标准分别对自产新闻数据库中的自产新闻和待比对新闻数据库中的待比对新闻进行分类,并根据分类结果计算同一所属类别下的待比对新闻与自产新闻之间的相似度信息,然后根据相似度信息确定待比对新闻是否转载或转引自产新闻,由此,能够更加全面和准确地分析出新闻稿件是否被转载或转引,为衡量新闻媒体机构的传播影响力提供依据,为新闻生产提供决策支持。

【技术实现步骤摘要】
新闻稿件传播分析方法、计算机可读存储介质及电子设备
本专利技术涉及文档处理
,尤其涉及一种新闻稿件传播分析方法、一种计算机可读存储介质和一种电子设备。
技术介绍
随着智能终端的普及和媒体融合的快速发展,信息传播速度和广度得到极大提升。新闻资料是一种重要的媒体内容,数量大、传播快、影响范围广。各类媒体机构致力于生产高质量新闻内容,新闻传播影响力是度量新闻质量的重要指标,也是评估媒体机构影响力的关键因素。对新闻传播影响力的评价依据,除了包含阅读量、评论数、转发数等常规指标外,尤其应该重视新闻被其他媒体引用的情况。目前,媒体机构大都建立了存储自产新闻的数据库系统,用于实现新闻稿件的查询、管理和发布等功能,同时还统计每条新闻被阅读、评论和转发的情况。通常,媒体机构会采用阅读量、评论数、转发数等指标作为影响力评价的依据,但这些指标主要是对新闻受众行为的归纳,有助于新闻撰写和用户个性化推荐等。实际上,新闻稿件被其他媒体机构引用的情况,能够更加客观、有效地衡量新闻稿件自身的内容质量、新闻价值以及该新闻传播的影响力。就目前媒体机构建设的新闻数据库本文档来自技高网...

【技术保护点】
1.一种新闻稿件传播分析方法,其特征在于,包括:/n基于同一分类标准分别对自产新闻数据库中的自产新闻和待比对新闻数据库中的待比对新闻进行分类;/n根据分类结果计算同一所属类别下的待比对新闻与自产新闻之间的相似度信息;/n根据所述相似度信息确定所述待比对新闻是否转载或转引所述自产新闻。/n

【技术特征摘要】
1.一种新闻稿件传播分析方法,其特征在于,包括:
基于同一分类标准分别对自产新闻数据库中的自产新闻和待比对新闻数据库中的待比对新闻进行分类;
根据分类结果计算同一所属类别下的待比对新闻与自产新闻之间的相似度信息;
根据所述相似度信息确定所述待比对新闻是否转载或转引所述自产新闻。


2.根据权利要求1所述的新闻稿件传播分析方法,其特征在于,根据所述相似度信息确定所述待比对新闻是否转载或转引所述自产新闻,包括:
根据所述相似度信息判断所述待比对新闻是否全文转载所述自产新闻;
若是,则标记所述待比对新闻全文转载所述自产新闻并存储;若否,则判断所述待比对新闻是否部分转载所述自产新闻;
若是,则标记所述待比对新闻部分转载所述自产新闻并存储;若否,则判断所述待比对新闻是否全文转引所述自产新闻;
若是,则标记所述待比对新闻全文转引所述自产新闻并存储;若否,则判断所述待比对新闻是否部分转引所述自产新闻;
若是,则标记所述待比对新闻部分转引所述自产新闻并存储。


3.根据权利要求2所述的新闻稿件传播分析方法,其特征在于,对自产新闻数据库中的自产新闻和待比对新闻数据库中的待比对新闻进行分类之前,还包括:
对所述自产新闻数据库中的自产新闻进行文档切分和关键词提取,以获取所述自产新闻的词向量及其权重;
对所述待比对新闻数据库的待比对新闻进行清洗,并对清洗后的待比对新闻进行关键词提取,获取所述待比对新闻的词向量及其权重。


4.根据权利要求2所述的新闻稿件传播分析方法,其特征在于,所述判断所述待比对新闻是否全文转载所述自产新闻,包括:
采用基于长文本去重的算法模型计算所述待比对新闻与所述自产新闻之间的第一相似度;
若所述第一相似度大于预设的第一阈值,则标记所述待比对新闻全文转载所述自产新闻。


5.根据权利要求3所述的新闻稿件传播分析方法,其特征在于,所述判断所述待比对新闻是否部分转载所述自产新闻,包括:
在所述待比对新闻中检索所述自产新闻所属的媒体机构名称并进行定位;
若检索结果不为空,则基于所述媒体机构名称的位置获取所述待比对新闻中所述媒体机构名称的位置的前一句、当前句和后一句;
采用基于短文本去重的算法模型计算所述媒体机构名称的位置的前一句、当前句和后一句与所述自产新闻进行文档切分后的相应句子之间的第二相似度;
若所述媒体机构名称的位置的前一句、当前句和后一句与所述自产新闻进行文档切分后的相应句子之间的第二相似...

【专利技术属性】
技术研发人员:张弛吕锐陈国伟龚隽鹏
申请(专利权)人:中国传媒大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1