【技术实现步骤摘要】
首发新闻稿的确定方法、装置、电子设备和存储介质
[0001]本申请涉及新闻
,具体涉及一种首发新闻稿的确定方法、装置、电子设备和存储介质。
技术介绍
[0002]新闻媒体机构中,新闻报道的时效是非常重要的,首发新闻稿(即针对同一新闻事件,首个发布的新闻报道)也会产生较大的影响力,如何确定报道某一事件的首发新闻稿是如今新闻媒体机构面临的重要问题。
[0003]目前,首发新闻稿的认定通常采用常规搜索+人工整理的方式,即对需要进行首发认定分析的新闻稿按照其搜索词通过搜索引擎进行搜索,得到搜索结果,然后通过人工对搜索结果中被认定为同一事件的新闻稿件的发稿时间进行比对和整理,从而确定出报道该事件的首发新闻稿。
[0004]上述首发新闻稿的确定方法,人工比对易产生误差,首发新闻稿件的确定不够精确,且人工比对效率低下。
技术实现思路
[0005]本申请实施例的目的是提供一种首发新闻稿的确定方法、装置、电子设备和存储介质,以实现高效、精确的确定报道某一事件的首发新闻稿的效果。
[0006]本申请
【技术保护点】
【技术特征摘要】
1.一种首发新闻稿的确定方法,其特征在于,所述方法包括:获取新闻事件的第一新闻要素信息;根据所述第一新闻要素信息进行新闻稿搜索,得到第一新闻稿候选集,其中,所述第一新闻稿候选集中包含至少一条候选新闻稿;获取所述第一新闻稿候选集中的各所述候选新闻稿的第二新闻要素信息;基于所述第一新闻要素信息和所述第二新闻要素信息,确定特征向量;将所述特征向量输入预先训练好的分类器中,得到与所述新闻事件相匹配的第二新闻稿候选集,其中,所述分类器以历史新闻稿对应的特征向量,以及所述历史新闻稿所对应的新闻事件为训练样本进行训练得到;基于所述第二新闻稿候选集中的各候选新闻稿的发布时间,确定与所述新闻事件对应的首发新闻稿。2.根据权利要求1所述的方法,其特征在于,在所述获取新闻事件的第一新闻要素信息之前,所述方法还包括:从存储有多个新闻稿的数据库中获取报道所述新闻事件的第一新闻稿;从所述第一新闻稿中提取第三新闻要素信息,将所述第三新闻要素信息确定为所述第一新闻要素信息。3.根据权利要求2所述的方法,其特征在于,所述基于所述第一新闻要素信息和所述第二新闻要素信息,确定特征向量,包括:分别对所述第一新闻要素信息和所述第二新闻要素信息进行扩展,得到第一扩展新闻要素信息和第二扩展新闻要素信息;确定所述第一新闻稿与所述第一新闻候选稿集中的各所述候选新闻稿的语义相似度值;基于所述第一新闻要素信息、所述第二新闻要素信息、所述第一扩展新闻要素信息、所述第二扩展新闻要素信息和所述语义相似度值,确定特征向量。4.根据权利要求3所述的方法,其特征在于,所述基于所述第一新闻要素信息、所述第二新闻要素信息、所述第一扩展新闻要素信息、所述第二扩展新闻要素信息和所述语义相似度值,确定特征向量,包括:分别计算所述第一新闻稿的题目中所包含的第一新闻要素信息的第一数量和包含的所述第一扩展新闻要素信息的第二数量,以及所述第一新闻稿的正文中所包含的第一新闻要素信息的第三数量和包含的所述第一扩展新闻要素信息的第四数量;分别计算各所述候选新闻稿的题目中所包含的第二新闻要素信息的第五数量和包含的所述第二扩展新闻...
【专利技术属性】
技术研发人员:罗毅,成鹏,苏宇,靳博,秦玉芳,王越,李藜,马鸣,
申请(专利权)人:媒体融合生产技术与系统国家重点实验室中国经济信息社有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。