新闻召回方法、装置、设备及存储介质制造方法及图纸

技术编号:37986511 阅读:18 留言:0更新日期:2023-06-30 10:01
本公开提供一种新闻召回方法、装置、设备及存储介质,涉及人工智能技术领域,具体涉及自然语言处理、深度学习、预训练模型等技术领域,可应用于智慧城市、智慧政务等场景下。具体实现方案包括:获取至少一条苗头新闻数据;提取每条所述苗头新闻数据的关键字段;根据每条所述苗头新闻数据的关键字段,生成每条所述苗头新闻数据对应的至少一个关联词组;分别根据每条所述苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述苗头新闻数据对应的关联新闻数据。本公开可以及时对苗头新闻相关的关联新闻进行召回,提高对苗头新闻处理的时效性。理的时效性。理的时效性。

【技术实现步骤摘要】
新闻召回方法、装置、设备及存储介质


[0001]本公开涉及人工智能
,具体涉及自然语言处理、深度学习、预训练模型等
,可应用于智慧城市、智慧政务等场景下,尤其涉及一种新闻召回方法、装置、设备及存储介质。

技术介绍

[0002]新闻来源是指新闻从何处获得,又称新闻出处、消息源,新闻来源所指的新闻又可称为苗头新闻。经常存在一些苗头新闻在网络中不断发酵的情况,针对此类容易发酵的苗头新闻,如果无法及时发现发酵的苗头新闻,会导致无法及时对发酵的苗头新闻进行处理。
[0003]目前,判断苗头新闻是否发酵的方式为:获取苗头新闻的热度趋势,当苗头新闻的热度上升到一定的热度阈值后,确定苗头新闻为发酵的苗头新闻,并开始对苗头新闻的关联新闻进行处理。
[0004]但是,目前判断苗头新闻是否发酵的方式中,对苗头新闻的热度的判断,是基于新闻系统自身已感知到的苗头新闻进行判断的,经常存在苗头新闻的热度在上升到热度阈值之前,网络上可能已经存在大量与苗头新闻相关的新闻和议论的情况。也即,新闻系统感知到苗头新闻发酵的时机相对于网络中苗头新闻实际发酵的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种新闻召回方法,所述方法包括:获取至少一条苗头新闻数据;提取每条所述苗头新闻数据的关键字段;根据每条所述苗头新闻数据的关键字段,生成每条所述苗头新闻数据对应的至少一个关联词组;分别根据每条所述苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述苗头新闻数据对应的关联新闻数据。2.根据权利要求1所述的方法,所述分别根据每条所述苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述苗头新闻数据对应的关联新闻数据之前,所述方法还包括:将每条所述苗头新闻数据分别输入预设的新闻价值模型,通过所述新闻价值模型预测每条所述苗头新闻数据的价值标签,所述价值标签包括有价值标签或无价值标签;根据每条所述苗头新闻数据的价值标签,对所述至少一条苗头新闻数据中无价值的苗头新闻数据进行过滤,得到有价值的苗头新闻数据;所述分别根据每条所述苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述苗头新闻数据对应的关联新闻数据,包括:分别根据每条所述有价值的苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述有价值的苗头新闻数据对应的关联新闻数据。3.根据权利要求2所述的方法,所述分别根据每条所述有价值的苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述有价值的苗头新闻数据对应的关联新闻数据之前,所述方法还包括:分别将每条所述有价值的苗头新闻数据的关键字段输入预设的新闻重要度模型,通过所述新闻重要度模型输出每条所述有价值的苗头新闻数据的重要度;根据每条所述有价值的苗头新闻数据的重要度,按照重要度由高到低的方式对所有所述有价值的苗头新闻数据进行排序;所述分别根据每条所述有价值的苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述有价值的苗头新闻数据对应的关联新闻数据,包括:分别根据每条所述有价值的苗头新闻数据对应的关联词组,并按照所述有价值的苗头新闻数据的重要度排序结果,从至少一个新闻数据源中召回每条所述有价值的苗头新闻数据对应的关联新闻数据。4.根据权利要求3所述的方法,所述分别根据每条所述有价值的苗头新闻数据对应的关联词组,并按照所述有价值的苗头新闻数据的重要度排序结果,从至少一个新闻数据源中召回每条所述有价值的苗头新闻数据对应的关联新闻数据之前,所述方法还包括:根据所述有价值的苗头新闻数据的重要度排序结果,对重要度不符合第一预设规则的所述有价值的苗头新闻数据进行过滤。5.根据权利要求3所述的方法,所述根据每条所述有价值的苗头新闻数据的重要度,按照重要度由高到低的方式对所有所述有价值的苗头新闻数据进行排序之前,所述方法还包括:根据每条所述有价值的苗头新闻数据的重要度,对重要度不符合第二预设规则的所述
有价值的苗头新闻数据进行过滤。6.根据权利要求1

5任一项所述的方法,所述分别根据每条所述苗头新闻数据对应的关联词组,从至少一个新闻数据源中召回每条所述苗头新闻数据对应的关联新闻数据,包括:根据每条所述苗头新闻数据对应的关联词组,按照每条所述苗头新闻数据对应的目标周期,从至少一个新闻数据源中召回每条所述苗头新闻数据对应的关联新闻数据;所述方法还包括:对每条所述苗头新闻数据,当所述苗头新闻数据对应的目标周期为第N个周期时,N为大于1的整数,根据所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化,对第N+1个周期的时长进行调节;其中,不同的苗头新闻数据对应的第1个周期的时长相同。7.根据权利要求6所述的方法,所述根据所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化,对第N+1个周期的时长进行调节,包括:当所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化为增大时,将第N+1个周期的时长增加第一预设时长;当所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化为减小时,将第N+1个周期的时长减小第二预设时长。8.根据权利要求6所述的方法,所述根据所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化,对第N+1个周期的时长进行调节,包括:当所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化为增大时,根据数量的增大比例,增加第N+1个周期的时长;当所述第N个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量,相对于第N

1个周期内召回的所述苗头新闻数据对应的关联新闻数据的数量的变化为减小时,根据数量的减小比例,减小第N+1个周期的时长。9.根据权利要求6

8任一项所述的方法,所述方法还包括:当所述苗头新闻数据对应的...

【专利技术属性】
技术研发人员:张天陈程卓泽城齐晓辉龚建
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1