网络社区热点内容的判别方法、装置、设备以及存储介质制造方法及图纸

技术编号:26791305 阅读:26 留言:0更新日期:2020-12-22 17:06
本申请实施例公开了网络社区热点内容的判别方法、装置、设备以及存储介质,涉及机器学习技术领域。该网络社区热点内容的判别方法的一具体实施方式包括:接收到根据用户对网络社区内帖子的操作行为确定的触发信号;获取帖子的属性信息特征;将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子,从而获取符合本网络社区特征的热点内容,提高获取的热点内容的时效性,降低获取热点内容的人工成本。

【技术实现步骤摘要】
网络社区热点内容的判别方法、装置、设备以及存储介质
本申请涉及计算机
,具体涉及机器学习领域,尤其涉及网络社区热点内容的判别方法、装置、设备以及存储介质。
技术介绍
随着移动互联网时代的到来,互联网技术正在不断的影响着人们的生活,各种社区类站点(如:脉脉、贴吧、微博、知乎等)每天产生数亿的内容供用户消费,人们在逛社区时不仅浏览阅读常规内容,更多的会去寻找、消费社会广泛关注的内容,即社会热点新闻或热点内容。现有的热点内容挖掘主要是通过机器抓取、人工等方式,通过机器抓取其它新闻站点(如:微博、头条)的热点事件,其发现的热点事件内容带有其它站点特征较重,与本社区特征不相符,且时效性不强,存在时间延迟。通过人工编辑添加的热点内容发现策略,需要新闻敏感度的运营人员去手工添加,人工成本太高。
技术实现思路
为了解决上述
技术介绍
部分提到的一个或多个技术问题,本申请实施例提供了网络社区热点内容的判别方法、装置、设备以及存储介质。第一方面,本申请实施例提供了网络社区热点内容的判别方法,包括:接收到根据用户对网络社区内帖子本文档来自技高网...

【技术保护点】
1.一种网络社区热点内容的判别方法,包括:/n接收到根据用户对网络社区内帖子的操作行为确定的触发信号;/n获取帖子的属性信息特征;/n将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。/n

【技术特征摘要】
1.一种网络社区热点内容的判别方法,包括:
接收到根据用户对网络社区内帖子的操作行为确定的触发信号;
获取帖子的属性信息特征;
将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别,得到属于热点内容的帖子。


2.根据权利要求1所述的方法,所述将所述帖子的属性信息特征输入至预先训练的判别模型,进行热点内容判别包括:
将所述帖子的属性信息特征输入至预先训练的逻辑回归模型,得到所述帖子的第一分数;
将所述帖子的文本信息输入至自然语言处理分词模型,得到分词集合;
将所述分词集合输入至搜索加权模型,得到所述帖子的第二分数,其中,所述搜索加权模型基于每个分词的搜索频次确定对应的权重分数;
基于所述帖子的第一分数和第二分数,确定所述帖子的综合分数,若所述帖子的综合分数大于或等于预定阈值,则将所述帖子标记为热点内容。


3.根据权利要求2所述的方法,还包括:
根据所述分词出现在第三方网络社区的个数,利用所述搜索加权模型确定所述分词对应的权重分数,得到所述帖子的第三分数;
基于所述帖子的第一分数、第二分数、第三分数,确定所述帖子的综合分数,若所述帖子的综合分数大于或等于预定阈值,则将所述帖子标记为热点内容。


4.根据权利要求2所述的方法,其中,在将所述帖子的文本信息输入至自然语言处理分词模型之前,还包括:
若所述帖子的发布时间与当前时间的时间间隔大于约定阈值,则将所述帖子标记为非热点内容。


5.根据权利要求1所述的方法,训练所述逻辑回归模型的方法包括:
获取训练样本帖子的属性信息特征及属性信息特征的权重信息;
标注训练样本帖子的类别;
基于训练样本帖子的类别、属性信息特征、属性信息特征的权重信息,训练逻辑回归模型,并用梯度下降对所述属性信息特征的权重信息进行更新,得到所述属性信息特征的权重向量。


6.根据权利要求2所述的方法,所述将所述帖子的属性信息特征输入至预先训练的逻辑回归模型,得到所述帖子的第一分数包括:
若所述帖子的第一分数小于预定阈值,则将所述帖子标记为非热点内容。


7.一种网络社区热点内容的判别装置,其特征在于,所述装置包括:
接收模块,被配置为接收到根据用户对网络社区内帖子的操作行为确定的触发信号;
获取模块,被配置为获取帖子的属性信息特征;
判别模块,被配置为将所述帖子的属性信息特征输入至预先训练...

【专利技术属性】
技术研发人员:肖锋逄增耀
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1