【技术实现步骤摘要】
一种基于机器学习的信息推送方法以及相关装置
本申请涉及计算机
,尤其涉及一种基于机器学习的信息推送方法以及相关装置。
技术介绍
在互联网快速发展的时代,随着内容生产的门槛降低,现代人普遍信息过载,如何挖掘热点信息以使得用户主动且持续地关注某一社会新闻的进展成为一个亟待解决的问题。一般对于热点信息的生成会基于新闻资讯热点事件和专题内容生产,很大程度上依赖的是人工运营的筛选和选择,即人为的选择热点事件进行持续追踪,并产出相关的专题内容。但是,在大量信息源的情况下,仅依靠人工运营进行热点信息的挖掘并推送一方面需要人工凭借自己的经验来挑选事件专题内容,费时费力,影响信息推送的效率;另一方面无法全面的对大部分热点事件进行追踪,可能丢失一些关键内容,影响信息推送内容的全面性。
技术实现思路
有鉴于此,本申请提供一种信息推送的方法,可以有效避免由于人工运营而造成的信息推送效率低下以及推送不全面的情况,提高信息推送过程的效率以及全面性。本申请第一方面提供一种信息推送的方法,可以应用于终端设备 ...
【技术保护点】
1.一种信息推送的方法,其特征在于,包括:/n获取至少一个信息源的第一内容信息;/n根据预设规则从所述第一内容信息中提取至少一个目标话题,所述预设规则基于所述第一内容信息中的热点信息确定,所述热点信息与所述目标话题对应的信息相关;/n根据所述目标话题挖掘第二内容信息,以生成目标事件;/n基于所述目标事件进行信息追踪,以得到目标推送信息。/n
【技术特征摘要】
1.一种信息推送的方法,其特征在于,包括:
获取至少一个信息源的第一内容信息;
根据预设规则从所述第一内容信息中提取至少一个目标话题,所述预设规则基于所述第一内容信息中的热点信息确定,所述热点信息与所述目标话题对应的信息相关;
根据所述目标话题挖掘第二内容信息,以生成目标事件;
基于所述目标事件进行信息追踪,以得到目标推送信息。
2.根据权利要求1所述的方法,其特征在于,所述热点信息为词组,所述根据预设规则从所述第一内容信息中提取至少一个目标话题,包括:
确定所述第一内容信息中的热词;
基于所述热词确定候选词组;
根据注意力机制提取所述候选词组中的目标词组;
根据所述目标词组确定至少一个所述目标话题。
3.根据权利要求2所述的方法,其特征在于,所述根据注意力机制提取所述候选词组中的目标词组,包括:
获取所述候选词组在所述第一内容信息中的信息熵,所述信息熵用于指示所述候选词组的信息量大小;
基于所述信息熵分别计算不同所述候选词组之间的互信息;
根据所述互信息确定目标词组;
根据所述目标词组和所述热词确定至少一个所述目标话题。
4.根据权利要求2所述的方法,其特征在于,所述根据注意力机制提取所述候选词组中的目标词组,包括:
获取所述候选词组中相邻词汇的信息熵;
若所述相邻词汇的信息熵满足预设条件,则确定所述候选词组为所述目标词组。
5.根据权利要求2所述的方法,其特征在于,所述根据注意力机制提取所述候选词组中的目标词组,包括:
确定所述候选词组中的候选词汇;
根据第一预设算法分别计算所述候选词汇的出现频次;
根据所述出现频次提取所述候选词组中的目标词组。
6.根据权利要求1所述的方法,其特征在于,所述热点信息为文章,所述根据预设规则从所述第一内容信息中提取至少一个目标话题,包括:
确定所述第一内容信息中的热点文章;
将所述热点文章的标题切割为至少两个候选话题;
对所述候选话题进行聚类,以得到判别标识;
根据所述判别标识提取至少一个所述目标话题。
7.根据权利要求1所述的方法,其特征在于,所述根据所述目标话题挖掘第二内容信息,以生成目标事件,包括:
基于召回规则获取第三内容信息,所述召回规则基于所述目标话题确定;
对所述第三内容信息进行去重;
对去重后的所述第三内容信息进行相似度计算,以确定所述第二内容信息,所述相似度计算基于所述目标话题与所述第三内容信息...
【专利技术属性】
技术研发人员:刘刚,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。