【技术实现步骤摘要】
热点信息挖掘方法、装置、计算机设备以及存储介质
[0001]本申请涉及人工智能
,具体涉及一种热点信息挖掘方法、装置、计算机设备以及计算机可读存储介质(简称存储介质)。
技术介绍
[0002]随着互联网技术的发展,除了以图文为主的传统自媒体公众号平台外,还提供了可以随时分享视频的视频分享平台。在视频分享平台的视频搜索页面或视频推荐页面中,通常推荐用户关注度高的热点事件相关视频;但是,视频分享平台对热点事件相关视频的挖掘,通常是通过获取外部新闻网站或外部搜索网站所提供的热点事件相关信息,进而将热点事件相关信息与视频分享平台内的视频的相关信息进行匹配,筛选热点事件相关视频。现有技术中视频分享平台对热点事件相关视频的挖掘过于依赖外部新闻网站或外部搜索网站所提供的热点事件相关信息,容易误把非热点事件相关的视频当成热点视频,导致视频分享平台内部的热点事件相关视频无法推荐到视频搜索页面或视频推荐页面。
技术实现思路
[0003]基于此,有必要针对上述技术问题,提供一种热点信息挖掘方法、装置、计算机设备以及存储介质, ...
【技术保护点】
【技术特征摘要】
1.一种热点信息挖掘方法,其特征在于,所述方法包括:获取第一账号以及所述第一账号的种子视频;根据所述种子视频的文本信息对所述种子视频进行聚类,得到多个视频集;分别对各所述视频集下的种子视频进行第一分类,获取各所述视频集下属于事件类别的种子视频的第一数量;分别对各所述视频集下的种子视频进行第二分类,获取各所述视频集下属于广告类别的种子视频的第二数量;根据各所述视频集对应的第一数量以及第二数量,从所述视频集中确定热点事件视频集。2.根据权利要求1所述的方法,其特征在于,所述根据各所述视频集对应的第一数量以及第二数量,从所述视频集中确定热点事件视频集的步骤之后,还包括:从所述热点事件视频集中筛选热点视频;基于所述热点视频的文本信息提取热点事件的文本标签。3.根据权利要求1所述的方法,其特征在于,所述根据各所述视频集对应的第一数量以及第二数量,从所述视频集中确定热点事件视频集的步骤之后,还包括:从所述热点事件视频集中筛选热点视频,根据所述热点视频的文本信息从视频库中获取标的视频;获取所述标的视频对应的第二账号,并获取所述第二账号所发布的全量视频以及所述全量视频的总数量;在所述第二账号的全量视频中获取属于热点事件对应视频的第三数量;若所述第三数量与所述全量视频的总数量间的比值大于预设比值,根据所述第二账号更新第一账号。4.根据权利要求3所述的方法,其特征在于,所述根据所述热点视频的文本信息从视频库中获取标的视频的步骤,包括:根据所述热点视频的文本信息获取所述热点视频的第一标签文本;获取所述视频库中原始视频的文本信息以及第二标签文本;基于所述第一标签文本以及所述第二标签文本获取所述热点视频与所述原始视频间的标签相似度特征信息;对所述热点视频的文本信息和所述原始视频的文本信息进行拼接,得到第一拼接文本,并基于所述第一拼接文本获取第一文本相似度特征信息;对所述热点视频的文本信息和所述原始视频的第二标签文本进行拼接,得到第二拼接文本,并基于所述第二拼接文本获取第二文本相似度特征信息;基于所述标签相似度特征信息、所述第一文本相似度特征信息以及所述第二文本相似度特征信息,识别所述原始视频与所述热点视频间的匹配结果;基于所述原始视频的匹配结果获取标的视频。5.根据权利要求1所述的方法,其特征在于,所述根据所述种子视频的文本信息对所述种子视频进行聚类,得到多个视频集的步骤之前,还包括:从视频库中所有原始视频的文本信息中提取视频关键词;其中,所述视频关键词包括一元关键词;
统计各所述视频关键词在当前时间窗口内的第一词频以及在历史时间窗口内的第二词...
【专利技术属性】
技术研发人员:岳天驰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。