【技术实现步骤摘要】
本专利技术实施例涉及互联网技术,尤其涉及一种话题订阅方法及装置。
技术介绍
现有技术中的话题订阅方式大致分成两种,一种是以资源为主,一种是以需求订阅为主,分别介绍如下:以资源为主的推荐方式以今日头条为例,通过记录用户日常的点击资源来猜测用户的兴趣,隐式的推荐相关的资源,例如,某个用户经常点击NBA相关的文章,则该用户在持续使用“今日头条”的过程中,会发现其它NBA相关的文章明显的增多。“今日头条”的资源主要由合作媒体来提供,技术上通过一定的筛选过滤出满足要求的资源,通过计算资源之间的相似度来进行隐式推荐。“今日头条”也支持订阅的功能,一是用户主要通过实体词来订阅话题,这种方式的需求粒度太粗,该订阅中的文章命中用户真正需求的概率就会比较低;二是用户通过媒体号来订阅话题,这种方式太依赖该媒体号,不能持续的命中某个用户的需求。以需求订阅为主的推荐方式以“即刻”为例,如图1所示,在“即刻”首页是一些需求话题订阅的推荐,用户可以分类查找,或者直接搜索自己感兴趣的话题。当用户订阅某些需求话题之后,“即刻”通过推送来提醒用户这些订阅有新的资源,用户也可以通过点击“消息”来查看订阅需求里的最新的资源,如图2所示。综上所述,以资源为主和以需求订阅为主的方式都存在着相同的缺陷,即
没有考虑用户自身的属性或者行为,不能很好的表示用户真正的兴趣点。
技术实现思路
有鉴于此,本专利技术实施例提供一种话题订阅方法及装置,以增加命中用户感兴趣的话题的概率。第一方面,本专利技术实施例提供了一种话题订阅方法,所述方法包括:根据用户的检索关键词,结合用户的历史行为和/或订阅记录 ...
【技术保护点】
一种话题订阅方法,其特征在于,所述方法包括:根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;将所述持续性话题返回客户端显示,以供所述用户进行订阅;保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。
【技术特征摘要】
1.一种话题订阅方法,其特征在于,所述方法包括:根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题;将所述持续性话题返回客户端显示,以供所述用户进行订阅;保存所述用户订阅的持续性话题,并在所述用户订阅的持续性话题对应的匹配资源有更新时,将更新的匹配资源推荐给用户。2.根据权利要求1所述的方法,其特征在于,还包括:根据所述用户的历史行为及持续性话题的订阅行为,确定向所述用户推荐的持续性话题并推荐给所述用户。3.根据权利要求1所述的方法,其特征在于,还包括:在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示,其中,所述持续性话题检索库包括持续性话题和匹配资源的关联关系。4.根据权利要求3所述的方法,其特征在于,在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源,并返回客户端显示包括:在接收到用户点击的持续性话题时,在预先建立的持续性话题检索库中查询相应的匹配资源;根据所述匹配资源的点击记录、资源属性和用户的历史行为,对所述匹配资源进行排序;按照排序结果,将所述匹配资源返回客户端显示。5.根据权利要求1所述的方法,其特征在于,根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题包括:根据用户的检索关键词,结合用户的历史行为和/或订阅记录,确定所述检索关键词的持续性话题;根据所述持续性话题的点击记录和用户的历史行为,对所述持续性话题进行排序。6.根据权利要求1-5任一所述的方法,其特征在于,在根据用户的检索关键词,结合用户的历史行为和/或订阅记录,为所述检索关键词匹配持续性话题之前,还包括:根据用户检索日志,挖掘出满足预设条件的用户查询作为持续性话题;根据预先配置网站和所述持续性话题的点击资源,建立资源库;建立所述持续性话题和所述资源库中的资源的关联,存入持续性话题检索库。7.根据权利要求6所述的方法,其特征在于,所述预设条件包括:在第一预设天数内超过预设人数连续搜索第二预设天数,和/或包括预设关键词。8.根据权利要求6所述的方法,其特征在于,根据预先配置网站和所述持续性话题的点击资源,建立资源库包括:获取所述预先配置网站中的资源和所述持续性话题的点击资源,作为原始资源;根据所述原始资源的标题和正文,对字面内容一致的原始资源进行去重,得到资源;提取所述资源的资源属性,所述资源属性包括标题、摘要、配图和价值得分;将所述资源和对应的资源属性存入资源库。9.根据权利要求6所述的方法,其特征在于,建立所述持续性话题和所述
\t资源库中的资源的关联,存入持续性话题检索库包括:分别提取所述持续性话题和所述资源的词分布,所述持续性话题的统计语料包括所述持续性话题的点击资源和所述资源库中标题包含所述持续性话题的资源;根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理;建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库;根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重。10.根据权利要求9所述的方法,其特征在于,根据所述持续性话题的词分布和词向量特征,对所述持续性话题进行去重和聚类处理包括:根据所述持续性话题的词分布和词向量特征,计算所述持续性话题之间的相似度;保留所述相似度大于第一预设阈值的持续性话题中的一个持续性话题;将所述相似度大于第二预设阈值且小于或等于第一预设阈值的持续性话题归为一类。11.根据权利要求9所述的方法,其特征在于,建立处理后的持续性话题和资源的关联关系,存入持续性话题检索库包括:对所述处理后的持续性话题建立词分布的倒排索引;根据资源的词分布和所述倒排索引,确定与该资源对应的候选持续性话题;计算该资源正文的词分布和所述候选持续性话题的词分布的相似度;将所述相似度大于预设阈值的候选持续性话题作为与该资源关联的持续性话题,存入持续性话题检索库。12.根据权利要求9所述的方法,其特征在于,根据持续性话题关联的资源的词分布,对处理后的持续性话题关联的资源进行去重包括:采用流式比较的方式,当所述持续性话题关联的两个资源的相似度大于预设相似度阈值时,保留所述两个资源中价值得分较高的资源。13.一种话题订阅装置,其特征在于,所述装置包括:话题...
【专利技术属性】
技术研发人员:田浩,李大任,黄波,戴岱,刘呈祥,魏安军,任可欣,袁海光,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。