基于机器学习的微信公众号推荐算法及系统技术方案

技术编号:23764964 阅读:22 留言:0更新日期:2020-04-11 19:21
本发明专利技术公开了基于机器学习的微信公众号推荐算法,包括:为训练文本标注标签,获取训练文本的关键词及关键词向量,对关键词向量进行聚类计算,获得簇,并确定簇的中心向量;采集公众号文本,获取公众号文本的关键词及关键词向量,根据关键词向量与中心向量的相似度确定公众号文本对应的标签,获得标签分析结果;根据目标用户的历史行为确定目标用户的喜好标签;从标签分析结果中选取与喜好标签相关的标签,将相关的标签对应的公众号文本推荐给目标用户。本发明专利技术还提供了基于机器学习的微信公众号推荐系统。本发明专利技术能够根据分析用户喜好,进而自动推荐合适的公众号,避免用户受各种良莠不齐的公众号干扰,避免花费过多时间用于挑选公众号文章。

WeChat official account recommendation algorithm and system based on machine learning

【技术实现步骤摘要】
基于机器学习的微信公众号推荐算法及系统
本专利技术涉及计算机机器学习领域。更具体地说,本专利技术涉及基于机器学习的微信公众号推荐算法及系统。
技术介绍
微信公众平台是现代人们获取社会热点信息、分享知识经验和文字交流的主要手段之一。随着微信用户群体的逐渐扩大,微信公众号的数量也不断增多,各种各样的公众号出现在人们的视野之中,极大的拓宽了人们获取信息的渠道,增加了人们的见闻。与之相对的,公众号增多带来的负面影响也随之而来。由于公众号本质是一个信息交流分享平台,因此准入门槛并不高,只要通过了基本的认证,任何用户都可以分享自己的任何事物,无论是日常生活、人生经验、官方通告亦或是技术感悟等。这就导致了其内容五花八门,公众号种类繁多,使得人们不得不浪费精力去筛选那些自己想看的,想关注的公众号。因此,除了常规的公众号检索功能以外,公众号智能推荐也显得十分重要。
技术实现思路
本专利技术的一个目的是提供基于机器学习的微信公众号推荐算法及系统,其用标签标注和聚类算法获得微信公众号文本的特征标签,并根据用户历史行为推断用户的喜好标签,进本文档来自技高网...

【技术保护点】
1.基于机器学习的微信公众号推荐算法,其特征在于,包括:/n为训练文本标注标签,获取训练文本的关键词及关键词向量,对关键词向量进行聚类计算,获得簇,并确定簇的中心向量;/n采集公众号文本,获取公众号文本的关键词及关键词向量,根据关键词向量与中心向量的相似度确定公众号文本对应的标签,获得标签分析结果;/n根据目标用户的历史行为确定目标用户的喜好标签;/n从标签分析结果中选取与喜好标签相关的标签,将相关的标签对应的公众号文本推荐给目标用户。/n

【技术特征摘要】
1.基于机器学习的微信公众号推荐算法,其特征在于,包括:
为训练文本标注标签,获取训练文本的关键词及关键词向量,对关键词向量进行聚类计算,获得簇,并确定簇的中心向量;
采集公众号文本,获取公众号文本的关键词及关键词向量,根据关键词向量与中心向量的相似度确定公众号文本对应的标签,获得标签分析结果;
根据目标用户的历史行为确定目标用户的喜好标签;
从标签分析结果中选取与喜好标签相关的标签,将相关的标签对应的公众号文本推荐给目标用户。


2.如权利要求1所述的基于机器学习的微信公众号推荐算法,其特征在于,所述历史行为包括目标用户的阅读行为,获取目标用户的历史已读文本,获取关键词及关键词向量,根据关键词向量与中心向量的相似度确定历史已读文本对应的标签,作为喜好标签。


3.如权利要求2所述的基于机器学习的微信公众号推荐算法,其特征在于,获取训练文本、公众号文本或历史已读文本的关键词及关键词向量的方法包括:对文本进行分词,用Skip-gram模型将各词语转化为词向量,然后用TF-IDF算法提取关键词,即获得关键词及关键词向量。


4.如权利要求3所述的基于机器学习的微信公众号推荐算法,其特征在于,还包括:
在提取关键词时,计算关键词的TF-IDF值;
计算关键词向量与中心向量的相似度;
其中,以各关键词的TF-IDF值为权值,将公众号文本的所有关键词向量与同一标签对应的中心向量的相似度值加权平均,将计算结果作为公众号文本与该标签的匹配权重,若匹配权重符合第一设定规则,则判断该公众号文本属于该标签。


5.如权利要求4所述的基于机器学习的微信公众号推荐算法,其特征在于,
以各关键词的TF-IDF值为权值,将历史已读文本的所有关键词向量与同一标签对应的中心向量的相似度值加权平均,将计算结果作为目标用户对该标签的喜好权重,若喜好权重符合第二设定规则,则将该标签作为喜好标签。


6.如权利要求4所述的基于机器学习的微信公众号推荐算法,其特征在于,若获得多个簇,则确定多个簇的中心向量;
分别计算关键词向量与各中心向量的相似度值,取最大相似度...

【专利技术属性】
技术研发人员:张旭梁汝锋张传新刘春阳郑阳刘巨安
申请(专利权)人:国家计算机网络与信息安全管理中心北京蓝光汇智网络科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1