【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及数据处理领域,特别是涉及一种数据处理方法及装置。
技术介绍
随着网络技术的发展,用户可以通过网络获取信息。目前,出现了一些公众账号,公众账号可以发布一些内容例如文章或者视频等,以供用户查看。在一些场景中,“公众账号”也可以被称为“公众号”。目前,对于某一话题,会有许多公众号发布相关的内容,如何为用户确定与用户关注的话题相关程度高的公众号,是目前尚待解决的问题。
技术实现思路
本申请所要解决的技术问题是如何为用户确定与用户关注的话题相关程度高的公众号,提供一种数据处理方法及装置。第一方面,本申请实施例提供了一种数据处理方法,所述方法包括:获取第一查询语句,并确定所述第一查询语句的特征向量;获取多个自媒体账号中每个自媒体账号分别对应的特征向量;根据所述第一查询语句的特征向量、以及所述多个自媒体账号中每个自媒体账号分别对应的特征向量,确定每个自媒体账号和所述第一查询语句的匹配程度;根据所述每个自媒体账号和所述第一查询语句的匹配程度 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取第一查询语句,并确定所述第一查询语句的特征向量;/n获取多个自媒体账号中每个自媒体账号分别对应的特征向量;/n根据所述第一查询语句的特征向量、以及所述多个自媒体账号中每个自媒体账号分别对应的特征向量,确定每个自媒体账号和所述第一查询语句的匹配程度;/n根据所述每个自媒体账号和所述第一查询语句的匹配程度,对所述多个自媒体账号进行排序;/n输出排序靠前的第一数目个自媒体账号的信息。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取第一查询语句,并确定所述第一查询语句的特征向量;
获取多个自媒体账号中每个自媒体账号分别对应的特征向量;
根据所述第一查询语句的特征向量、以及所述多个自媒体账号中每个自媒体账号分别对应的特征向量,确定每个自媒体账号和所述第一查询语句的匹配程度;
根据所述每个自媒体账号和所述第一查询语句的匹配程度,对所述多个自媒体账号进行排序;
输出排序靠前的第一数目个自媒体账号的信息。
2.根据权利要求1所述的方法,其特征在于,所述多个自媒体账号包括第一账号,所述第一账号对应的特征向量,根据所述第一账号的账号描述信息和/或所述第一账号历史发布的内容确定。
3.根据权利要求1所述的方法,其特征在于,所述多个自媒体账号包括第一账号,所述第一账号和所述第一查询语句的匹配程度,包括:
所述第一账号的特征向量和所述第一查询语句的特征向量的余弦相似度。
4.根据权利要求1-3任意一项所述的方法,其特征在于,所述多个自媒体账号包括第一账号,所述第一账号和所述第一查询语句的匹配程度,通过如下方式确定:
将所述第一账号的特征向量和所述第一查询语句的特征向量输入预先训练的机器学习模型,得到所述第一账号和所述第一查询语句的匹配程度;其中:
所述机器学习模型用于根据所述第一账号的特征向量和所述第一查询语句的特征向量,得到所述第一账号和所述第一查询语句的匹配程度。
5.根据权利要求4所述的方法,其特征在于,所述机器学习模型,根据训练查询语句的特征向量、正样本账号的特征向量以及负样本账号的特征向量训练得到,其中,所述正样本账号与所述训练查询语句的匹配程度,高于所述负样本账号与所述训练查询语句的匹配程度。
6.根据权利要求5所述的方法,其特征在于,
所述正样本账号包括:
向网络用户推荐的与所述训练查询语句匹配的账号中被所述网络用户选择的账号;
所述负...
【专利技术属性】
技术研发人员:严浩,宫兆汉,彭君睿,陈炜鹏,许静芳,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。