一种数据处理方法及装置制造方法及图纸

技术编号:26650736 阅读:33 留言:0更新日期:2020-12-09 00:51
本申请实施例提供了一种数据处理方法,包括:获取第一查询语句,并确定第一查询语句的特征向量。获取多个自媒体账号中每个自媒体账号分别对应的特征向量。确定第一查询语句的特征向量和每个自媒体账号分别对应的特征向量之后,可以根据第一查询语句的特征向量、以及所述每个自媒体账号分别对应的特征向量,确定每个自媒体账号和第一查询语句的匹配程度。并根据每个自媒体账号和第一查询语句的匹配程度,对多个自媒体账号进行排序,并输出排序靠前的第一数目个自媒体账号的信息。账号排序越靠前,说明该账号发布的内容和第一查询语句的相关程度越高。由此可见,利用本方案,可以为用户推荐发布内容与第一查询语句相关程度比较高的自媒体账号。

【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及数据处理领域,特别是涉及一种数据处理方法及装置。
技术介绍
随着网络技术的发展,用户可以通过网络获取信息。目前,出现了一些公众账号,公众账号可以发布一些内容例如文章或者视频等,以供用户查看。在一些场景中,“公众账号”也可以被称为“公众号”。目前,对于某一话题,会有许多公众号发布相关的内容,如何为用户确定与用户关注的话题相关程度高的公众号,是目前尚待解决的问题。
技术实现思路
本申请所要解决的技术问题是如何为用户确定与用户关注的话题相关程度高的公众号,提供一种数据处理方法及装置。第一方面,本申请实施例提供了一种数据处理方法,所述方法包括:获取第一查询语句,并确定所述第一查询语句的特征向量;获取多个自媒体账号中每个自媒体账号分别对应的特征向量;根据所述第一查询语句的特征向量、以及所述多个自媒体账号中每个自媒体账号分别对应的特征向量,确定每个自媒体账号和所述第一查询语句的匹配程度;根据所述每个自媒体账号和所述第一查询语句的匹配程度,对所述多个自媒体账本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取第一查询语句,并确定所述第一查询语句的特征向量;/n获取多个自媒体账号中每个自媒体账号分别对应的特征向量;/n根据所述第一查询语句的特征向量、以及所述多个自媒体账号中每个自媒体账号分别对应的特征向量,确定每个自媒体账号和所述第一查询语句的匹配程度;/n根据所述每个自媒体账号和所述第一查询语句的匹配程度,对所述多个自媒体账号进行排序;/n输出排序靠前的第一数目个自媒体账号的信息。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取第一查询语句,并确定所述第一查询语句的特征向量;
获取多个自媒体账号中每个自媒体账号分别对应的特征向量;
根据所述第一查询语句的特征向量、以及所述多个自媒体账号中每个自媒体账号分别对应的特征向量,确定每个自媒体账号和所述第一查询语句的匹配程度;
根据所述每个自媒体账号和所述第一查询语句的匹配程度,对所述多个自媒体账号进行排序;
输出排序靠前的第一数目个自媒体账号的信息。


2.根据权利要求1所述的方法,其特征在于,所述多个自媒体账号包括第一账号,所述第一账号对应的特征向量,根据所述第一账号的账号描述信息和/或所述第一账号历史发布的内容确定。


3.根据权利要求1所述的方法,其特征在于,所述多个自媒体账号包括第一账号,所述第一账号和所述第一查询语句的匹配程度,包括:
所述第一账号的特征向量和所述第一查询语句的特征向量的余弦相似度。


4.根据权利要求1-3任意一项所述的方法,其特征在于,所述多个自媒体账号包括第一账号,所述第一账号和所述第一查询语句的匹配程度,通过如下方式确定:
将所述第一账号的特征向量和所述第一查询语句的特征向量输入预先训练的机器学习模型,得到所述第一账号和所述第一查询语句的匹配程度;其中:
所述机器学习模型用于根据所述第一账号的特征向量和所述第一查询语句的特征向量,得到所述第一账号和所述第一查询语句的匹配程度。


5.根据权利要求4所述的方法,其特征在于,所述机器学习模型,根据训练查询语句的特征向量、正样本账号的特征向量以及负样本账号的特征向量训练得到,其中,所述正样本账号与所述训练查询语句的匹配程度,高于所述负样本账号与所述训练查询语句的匹配程度。


6.根据权利要求5所述的方法,其特征在于,
所述正样本账号包括:
向网络用户推荐的与所述训练查询语句匹配的账号中被所述网络用户选择的账号;
所述负...

【专利技术属性】
技术研发人员:严浩宫兆汉彭君睿陈炜鹏许静芳
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1