话题内容的排序方法、装置、服务器及存储介质制造方法及图纸

技术编号:24121514 阅读:31 留言:0更新日期:2020-05-13 03:13
本申请提供了一种话题内容的排序方法、装置、服务器及存储介质,属于计算机技术领域。所述方法包括:获取待排序的与目标话题关联的第一话题内容,以及获取所述目标话题对应的话题画像,所述话题画像用于表征所述目标话题的主旨含义;根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度;根据所述第一话题内容与所述目标话题的第一相关度,对所述第一话题内容进行排序。在本申请中,将第一话题内容与目标话题的第一相关度作为排序依据,按照第一话题内容与目标话题的主旨含义的相关性进行排序,能够提高话题内容排序的准确率。

【技术实现步骤摘要】
话题内容的排序方法、装置、服务器及存储介质
本申请涉及计算机
,特别涉及一种话题内容的排序方法、装置、服务器及存储介质。
技术介绍
在内容分享平台,用户可以在分享内容时,将其要分享的内容与话题相关联,也可以在相应的话题页面下浏览其他用户发布的内容。为提升用户体验,内容分享平台需要对话题页面下的内容进行排序,在相应的话题页面中优先展示质量较高的内容。相关技术中,通常会根据话题页面下的每条内容对应的点赞量和浏览量,确定内容对应的质量指数;根据每个内容的质量指数,按照质量指数由高到低的顺序,在话题页面上依次展示内容。相关技术中,仅将点赞量和浏览量作为排序的依据,准确率较低。
技术实现思路
本申请实施例提供了一种话题内容的排序方法、装置、服务器及存储介质,能够解决话题内容排序准确率低的问题。所述技术方案如下:根据本申请实施例的一方面,提供了一种话题内容的排序方法,所述方法包括:获取待排序的与目标话题关联的第一话题内容,以及获取所述目标话题对应的话题画像,所述话题画像用于表征所述目标话题的主旨含义;根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度;根据所述第一话题内容与所述目标话题的第一相关度,对所述第一话题内容进行排序。在一种可能的实现方式中,所述获取所述目标话题对应的话题画像,包括:获取与所述目标话题关联的多个第二话题内容,以及,获取所述目标话题对应的话题描述,所述话题描述用于描述所述目标话题;确定每个第二话题内容分别与所述话题描述的第二相关度;根据所述每个第二话题内容与所述话题描述的第二相关度,将第二相关度最高的第一预设数量的第二话题内容组成所述话题画像。在另一种可能的实现方式中,所述确定每个第二话题内容分别与所述话题描述的第二相关度,包括:对于所述每个第二话题内容,将所述第二话题内容划分为至少一个预设长度的第三话题内容;对于所述至少一个第三话题内容中的每个第三话题内容,提取所述第三话题内容对应的第一特征向量;提取所述话题描述对应的第二特征向量;根据所述第一特征向量和所述第二特征向量,确定所述第三话题内容与所述话题描述的第一距离;从所述至少一个第三话题内容对应的至少一个第一距离中,确定大于距离阈值的第一距离的第一数量;根据所述第一数量和第二数量的比值,确定所述第二话题内容与所述话题描述的第二相关度,所述第二数量为所述至少一个第三话题内容的数量。在另一种可能的实现方式中,所述从所述至少一个第三话题内容对应的至少一个第一距离中,确定大于距离阈值的第一距离的第一数量之前,所述方法还包括:根据所述多个第二话题内容对应的多个第一距离,确定所述多个第一距离的平均值;将所述多个第一距离的平均值确定为所述距离阈值。在另一种可能的实现方式中,所述确定每个第二话题内容分别与所述话题描述的第二相关度,包括:对于所述每个第二话题内容,提取所述第二话题内容对应的第三特征向量,以及,提取所述话题描述对应的第二特征向量;根据所述第三特征向量和所述第二特征向量,确定所述第二话题内容与所述话题描述的第二距离;将所述第二距离作为所述第二话题内容与所述话题描述的第二相关度。在另一种可能的实现方式中,所述根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度,包括:将所述话题画像包括的至少一个第二话题内容拼接为第四话题内容;根据所述第四话题内容和主题模型,确定所述话题画像对应的第一主题分布;根据所述第一话题内容和所述主题模型,确定所述第一话题内容对应的第二主题分布;根据所述第一主题分布和所述第二主题分布,确定所述第一话题内容与所述目标话题的第一相关度。在另一种可能的实现方式中,所述根据所述第一主题分布和所述第二主题分布,确定所述第一话题内容与所述目标话题的第一相关度,包括:根据所述第一主题分布和所述第二主题分布,确定所述第一主题分布和所述第二主题分布的海林格距离;根据所述第一主题分布和所述第二主题分布,确定所述第一主题分布和第二主题分布的詹森香农散度;根据所述海林格距离和所述詹森香农散度的平均值,确定所述第一话题内容与所述目标话题的第一相关度。在另一种可能的实现方式中,所述根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度,包括:根据所述第一话题内容和所述主题模型,确定所述第一话题内容的第二主题分布;根据所述话题画像包括的至少一个第二话题内容中的每个第二话题内容和所述主题模型,确定所述话题画像对应的至少一个第三主题分布;根据所述第二主题分布和所述至少一个第三主题分布,确定所述第一话题内容与所述目标话题的第一相关度。在另一种可能的实现方式中,所述根据所述第二主题分布和所述至少一个第三主题分布,确定所述第一话题内容与所述目标话题的第一相关度,包括:对于所述至少一个第三主题分布中的每个第三主题分布,确定所述第二主题分布和所述第三主题分布的海林格距离,以及,确定所述第二主题分布和所述第三主题分布的詹森香农散度;根据所述海林格距离和所述詹森香农散度的平均值,确定所述第三主题分布对应的第三相关度;将所述至少一个第三主题分布对应的至少一个第三相关度的平均值,确定为所述第一话题内容与所述目标话题的第一相关度。在另一种可能的实现方式中,所述根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度,包括:将所述话题画像包括的至少一个第二话题内容拼接为第四话题内容;根据所述第四话题内容和主题模型,确定所述话题画像对应的第一主题分布;根据所述第一话题内容和所述主题模型,确定所述第一话题内容的第二主题分布;根据所述话题画像包括的至少一个第二话题内容中的每个第二话题内容和主题模型,确定所述话题画像对应的至少一个第三主题分布;根据所述第一主题分布、第二主题分布、所述至少一个第三主题分布、所述第一主题分布对应的第一权重和所述至少一个第三主题分布对应的第二权重,确定所述第一话题内容与所述目标话题的第一相关度。在另一种可能的实现方式中,所述方法还包括:接收终端发送的话题内容获取请求;按照所述第一相关度由大到小的顺序,向所述终端返回所述第一相关度最高的第二预设数量的第一话题内容。在另一种可能的实现方式中,所述获取待排序的与目标话题关联的第一话题内容,包括:接收终端发送的分享请求,所述分享请求携带所述第一话题内容;从所述分享请求中获取所述第一话题内容。根据本申请实施例的另一方面,提供了一种话题内容的排序装置,所述装置包括:获取模块,被配置为获取待排序的与目标话题关联的第一话题内容,以及获取所述目标话题对应的话题画像,所述话题画像用于表征所述本文档来自技高网...

【技术保护点】
1.一种话题内容的排序方法,其特征在于,所述方法包括:/n获取待排序的与目标话题关联的第一话题内容,以及获取所述目标话题对应的话题画像,所述话题画像用于表征所述目标话题的主旨含义;/n根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度;/n根据所述第一话题内容与所述目标话题的第一相关度,对所述第一话题内容进行排序。/n

【技术特征摘要】
1.一种话题内容的排序方法,其特征在于,所述方法包括:
获取待排序的与目标话题关联的第一话题内容,以及获取所述目标话题对应的话题画像,所述话题画像用于表征所述目标话题的主旨含义;
根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度;
根据所述第一话题内容与所述目标话题的第一相关度,对所述第一话题内容进行排序。


2.根据权利要求1所述的方法,其特征在于,所述获取所述目标话题对应的话题画像,包括:
获取与所述目标话题关联的多个第二话题内容,以及,获取所述目标话题对应的话题描述,所述话题描述用于描述所述目标话题;
确定每个第二话题内容分别与所述话题描述的第二相关度;
根据所述每个第二话题内容与所述话题描述的第二相关度,将第二相关度最高的第一预设数量的第二话题内容组成所述话题画像。


3.根据权利要求2所述的方法,其特征在于,所述确定每个第二话题内容分别与所述话题描述的第二相关度,包括:
对于所述每个第二话题内容,将所述第二话题内容划分为至少一个预设长度的第三话题内容;
对于所述至少一个第三话题内容中的每个第三话题内容,提取所述第三话题内容对应的第一特征向量;
提取所述话题描述对应的第二特征向量;
根据所述第一特征向量和所述第二特征向量,确定所述第三话题内容与所述话题描述的第一距离;
从所述至少一个第三话题内容对应的至少一个第一距离中,确定大于距离阈值的第一距离的第一数量;
根据所述第一数量和第二数量的比值,确定所述第二话题内容与所述话题描述的第二相关度,所述第二数量为所述至少一个第三话题内容的数量。


4.根据权利要求3所述的方法,其特征在于,所述从所述至少一个第三话题内容对应的至少一个第一距离中,确定大于距离阈值的第一距离的第一数量之前,所述方法还包括:
根据所述多个第二话题内容对应的多个第一距离,确定所述多个第一距离的平均值;
将所述多个第一距离的平均值确定为所述距离阈值。


5.根据权利要求2所述的方法,其特征在于,所述确定每个第二话题内容分别与所述话题描述的第二相关度,包括:
对于所述每个第二话题内容,提取所述第二话题内容对应的第三特征向量,以及,提取所述话题描述对应的第二特征向量;
根据所述第三特征向量和所述第二特征向量,确定所述第二话题内容与所述话题描述的第二距离;
将所述第二距离作为所述第二话题内容与所述话题描述的第二相关度。


6.根据权利要求1所述的方法,其特征在于,所述根据所述第一话题内容和所述话题画像,确定所述第一话题内容与所述目标话题的第一相关度,包括:
将所述话题画像包括的至少一个第二话题内容拼接为第四话题内容;
根据所述第四话题内容和主题模型,确定所述话题画像对应的第一主题分布;
根据所述第一话题内容和所述主题模型,确定所述第一话题内容对应的第二主题分布;
根据所述第一主题分布和所述第二主题分布,确定所述第一话题内容与所述目标话题的第一相关度。


7.根据权利要求6所述的方法,其特征在于,所述根据所述第一主题分布和所述第二主题分布,确定所述第一话题内容与所述目标话题的第一相关度,包括:
根据所述第一主题分布和所述第二主题分布,确定所述第一主题分布和所述第二主题分布的海林格距离;
根据所述第一主题分布和所述第二主题分布,确定所述第一主题分布和第二主题分布的詹森香农散度;
根据所述海林格距离和所述詹森香农散度的平均值,确...

【专利技术属性】
技术研发人员:韩振东黄尚志
申请(专利权)人:汉海信息技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1