一种社区平台内容排序方法、系统、终端及存储介质技术方案

技术编号:33780754 阅读:16 留言:0更新日期:2022-06-12 14:35
本发明专利技术公开了一种社区平台内容排序方法、系统、终端及存储介质。所述方法包括:获取所有待排序回答的基础数据以及用户行为数据;所述基础数据包括待排序回答的时间维度数据以及内容维度数据;根据所述基础数据计算各个待排序回答的内容基础得分;基于所述用户行为数据,利用威尔逊算法计算出各个待排序回答的用户得分;基于所述基础数据以及用户行为数据计算各个待排序回答的质量评分;将所述内容基础得分、用户得分以及质量评分进行融合,得到各个回答的最终得分,并根据所述最终得分对所有待排序回答进行排序。本发明专利技术融合了质量评分,使得高质量的回答排名更高,排名更加合理。排名更加合理。排名更加合理。

【技术实现步骤摘要】
一种社区平台内容排序方法、系统、终端及存储介质


[0001]本专利技术涉及社区问答排序
,特别是涉及一种社区平台内容排序方法、系统、终端及存储介质。

技术介绍

[0002]目前,知乎、百度知道等社区问答平台为互联网用户提供了一个在线提问和解答的平台,帮助人们方便地获得日常或专业问题的高质量回答。随着社区问答变得越来越受欢迎,平台的许多问题也逐渐浮现,其中一个重要的问题就是回答的质量参差不齐,如果低质量回答在所有回答中的排序靠前,则会极大地影响用户在平台上的问答体验。因此,如何有效地根据用户浏览、点赞等行为以及回答质量、发布时间等因素对所有回答进行合理的排序,是社区问答平台急需解决的问题。
[0003]当下各种社区问答平台使用的回答排序模型主要考虑了时间维度、用户行为维度、内容维度和用户维度,其中用户行为维度根据用户的浏览量、回复量、收藏量、分享量、点赞量和点踩量等计算内容的得分。常用的算法为基于用户评价行为进行排序的威尔逊算法,但是威尔逊算法本身有相关的先决条件,仅适用于有用户评价数据问答社区平台,而无法适用于只有点赞行为的平台。另外,威尔逊算法没有将内容质量考虑到排序得分之中,无法识别出用户刷赞等不合理行为对得分的影响。

技术实现思路

[0004]本专利技术提供了一种社区平台内容排序方法、系统、终端及存储介质,旨在解决现有的回答排序模型无法适用于只有点赞行为的平台、且没有将内容质量考虑到排序得分之中等技术问题。
[0005]为解决上述技术问题,本专利技术采用的技术方案为:/>[0006]一种社区平台内容排序方法,包括:
[0007]获取所有待排序回答的基础数据以及用户行为数据;所述基础数据包括待排序回答的时间维度数据以及内容维度数据;
[0008]根据所述基础数据计算各个待排序回答的内容基础得分;
[0009]基于所述用户行为数据,利用威尔逊算法计算出各个待排序回答的用户得分;
[0010]基于所述基础数据以及用户行为数据计算各个待排序回答的质量评分;
[0011]将所述内容基础得分、用户得分以及质量评分进行融合,得到各个回答的最终得分,并根据所述最终得分对所有待排序回答进行排序。
[0012]本专利技术实施例采取的技术方案还包括:所述时间维度数据包括各个待排序回答的发布时间以及最后回复时间,所述内容维度数据包括各个待排序回答的回答文本字数;
[0013]所述用户行为数据包括各个待排序回答的浏览量、点赞量、评论量、收藏量、用户活跃度以及用户所在群组信息。
[0014]本专利技术实施例采取的技术方案还包括:所述根据所述基础数据计算各个待排序回
答的内容基础得分包括:
[0015]根据所述回答文本字数计算各个待排序回答的文本字数得分,将所述文本字数得分作为待排序回答的内容基础得分。
[0016]本专利技术实施例采取的技术方案还包括:所述根据所述基础数据计算各个待排序回答的内容基础得分包括:
[0017]根据所述回答文本字数计算各个待排序回答的文本字数得分;
[0018]计算各个待排序回答与对应问题之间的文本语义相似度,并根据所述文本语义相似度计算各个待排序回答与对应问题之间的相关性;
[0019]根据所述文本字数得分以及待排序回答与对应问题之间的相关性计算各个待排序回答的内容基础得分。
[0020]本专利技术实施例采取的技术方案还包括:所述基于所述用户行为数据,利用威尔逊算法计算出各个待排序回答的用户得分具体为:
[0021]基于所述用户行为数据获取各个待排序回答的具有访问行为的用户数量,并对各个待排序回答中有过正向互动行为的用户集合进行去重,得到各个待排序回答的具有正向互动行为的用户数量;所述正向互动行为包括各个待排序回答的浏览、点赞、收藏、评论或分享行为;
[0022]基于所述具有正向互动行为的用户数量以及具有访问行为的用户数量,利用威尔逊算法计算出各个待排序回答的用户得分;
[0023][0024]其中,p表示具有正向互动行为的用户数量除以具有访问行为的用户数量;z
α
为正态分布的分位数,n表示具有访问行为的用户数量。
[0025]本专利技术实施例采取的技术方案还包括:所述基于所述基础数据以及用户行为数据计算各个待排序回答的质量评分包括:
[0026]基于所述基础数据以及用户行为数据,利用人工审核或/和回答质量分类模型计算各个待排序回答的质量等级,将所述质量等级作为各个待排序回答的质量评分;
[0027]或根据所述时间维度数据计算各个待排序回答的热度,将所述热度作为各个待排序回答的质量评分。
[0028]本专利技术实施例采取的技术方案还包括:所述将所述内容基础得分、用户得分以及质量评分进行融合,得到各个回答的最终得分为:
[0029]s=(s
base
+s
wilson
)*quality
[0030]或:
[0031]s=(s
base
+s
wilson
)*heat
[0032]其中s
base
为内容基础得分,s
wilson
为用户得分,quality为质量等级,heat为热度。
[0033]本专利技术实施例采取的另一技术方案为:一种社区平台内容排序系统,包括:
[0034]数据获取模块:用于获取所有待排序回答的基础数据以及用户行为数据;所述基础数据包括待排序回答的时间维度数据以及内容维度数据;
[0035]基础得分计算模块:用于根据所述基础数据计算各个待排序回答的内容基础得
分;
[0036]用户得分计算模块:用于基于所述用户行为数据,利用威尔逊算法计算出各个待排序回答的用户得分;
[0037]质量计算模块:用于基于所述基础数据以及用户行为数据计算各个待排序回答的质量评分;
[0038]排序模块:用于将所述内容基础得分、用户得分以及质量评分进行融合,得到各个回答的最终得分,并根据所述最终得分对所有待排序回答进行排序。
[0039]本专利技术实施例采取的又一技术方案为:一种终端,所述终端包括处理器、与所述处理器耦接的存储器,其中,
[0040]所述存储器存储有用于实现上述的社区平台内容排序方法的程序指令;
[0041]所述处理器用于执行所述存储器存储的所述程序指令以执行所述社区平台内容排序操作。
[0042]本专利技术实施例采取的又一技术方案为:一种存储介质,存储有处理器可运行的程序指令,所述程序指令用于执行上述的社区平台内容排序方法。
[0043]本专利技术实施例的社区平台内容排序方法、系统、终端及存储介质通过获取回答的基础数据以及用户行为数据,根据基础数据以及用户行为数据计算出回答的内容基础得分、用户得分以及质量评分,并将内容基础得分、用户得分以及质量评分进行融合,得到最终的回答得分,根据最终的得分对回答内容进行排序。本专利技术由本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种社区平台内容排序方法,其特征在于,包括:获取所有待排序回答的基础数据以及用户行为数据;所述基础数据包括待排序回答的时间维度数据以及内容维度数据;根据所述基础数据计算各个待排序回答的内容基础得分;基于所述用户行为数据,利用威尔逊算法计算出各个待排序回答的用户得分;基于所述基础数据以及用户行为数据计算各个待排序回答的质量评分;将所述内容基础得分、用户得分以及质量评分进行融合,得到各个回答的最终得分,并根据所述最终得分对所有待排序回答进行排序。2.根据权利要求1所述的社区平台内容排序方法,其特征在于,所述时间维度数据包括各个待排序回答的发布时间以及最后回复时间,所述内容维度数据包括各个待排序回答的回答文本字数;所述用户行为数据包括各个待排序回答的浏览量、点赞量、评论量、收藏量、用户活跃度以及用户所在群组信息。3.根据权利要求2所述的社区平台内容排序方法,其特征在于,所述根据所述基础数据计算各个待排序回答的内容基础得分包括:根据所述回答文本字数计算各个待排序回答的文本字数得分,将所述文本字数得分作为待排序回答的内容基础得分。4.根据权利要求2所述的社区平台内容排序方法,其特征在于,所述根据所述基础数据计算各个待排序回答的内容基础得分包括:根据所述回答文本字数计算各个待排序回答的文本字数得分;计算各个待排序回答与对应问题之间的文本语义相似度,并根据所述文本语义相似度计算各个待排序回答与对应问题之间的相关性;根据所述文本字数得分以及待排序回答与对应问题之间的相关性计算各个待排序回答的内容基础得分。5.根据权利要求2所述的社区平台内容排序方法,其特征在于,所述基于所述用户行为数据,利用威尔逊算法计算出各个待排序回答的用户得分具体为:基于所述用户行为数据获取各个待排序回答的具有访问行为的用户数量,并对各个待排序回答中有过正向互动行为的用户集合进行去重,得到各个待排序回答的具有正向互动行为的用户数量;所述正向互动行为包括对各个待排序回答的浏览、点赞、收藏、评论或分享行为;基于所述具有正向互动行为的用户数量以及具有访问行为的用户数量,利用威尔逊算法计算出各个待排序回答的用户得分;其中,p表示具有正向互动行为的用户数量除以具有访问行为的用户数量;z

【专利技术属性】
技术研发人员:陈涛赵晓辉
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1