创作者专业度画像评估方法及系统技术方案

技术编号:39132326 阅读:24 留言:0更新日期:2023-10-23 14:51
本发明专利技术涉及一种创作者专业度画像评估方法及系统,属于画像评估技术领域,该方法包括:通过分类模型获取待评估创作者的分档标签和分档预测概率,并获取各个待评估创作者在所属创作领域的第一专业度评分;获取各个待评估创作者在所属创作领域与其在链接图中相邻的其余创作者之间的相似度,基于相似度和第一专业度评分获取各个待评估创作者在所属创作领域的第二专业度评分;对各个待评估创作者在所属创作领域的第一专业度评分和第二专业度评分进行拟合,获取各个待评估创作者在所属创作领域的总专业度评分。本申请提供的方法及系统,发挥了有监督模型和无监督模型的各种优势,可得到一种准确率更高、鲁棒性更好的综合创作者专业度评估画像。专业度评估画像。专业度评估画像。

【技术实现步骤摘要】
创作者专业度画像评估方法及系统


[0001]本专利技术涉及画像评估
,尤其涉及一种创作者专业度画像评估方法及系统。

技术介绍

[0002]目前,构建用户画像的方法多种多样,然而,现有技术中大多数构建用户画像的方法都是把用户消费数据作为输入,诸如行为习惯、兴趣爱好等方面,构建的用户兴趣画像,缺乏从生产角度出发,为创作者构建创作的专业度画像;另一方面,现有技术中大多数构建用户画像的方法中用户打分也是基于全局的打分,无法做出领域分的细分。
[0003]同时,在现有技术中,可用于创作者专业度度量的方式多种多样,例如基于Pagerank对用户与用户之间的关注与被关注关系方法进行预估,或是采用用户与内容之间的交互关系,基于矩阵分解的方法来度量用户影响力,再例如采用张量分解,综合利用多种用户关注关系来度量用户影响力,然而,以上方式都是利用无监督建模的方式,无监督建模的方式存在以下问题:对结果解释性不强;无法适应新的数据;准确性不足,此外,无监督建模的方式采用单一的模型进行打分,存在准确率和鲁棒性不高的问题。
[0004]此外,随着互联网本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种创作者专业度画像评估方法,其特征在于,包括以下步骤:采集多个创作者分别对应的创作者数据,根据所述创作者数据获取各个创作者对应的专业度档次,并将各个创作者对应的专业度档次作为各个创作者的分档标签,形成标注分档标签的创作者数据集;将所述创作者数据集划分为训练集和验证集,分别通过所述训练集和所述验证集对分类模型进行训练和验证,获取参数最优化的分类模型;获取各个待评估创作者对应的创作者数据,提取其对应的包括所属创作领域的特征,将提取的特征输入至参数最优化的分类模型中获取待评估创作者的分档标签和分档预测概率,并获取各个待评估创作者在所属创作领域的第一专业度评分;通过计算所属领域垂直度获取各个待评估创作者的所属创作领域,并通过各个待评估创作者之间的关联关系构建各个待评估创作者之间的链接图,获取各个待评估创作者在所属创作领域与其在链接图中相邻的其余创作者之间的相似度,基于相似度和第一专业度评分获取各个待评估创作者在所属创作领域的第二专业度评分;通过对各个待评估创作者在所属创作领域的第一专业度评分和第二专业度评分进行拟合,获取各个待评估创作者在所属创作领域的总专业度评分。2.根据权利要求1所述的创作者专业度画像评估方法,其特征在于,所述专业度档次包括0、1、2三个档次。3.根据权利要求1所述的创作者专业度画像评估方法,其特征在于,所述获取各个待评估创作者对应的创作者数据,提取其对应的包括所属创作领域的特征,将提取的特征输入至参数最优化的分类模型中获取待评估创作者的分档标签和分档预测概率,并获取各个待评估创作者在所属创作领域的第一专业度评分包括以下步骤:获取各个待评估创作者对应的创作者数据,对各个待评估创作者对应的创作者数据进行基础特征提取,获取包括创作者基础信息和创作者内容基础信息的基础特征;通过已训练完成的特征抽取器对提取的基础特征进行再次提取,获取包括所属创作领域的高阶特征,并将所述高阶特征输入至参数最优化的分类模型中获取待评估创作者的分档标签和分档预测概率。4.根据权利要求1所述的创作者专业度画像评估方法,其特征在于,所述通过计算所属领域垂直度获取各个待评估创作者的所属创作领域包括以下步骤:对各个待评估创作者对应的创作者数据进行特征提取,获取一段时间内各个待评估创作者对应的作品及作品的创作内容标签;将一段时间内各个待评估创作者对应的作品数量与作品阈值数量进行比较;在一段时间内各个待评估创作者对应的作品数量小于等于作品阈值数量时,通过将具有相同创作内容标签的作品数代入至第一所属领域垂直度计算公式获取所属领域垂直度,其中,第一所属领域垂直度计算公式为:(具有相同创作内容标签的作品数/一段时间作品数)
×
sqrt(一段时间作品数/30);在一段时间内各个待评估创作者对应的作品数量大于作品阈值数量时,通过将具有相同创作内容标签的作品数代入至第二所属领域垂直度计算公式获取所属领域垂直度,其中,第二所属领域垂直度计算公式为:具有相同创作内容标签的作品数/30;对计算得到的所属领域垂直度按照从大到小的顺序进行排序,将排序在第一位的所属
领域垂直度对应的创作内容标签作为待评估创作者的所属创作领域。5.根据权利要求1所述的创作者专业度画像评估方法,其特征在于,所述通过各个待评估创作者之间的关联关系构建各个待评估创作者之间的链接图包括以下步骤:基于行为信号去掉无效关注关系,通过各个待评估创作者之间的关注关系建立各个待评估创作者之间的直接联系,获取各个待评估创作者之间的链接信息;将每个待评估创作者作为一个节点,将两个待评估创作者之间的链接作为一条有向边,基于各个待评估创作者之间的链接信息各个待评估创作者之间的链接图。6.根据权利要求1所述的创作者专业度画像评估方法,其特征在于,通过相似度计算公式获取各个待评估创作者在所属创作领域与其在链接图中相邻的其余创作者之间的相似度,所述相似度计算公式为:sim
t
(i,j)=simA
t
(i,j)
×
simB
t
(i,j),其中,sim
t
(i,j)为在t创作领域待评估创作者i与待评估创作者j之间的相似度,simA
t
(i,j)为在t创作领域待评估创作者i与待评估创作者j之间的内容相似度,simB
t
(i,j)为在t创作领域待评估创作者i与待评估创作者j之间的行为相似度;其中,simA
t
(i,j)=1

∣D...

【专利技术属性】
技术研发人员:朱淑媛曹珣马宝军姜昊
申请(专利权)人:联通在线信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1