【技术实现步骤摘要】
一种面向问答社区的问题回答专家跨域推荐方法及系统
[0001]本专利技术属于数据挖掘
,尤其涉及一种面向问答社区的问题回答专 家跨域推荐方法及系统。
技术介绍
[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在 先技术。
[0003]近期,随着网络的发展,知识问答社区日益成为人们分享经验与获取知识 的新平台,知识问答社区的模式是交互式的,大量的用户在平台上提出自己的 疑难问题并且分享自己的知识和见解。对于用户来说,不仅是问题的提问者, 也是答案的回答者。作为问题的提问者,用户可以在平台上向其他用户提出问 题以得到他们的解答;作为答案的回答者,用户依据自己生活中积累的经验以 及通过各种渠道获得的知识来提出自己的见解,帮助有问题的用户解决各种疑 难问题。但是,随着问题的增多,许多问题不能及时分配给合适的专家,不能 够得到及时有效的解决。为了解决这一问题,知识问答社区专家推荐被提出, 其主要目的是为问题及时分配合适的专家,从而可以使问题得到快速且高质量 的回答。
[0004]专利技术人发现,以往的专家推荐方法往往利用单个问答社区信息进行专家推 荐。然而,对于一些新投入使用的在线问答社区,社区内注册用户较少而且用 户个人信息的填写并不是强制性的,所以导致用户的个人描述画像不够详细, 无法全面的捕捉到用户专业能力特征,为问题的推荐带来很大的阻力和困难。 同时,新投入使用的在线问答社区中问答记录数目有限,有限的数据也会导致 推荐模型的准确性受限。以往的方法往往在单个问答社区进行 ...
【技术保护点】
【技术特征摘要】
1.一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,包括如下步骤:提取目标域和源域中的问题和专家特征信息;基于问题和专家特征信息构建训练样本;基于训练样本对目标域专家推荐模型、源域专家推荐模型和特征降维模型进行训练;根据训练好的目标域专家推荐模型、源域专家推荐模型和特征降维模型对目标域中的新问题进行专家推荐,得到专家推荐列表,具体包括:基于目标域中的新问题和目标域专家推荐模型进行专家推荐,得到第一专家推荐列表;结合特征降维模型,通过相似度计算公式找到此问题在源域中对应的多个相近问题,采用源域专家推荐模型对多个相近问题进行专家推荐,得到第二专家推荐列表;基于相似度计算公式,计算目标域中与第二专家推荐列表相似的第三专家推荐列表;基于合并规则,将第一专家推荐列表和第三专家推荐列表进行合并,得到最终的专家推荐列表。2.如权利要求1所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述基于问题和专家特征信息构建训练样本包括:基于目标域和源域中的问题和专家之间的交互信息构建目标域和辅助域的评分矩阵;使用自然语言处理模型Bert模型将问题和专家的文本特征转换为向量表示,离散化特征使用one
‑
hot表示,并对数值特征进行归一化处理,将对应特征组合后构成问题和专家的向量化特征表示;基于目标域和源域中问题和专家的向量化特征表示和评分矩阵构建训练样本数据。3.如权利要求1所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述通过相似度计算公式找到此问题在源域中对应的多个相近问题,采用源域专家推荐模型对多个相近问题进行专家推荐,得到第二专家推荐列表,包括:使用目标域编码器将新问题的特征映射为向量表示同时使用源域编码器将源域问题的特征映射为向量表示通过计算此新问题与源域中问题的特征的余弦相似度来找到与此新问题最相近的K个问题。4.如权利要求1所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述特征降维模型构建过程包括:分别在目标域和源域使用栈式降噪自编码将两个域中的问题特征表示和专家特征表示映射到相同的特征维度。5.如权利要求4所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述栈式降噪自编码包括多个降噪自编码器,单个降噪自编码器由编码器和解码器组成,编码器的计算公式如下:其中,为编码器输入x加入高斯噪声之后的特征,W
Encoder
,b
Encoder
分别为编码器的权重和偏置,LeakyRelu为激活函数;解码器的计算公式如下:z=LeakyRelu(W
Decoder
y+b
Dec...
【专利技术属性】
技术研发人员:于旭,彭庆龙,杜军威,崔鑫,徐凌伟,梁宏涛,江峰,陈卓,
申请(专利权)人:青岛科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。