一种面向问答社区的问题回答专家跨域推荐方法及系统技术方案

技术编号:34538814 阅读:16 留言:0更新日期:2022-08-13 21:34
本发明专利技术属于数据挖掘技术领域,提供了一种面向问答社区的问题回答专家跨域推荐方法及系统,该方法提取目标域和源域中的问题和专家特征信息;基于问题和专家特征信息构建训练样本;基于训练样本对目标域专家推荐模型和源域专家推荐模型进行训练;根据训练好的目标域专家推荐模型和源域专家推荐模型对目标域中的新问题进行专家推荐,得到专家推荐列表,助信息积累丰富社区中丰富信息来提升新问答社区中推荐性能的跨域推荐模型,解决了新社区中信息匮乏的问题,有效提升了目标域中的推荐性能。能。能。

【技术实现步骤摘要】
一种面向问答社区的问题回答专家跨域推荐方法及系统


[0001]本专利技术属于数据挖掘
,尤其涉及一种面向问答社区的问题回答专 家跨域推荐方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在 先技术。
[0003]近期,随着网络的发展,知识问答社区日益成为人们分享经验与获取知识 的新平台,知识问答社区的模式是交互式的,大量的用户在平台上提出自己的 疑难问题并且分享自己的知识和见解。对于用户来说,不仅是问题的提问者, 也是答案的回答者。作为问题的提问者,用户可以在平台上向其他用户提出问 题以得到他们的解答;作为答案的回答者,用户依据自己生活中积累的经验以 及通过各种渠道获得的知识来提出自己的见解,帮助有问题的用户解决各种疑 难问题。但是,随着问题的增多,许多问题不能及时分配给合适的专家,不能 够得到及时有效的解决。为了解决这一问题,知识问答社区专家推荐被提出, 其主要目的是为问题及时分配合适的专家,从而可以使问题得到快速且高质量 的回答。
[0004]专利技术人发现,以往的专家推荐方法往往利用单个问答社区信息进行专家推 荐。然而,对于一些新投入使用的在线问答社区,社区内注册用户较少而且用 户个人信息的填写并不是强制性的,所以导致用户的个人描述画像不够详细, 无法全面的捕捉到用户专业能力特征,为问题的推荐带来很大的阻力和困难。 同时,新投入使用的在线问答社区中问答记录数目有限,有限的数据也会导致 推荐模型的准确性受限。以往的方法往往在单个问答社区进行推荐模型的训练, 对于新社区来说,不能满足社区专家推荐系统快速、准确推荐的要求。

技术实现思路

[0005]为了解决上述
技术介绍
中存在的至少一项技术问题,本专利技术提供一种面向 问答社区的问题回答专家跨域推荐方法及系统,其充分利用相关平台丰富的信 息来提升新平台的专家推荐系统的性能。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]本专利技术的第一个方面提供一种面向问答社区的问题回答专家跨域推荐方 法,包括如下步骤:
[0008]提取目标域和源域中的问题和专家特征信息;
[0009]基于问题和专家特征信息构建训练样本;
[0010]基于训练样本对目标域专家推荐模型、源域专家推荐模型和特征降维模型 进行训练;
[0011]根据训练好的目标域专家推荐模型、源域专家推荐模型和特征降维模型对 目标域中的新问题进行专家推荐,得到专家推荐列表,具体包括:
[0012]基于目标域中的新问题和目标域专家推荐模型进行专家推荐,得到第一专 家推荐列表;
[0013]结合特征降维模型,通过相似度计算公式找到此问题在源域中对应的多个 相近问题,采用源域专家推荐模型对多个相近问题进行专家推荐,得到第二专 家推荐列表;
[0014]基于相似度计算公式,计算目标域中与第二专家推荐列表相似的第三专家 推荐列表;基于合并规则,将第一专家推荐列表和第三专家推荐列表进行合并, 得到最终的专家推荐列表。
[0015]本专利技术的第二个方面提供一种面向问答社区的问题回答专家跨域推荐系 统,包括:
[0016]特征提取模块,用于提取目标域和源域中的问题和专家特征信息;
[0017]训练样本构建模块,用于基于问题和专家特征信息构建训练样本;
[0018]训练模块,用于基于训练样本对目标域专家推荐模型、源域专家推荐模型 和特征降维模型进行训练;
[0019]专家推荐模块,用于根据训练好的目标域专家推荐模型、源域专家推荐模 型和特征降维模型对目标域中的新问题进行专家推荐,得到专家推荐列表,具 体包括:
[0020]基于目标域中的新问题和目标域专家推荐模型进行专家推荐,得到第一专 家推荐列表;
[0021]结合特征降维模型,通过相似度计算公式找到此问题在源域中对应的多个 相近问题,采用源域专家推荐模型对多个相近问题进行专家推荐,得到第二专 家推荐列表;
[0022]基于相似度计算公式,计算目标域中与第二专家推荐列表相似的第三专家 推荐列表;基于合并规则,将第一专家推荐列表和第三专家推荐列表进行合并, 得到最终的专家推荐列表。
[0023]本专利技术的第三个方面提供一种计算机可读存储介质。
[0024]一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行 时实现如上述所述的一种面向问答社区的问题回答专家跨域推荐方法中的步 骤。
[0025]本专利技术的第四个方面提供一种计算机设备。
[0026]一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上 运行的计算机程序,所述处理器执行所述程序时实现如上述所述的一种面向问 答社区的问题回答专家跨域推荐方法中的步骤。
[0027]与现有技术相比,本专利技术的有益效果是:
[0028]本专利技术通过跨域的方式,借助信息积累丰富社区(源域)中丰富信息来提 升新问答社区(目标域)中的推荐性能,解决了新社区中信息匮乏的问题,有 效提升了目标域中的推荐性能。
[0029]本专利技术提出了基于自编码器的特征维度对齐模型,解决了两个域中问题特 征维度不一致,问题回答专家特征维度不一致所导致的无法计算相似度的问题。
[0030]本专利技术使用目标域推荐模型和源域推荐模型相结合的方式得到两个推荐列 表,并设计了良好的推荐列表合并策略,对源域中的丰富信息利用充分,提升 了目标域的推荐性能。
[0031]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述 中变
得明显,或通过本专利技术的实践了解到。
附图说明
[0032]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本发 明的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0033]图1是本专利技术实施例面向问答社区的问题回答专家跨域推荐方法的流程示 意图;
[0034]图2是本专利技术实施例多层的BP网络结构示意图;
[0035]图3是本专利技术实施例栈式降噪自编码器逐层训练示意图;
[0036]图4是本专利技术实施例栈式降噪自编码器的微调示意图。
具体实施方式
[0037]下面结合附图与实施例对本专利技术作进一步说明。
[0038]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。 除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的 普通技术人员通常理解的相同含义。
[0039]需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图 限制根据本专利技术的示例性实施方式。如在这里所使用的,除非上下文另外明确 指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说 明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器 件、组件和/或它们的组合。
[0040]实施例一
[0041]如图1所示,本实施例提供一种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,包括如下步骤:提取目标域和源域中的问题和专家特征信息;基于问题和专家特征信息构建训练样本;基于训练样本对目标域专家推荐模型、源域专家推荐模型和特征降维模型进行训练;根据训练好的目标域专家推荐模型、源域专家推荐模型和特征降维模型对目标域中的新问题进行专家推荐,得到专家推荐列表,具体包括:基于目标域中的新问题和目标域专家推荐模型进行专家推荐,得到第一专家推荐列表;结合特征降维模型,通过相似度计算公式找到此问题在源域中对应的多个相近问题,采用源域专家推荐模型对多个相近问题进行专家推荐,得到第二专家推荐列表;基于相似度计算公式,计算目标域中与第二专家推荐列表相似的第三专家推荐列表;基于合并规则,将第一专家推荐列表和第三专家推荐列表进行合并,得到最终的专家推荐列表。2.如权利要求1所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述基于问题和专家特征信息构建训练样本包括:基于目标域和源域中的问题和专家之间的交互信息构建目标域和辅助域的评分矩阵;使用自然语言处理模型Bert模型将问题和专家的文本特征转换为向量表示,离散化特征使用one

hot表示,并对数值特征进行归一化处理,将对应特征组合后构成问题和专家的向量化特征表示;基于目标域和源域中问题和专家的向量化特征表示和评分矩阵构建训练样本数据。3.如权利要求1所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述通过相似度计算公式找到此问题在源域中对应的多个相近问题,采用源域专家推荐模型对多个相近问题进行专家推荐,得到第二专家推荐列表,包括:使用目标域编码器将新问题的特征映射为向量表示同时使用源域编码器将源域问题的特征映射为向量表示通过计算此新问题与源域中问题的特征的余弦相似度来找到与此新问题最相近的K个问题。4.如权利要求1所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述特征降维模型构建过程包括:分别在目标域和源域使用栈式降噪自编码将两个域中的问题特征表示和专家特征表示映射到相同的特征维度。5.如权利要求4所述的一种面向问答社区的问题回答专家跨域推荐方法,其特征在于,所述栈式降噪自编码包括多个降噪自编码器,单个降噪自编码器由编码器和解码器组成,编码器的计算公式如下:其中,为编码器输入x加入高斯噪声之后的特征,W
Encoder
,b
Encoder
分别为编码器的权重和偏置,LeakyRelu为激活函数;解码器的计算公式如下:z=LeakyRelu(W
Decoder
y+b
Dec...

【专利技术属性】
技术研发人员:于旭彭庆龙杜军威崔鑫徐凌伟梁宏涛江峰陈卓
申请(专利权)人:青岛科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1