当前位置: 首页 > 专利查询>济南大学专利>正文

结合动态兴趣与专业知识的问答社区专家推荐方法及系统技术方案

技术编号:26762912 阅读:67 留言:0更新日期:2020-12-18 23:18
本发明专利技术公开了结合动态兴趣与专业知识的问答社区专家推荐方法及系统,包括:获取目标问题数据;将目标问题数据进行向量化表示,得到问题表示向量;将候选用户数据进行向量化表示,得到用户表示向量;基于问题表示向量和用户表示向量,输出推荐的用户。采用深度学习方法,减少人工特征提取的不准确性,更好地编码深层次复杂特征。考虑用户侧信息的动态变化,成功表征用户兴趣动态和专业知识动态。引入词向量进行文本的表示,简化特征处理流程。

【技术实现步骤摘要】
结合动态兴趣与专业知识的问答社区专家推荐方法及系统
本申请涉及机器学习及数据挖掘
,特别是涉及结合动态兴趣与专业知识的问答社区专家推荐方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本申请相关的
技术介绍
,并不必然构成现有技术。互联网将全球信息互连形成了信息时代不可或缺的基础信息平台,其中知识分享服务已经成为人们获取信息的主要工具。为了加快互联网知识共享,出现了大量的问答社区。然而,伴随用户急剧增多,平台短时间内积攒了数目巨大、类型多样的问题,远远超过有效回复数,严重降低了用户服务体验。如何将用户提出的问题有效推荐给可能解答的用户,以及挖掘用户感兴趣的问题是这些平台面临的严重挑战。这种情况下,工业界和学术界对以上问题开展了广泛研究,提出了一些针对问答社区的专家推荐方法提高平台解答效率。现有的大部分工作都将专家推荐问题视为基于内容的推荐任务,基于共现信息抓取用户配置文件和问题之间的相关性,或是基于语言模型或主题模型挖掘用户隐式主题信息。但这些方法无法解决问题和用户配置文件之间存在着复杂语义差异。后续又出现混合模型,考虑针对不本文档来自技高网...

【技术保护点】
1.结合动态兴趣与专业知识的问答社区专家推荐方法,其特征是,包括:/n获取目标问题数据;/n将目标问题数据进行向量化表示,得到问题表示向量;/n将候选用户数据进行向量化表示,得到用户表示向量;/n基于问题表示向量和用户表示向量,输出推荐的用户。/n

【技术特征摘要】
1.结合动态兴趣与专业知识的问答社区专家推荐方法,其特征是,包括:
获取目标问题数据;
将目标问题数据进行向量化表示,得到问题表示向量;
将候选用户数据进行向量化表示,得到用户表示向量;
基于问题表示向量和用户表示向量,输出推荐的用户。


2.如权利要求1所述的方法,其特征是,将目标问题数据进行向量化表示,得到问题表示向量;具体步骤包括:
将问题标题文本信息进行Embedding词向量化,将词向量化后的结果依次经过第一卷积神经网络CNN和第一注意力机制Attention模型,输出问题标题的表示向量;
将问题内容文本信息进行Embedding词向量化,将词向量化后的结果依次经过第二卷积神经网络CNN和第二注意力机制Attention模型,输出问题内容的表示向量;
将问题标签信息进行Embedding词向量化,将词向量化后的结果进行全局平均化,得到问题标签的表示向量;
将问题标题的表示向量、问题内容的表示向量和问题标签的表示向量,进行拼接,得到最终的问题表示向量。


3.如权利要求1所述的方法,其特征是,将候选用户数据进行向量化表示,得到用户表示向量;具体步骤包括:
对候选用户的历史回答过的问题进行向量化表示,得到用户兴趣动态表示向量;
对候选用户的历史回答过的问题对应的用户回复进行向量化表示,得到用户专业知识动态表示向量;
对候选用户的标签信息进行向量化表示,得到用户长期固定兴趣表示向量;
将用户兴趣动态表示向量、用户专业知识动态表示向量和用户长期固定兴趣表示向量进行拼接,得到最终的用户表示向量。


4.如权利要求3所述的方法,其特征是,所述对候选用户的历史回答过的问题进行向量化表示,得到用户兴趣动态表示向量;具体实现方式为:
对候选用户的历史回答过的问题按照时间先后顺序进行排序,得到历史问题序列;
将历史问题序列输入到问题编码器中,输出历史回答问题的问题向量表示;
对历史回答问题的问题向量表示进行Embedding词向量化;
将词向量化后的序列依次经过双层Bi-GRU结构,得到用户兴趣动态表示向量。

【专利技术属性】
技术研发人员:纪科吕晓琦杨波陈贞翔马坤孙润元
申请(专利权)人:济南大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1