一种利用非对称的多面排序网络学习解决社区问答任务的方法技术

技术编号：18204185 阅读：27 留言：0更新日期：2018-06-13 06:18

本发明专利技术公开了一种利用非对称的多面排序网络学习解决社区问答任务的方法。主要包括如下步骤：1)针对于一组用户、问题、答案数据集，构建用户、问题、答案之间相互关系的网络，并且针对于形成的网络，利用非对称的多面排序网络学习形成多面排序标准函数。2)根据得到的多面排序标准函数，对于某一问题针对于不同用户的答案进行排序。相比于一般的问题答案推荐解决方案，本发明专利技术利用了非对称的多面排序网络学习的方法，能够综合利用问题答案之间的语义相关性与用户之间的相互关系。本发明专利技术在社交问答网站问题答案预测中所取得的效果相比于传统的方法更好。

全部详细技术资料下载

【技术实现步骤摘要】
一种利用非对称的多面排序网络学习解决社区问答任务的方法
本专利技术涉及社区问答任务，尤其涉及一种利用非对称的多面排序网络学习解决社区问答任务的方法。
技术介绍
随着以社区为基础的问答网站的蓬勃发展，以社区为基础的问答网站服务已经成为一项重要的网络服务，该服务可以针对于用户提出的问题，让其余用户进行解答并显示在网站上，而针对于每一个问题，通常会有许多用户提出不同的答案，则对于不同答案的排序便成为了该类型网站的重要任务之一，但是目前问答网站中已有该项功能的效果并不是很好。现有的技术主要是将问题答案匹配作为一种问答语义匹配的任务来做，该方法主要是通过学习出问题与答案的语义表达，从而将与问题相关度最高的答案排在前面，该方法仅仅考虑到了问题与答案的语义关联度，并没有利用到社区问答网站中的用户相互关系。为了克服这个缺陷，本方法将同时利用到问题答案的语义匹配信息与社区网站中的用户关系。本专利技术将首先利用已有的用户、问题、答案之间的关系及用户之间的相互关系构建异质的非对称社区问答网络，之后通过LSTM网络来获取问题及答案的语义表达，利用随机初始化得到用户表达，之后结合用户表达及问题答案的语义表达得到关于用户问答语义映射相关性的损失值。之后通过构建的非对称社交问答网络中的用户之间相互关注的关系，得到用户之间相互影响矩阵，并利用该矩阵与用户表达得到反映用户之间相互关系的损失项值。将用户问答语义映射相关的损失值与反映用户相互关系的损失值结合，得到最终的损失目标函数，经过训练，得到最终社区问答网站中问题答案之间的相关程度信息。
技术实现思路
本专利技术的目的在于解决现有技术中的问题...
一种利用非对称的多面排序网络学习解决社区问答任务的方法

【技术保护点】
一种利用非对称的多面排序网络学习解决社区问答任务的方法，其特征在于包括如下步骤：1)针对于一组社交网络用户及其提出的问题与相关答案，构建包含用户、问题与答案之间相互关系的异质的非对称社区问答网络；2.1)对于步骤1)形成的社区问答网络，利用单词映射网络及LSTM网络形成问题答案的映射，再结合用户映射获取反映用户问答语义映射相关性的损失值；2.2)对于步骤1)形成的社区问答网络，利用其中含有的用户关系，与用户映射矩阵相结合，得到反映用户之间相互关系的损失项值；2.3)利用步骤2.1)获得的反映用户问答语义映射相关性的损失值与步骤2.2)获得的反映用户之间相互关系的损失项值，得到最终的损失函数及目标函数；3)经过训练，得到最终的多面排序标准函数，根据该函数可以对于任意问题及用户提出的答案进行排序，将更适合问题的答案排在前列。

【技术特征摘要】
1.一种利用非对称的多面排序网络学习解决社区问答任务的方法，其特征在于包括如下步骤：1)针对于一组社交网络用户及其提出的问题与相关答案，构建包含用户、问题与答案之间相互关系的异质的非对称社区问答网络；2.1)对于步骤1)形成的社区问答网络，利用单词映射网络及LSTM网络形成问题答案的映射，再结合用户映射获取反映用户问答语义映射相关性的损失值；2.2)对于步骤1)形成的社区问答网络，利用其中含有的用户关系，与用户映射矩阵相结合，得到反映用户之间相互关系的损失项值；2.3)利用步骤2.1)获得的反映用户问答语义映射相关性的损失值与步骤2.2)获得的反映用户之间相互关系的损失项值，得到最终的损失函数及目标函数；3)经过训练，得到最终的多面排序标准函数，根据该函数可以对于任意问题及用户提出的答案进行排序，将更适合问题的答案排在前列。2.根据权利要求1所述利用非对称的多面排序网络学习解决社区问答任务的方法，其特征在于所述的步骤2.1)具体为：对于所给出的问题、答案，利用如下方法获得每个问题与答案的映射表达：首先利用预训练好的单词映射方法获得问题答案中单词的对应映射，对于问题xi的第t个单词，得到其映射为xit；之后将问题的单词映射序列{xi1,...,xin}作为LSTM的输入，将所有问题的单词全部输入之后，进行训练，将最后一层的输出作为问题的语义表达，记为qi；对于答案yi，将答案中的每一句话的所有单词的单词映射序列{yi1,...,yin}输入到LSTM网络中，将每一句话的最后一层的输出作为该句话的语义表达，之后在该答案的所有句子的语义表达输出上面增加一最大池化层，将最大池化层的输出作为该答案的语义表达，记为ai；通过随机初始化得到用户的映射矩阵U＝{u1,u2,...,ul}，根据步骤1)获得的异质的非对称社区问答网络，获得关于问题及相关答案和用户的限制集合R＝{(i,j,k,o,p)}，该集合中的每一条数据(i,j,k,o,p)代表的含义为“针对于问题i而言，由用户k提出的答案j可以比由用户p提出的答案o获得更多的支持，更加符合问题的要求；”针对于R＝{(i,j,k,o,p)}中的每一条数据，按照如下公式构建反映用户问答语义映射相关性的损失函数Lr：其中，c代表提前定义好的权衡最...

【专利技术属性】
技术研发人员：赵洲，孟令涛，林志杰，蔡登，何晓飞，庄越挺，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人