当前位置: 首页 > 专利查询>浙江大学专利>正文

一种利用排序标准网络学习解决社区问答任务的方法技术

技术编号:18658037 阅读:17 留言:0更新日期:2018-08-11 14:26
本发明专利技术公开了一种利用排序标准网络学习解决社区问答任务的方法。主要包括如下步骤:1)针对于一组用户、问题数据集,构建用户、问题之间相互关系的网络,并且针对于形成的网络,利用排序标准网络学习形成问题及用户的最终表达。2)根据得到的用户及问题的最终表达,对于某一问题推荐其最佳用户。相比于一般的问题推荐解决方案,本发明专利技术同时利用问题的语义表达信息与社区网站中的异构社区问答网络结构,并结合使用随机游走的方法来学习出社区问答网站中的问题及用户的表达。本发明专利技术在社交问答网站问题答案预测中所取得的效果相比于传统的方法更好。

A method of learning community quiz tasks based on sorting standard network

The invention discloses a method for solving community quiz tasks by using sorting standard network. The main steps are as follows: 1) For a group of users, problem data sets, build a network between users and problems, and for the formed network, use the ranking standard network learning to form problems and the final expression of users. 2) Recommend the best user for a problem according to the final expression of the user and the problem. Compared with the general problem recommendation solution, the invention simultaneously uses the semantic expression information of the question and the heterogeneous community question answering network structure in the community website, and combines the random walk method to learn the questions in the community question answering website and the user's expression. The method has better effect than the traditional method in the question answer prediction of the social question answering website.

【技术实现步骤摘要】
一种利用排序标准网络学习解决社区问答任务的方法
本专利技术涉及社区问答任务,尤其涉及一种利用排序标准网络学习解决社区问答任务的方法。
技术介绍
随着以社区为基础的问答网站的蓬勃发展,以社区为基础的问答网站服务已经成为一项重要的网络服务,该服务可以针对于用户提出的问题,让其余用户进行解答并显示在网站上,而针对于每一个问题,通常会有许多用户提出不同的答案,则对于同一个问题寻找最佳的回答者用户成为了该类型网站的重要任务之一,但是目前问答网站中已有该项功能的效果并不是很好。现有的技术主要是将问题答案匹配作为一种基于语义的专家推荐的任务来做,该方法主要是通过根据用户过去的问答表现来预测用户未来对于问题的回答表现,该方法虽然取得了一定的效果,但是仍然受制于对于问题内容的非有效性表达与问答网站数据的稀疏性。为了克服这个缺陷,本方法将同时利用到问题的语义表达信息与社区网站中的异构社区问答网络结构,并结合使用随机游走的方法来学习出社区问答网站中的问题及用户的表达。本专利技术将首先利用已有的用户、问题之间的关系及用户之间的相互关系构建排序标准异质社区问答网络,之后通过LSTM网络来获取问题的语义表达,利用随机初始化得到用户表达。之后通过随机游走的方法,在构建的排序标准异质社区问答网络中得到采样路径,对于采样路径中的每个点按照相关公式计算出损失函数值,并将损失函数值相加,得到最终损失函数,结合模型内系数得到最终目标函数。经过训练,得到最终社区问答网站中问题及用户的表达信息,根据问题及用户的表达,得到对于某个问题的最佳回答用户。
技术实现思路
本专利技术的目的在于解决现有技术中的问题,为了克服现有技术中受制于对于问题内容的非有效性表达与问答网站数据的稀疏性的问题,本专利技术提供一种利用排序标准网络学习解决社区问答任务的方法。本专利技术所采用的具体技术方案是:利用排序标准网络学习解决社区问答任务的方法,包含如下步骤:1、针对于一组社交网络用户及其对应回答的问题,利用已有的用户、问题之间的关系及用户之间的相互关系构建包含用户与问题之间相互关系的排序标准异质社区问答网络。2、利用单词映射网络及LSTM网络获取问题的语义表达,利用随机初始化获取用户的映射表达。针对于步骤1构建的排序标准异质社区问答网络,利用随机游走的方法获取样本路径,之后对于样本路径中的每个点,获取损失函数值,并将损失函数值累加,结合模型中的参数得到最终的损失函数,利用随机梯度下降的方法进行参数更新。经过多次迭代更新获取最终的用户及问题的表达。3、利用最终得到的用户及问题的表达对于问题的最佳用户进行预测。上述步骤可具体采用如下实现方式:1、对于所给出的用户及其对应回答的问题,依据对于同一个问题,不同的用户回答的相对好坏构建问题与用户之间的相对关系网络,在网络中标出对于此问题回答较好的用户与回答较差的用户。之后,依据用户之间的相互关注关系,在构建的网络上添加用户之间相互关注的关系得到包含用户与问题之间相互关系的排序标准异质社区问答网络。2、对于所给出的问题,利用如下方法获得每个问题的映射表达:首先利用预训练好的单词映射方法获得问题答案中单词的对应映射,对于问题xi的第t个单词,得到其映射为xit。之后将问题的所有句子的单词映射序列{xi1,...,xin}作为LSTM网络的输入,将所有问题的各个句子的单词全部分别输入LSTM网络之后,进行训练,将问题的每一句话输入LSTM网络后,LSTM网络的最后一层的输出作为问题中每一句话的语义表达,之后在该问题的所有句子的语义表达输出上面增加一最大池化层,将最大池化层的输出作为该问题的语义表达,记为qi3、通过随机初始化得到用户的映射矩阵U={u1,u2,...,ul}。之后在每次迭代过程中,首先将步骤1获得的排序标准异质社区问答网络中的所有用户点及问题点进行随机排序,对于排序后所获取的点集合O中的每一个点,按照先后顺序,利用随机游走的方法进行路径采样,得到路径点集;在路径采样时,保证只能按照从关注人到被关注人的路径方向进行采样,采样后的路径构成路径集合W。对于路径集合W中的每一个路径点集Wvi中的每一个路径点vi,按照如下公式计算损失函数:其中,Q代表步骤1中获得的排序标准异质社区问答网络中的问题点的集合,U代表步骤1中获得的排序标准异质社区问答网络中的用户点的集合,公式中的u+代表当点vi代表路径点集中的问题点时在路径点集中更善于回答问题vi的用户,u-代表在路径点集中相比于用户u+不善于回答问题vi的用户,m代表控制损失函数中的最大边界值的提前定义好的超参数。公式与公式为按照如下公式计算:fu(vi)=qiTu,其中qi代表问题vi在上一步迭代时计算得到的语义表达,u代表用户u+或u-在上一次迭代时计算得到的语义表达。公式中的u代表路径点集中的每一个用户点在上一次迭代中所求得的表达,||.||2代表求2阶范数。计算得到路径点集中的每一个路径点vi的损失值L(vi)后,将各个损失值按如下公式求总的目标函数:其中,θ为包括问题训练网络与用户训练网络在内的所有参数,代表将所有采样路径点集中的所有路径点vi的损失函数值l(vi)相加,λ为用来平衡损失函数和与模型总参数和的权衡参数。针对于该目标函数,循环迭代训练更新,经过T次循环迭代训练更新之后,得到最终的所有问题的表达QT={q1T,q2T,...,qnT}与所有用户的表达UT={u1T,u2T,...,umT},其中n代表所有问题的总数,m代表所有用户的总数。4、根据步骤3获得的所有问题的表达QT={q1T,q2T,...,qnT}与所有用户的表达UT={u1T,u2T,...,umT},对于每一个问题qj,按照公式获取每一个用户ui对于该问题的适配程度,将所得值最大的用户作为适合于该问题的用户,进行推荐。附图说明图1是本专利技术使用的利用用户、问题之间的关系及用户之间的相互关系构建的包含用户与问题之间相互关系的排序标准异质社区问答网络的整体示意图。图2是本专利技术所使用的用来进行社区网络问答的排序标准学习网络的示意图。具体实施方式下面结合附图和具体实施方式对本专利技术做进一步阐述和说明。如图1所示,本专利技术一种利用一种利用排序标准网络学习解决社区问答任务的方法包括如下步骤:1)针对于一组社交网络用户及其对应回答的问题,利用已有的用户、问题之间的关系及用户之间的相互关系构建包含用户与问题之间相互关系的排序标准异质社区问答网络;2)利用单词映射网络及LSTM网络获取问题的语义表达,利用随机初始化获取用户的映射表达;针对于步骤1)构建的排序标准异质社区问答网络,利用随机游走的方法获取样本路径,之后对于样本路径中的每个点,获取损失函数值,并将损失函数值累加,结合模型中的参数得到最终的损失函数,利用随机梯度下降的方法进行参数更新;经过多次迭代更新获取最终的用户及问题的表达;3)利用步骤2)最终得到的用户及问题的表达对于问题的最佳用户进行预测。所述的步骤1)利用所给的一组社交网络用户及其对应回答的问题,构建排序标准异质社区问答网络,其具体步骤为:对于所给出的用户及其对应回答的问题,依据对于同一个问题,不同的用户回答的相对好坏构建问题与用户之间的相对关系网络,在网络中标出对于此问题回答较好的用户与回答较差的用户。之本文档来自技高网...

【技术保护点】
1.一种利用排序标准网络学习解决社区问答任务的方法,其特征在于包括如下步骤:1)针对于一组社交网络用户及其对应回答的问题,利用已有的用户、问题之间的关系及用户之间的相互关系构建包含用户与问题之间相互关系的排序标准异质社区问答网络;2)利用单词映射网络及LSTM网络获取问题的语义表达,利用随机初始化获取用户的映射表达;针对于步骤1)构建的排序标准异质社区问答网络,利用随机游走的方法获取样本路径,之后对于样本路径中的每个点,获取损失函数值,并将损失函数值累加,结合模型中的参数得到最终的损失函数,利用随机梯度下降的方法进行参数更新;经过多次迭代更新获取最终的用户及问题的表达;3)利用步骤2)最终得到的用户及问题的表达对于问题的最佳用户进行预测。

【技术特征摘要】
1.一种利用排序标准网络学习解决社区问答任务的方法,其特征在于包括如下步骤:1)针对于一组社交网络用户及其对应回答的问题,利用已有的用户、问题之间的关系及用户之间的相互关系构建包含用户与问题之间相互关系的排序标准异质社区问答网络;2)利用单词映射网络及LSTM网络获取问题的语义表达,利用随机初始化获取用户的映射表达;针对于步骤1)构建的排序标准异质社区问答网络,利用随机游走的方法获取样本路径,之后对于样本路径中的每个点,获取损失函数值,并将损失函数值累加,结合模型中的参数得到最终的损失函数,利用随机梯度下降的方法进行参数更新;经过多次迭代更新获取最终的用户及问题的表达;3)利用步骤2)最终得到的用户及问题的表达对于问题的最佳用户进行预测。2.根据权利要求1所述利用排序标准网络学习解决社区问答任务的方法,其特征在于所述的步骤1),其具体步骤为:依据所给出的数据集中,对于同一个问题,不同的用户回答的相对好坏构建问题与用户之间的相对关系网络,在网络中标出对于此问题回答较好的用户与回答较差的用户;之后,依据用户之间的相互关注关系,在构建的网络上添加用户之间相互关注的关系得到包含用户与问题之间相互关系的排序标准异质社区问答网络。3.根据权利要求1所述利用排序标准网络学习解决社区问答任务的方法,其特征在于所述的步骤2)中利用单词映射网络及LSTM网络获取问题的语义表达的具体步骤为:对于所给出的问题,利用如下方法获得每个问题的映射表达:首先利用预训练好的单词映射方法获得问题答案中单词的对应映射,对于问题xi的第t个单词,得到其映射为xit;之后将问题的所有句子的单词映射序列{xi1,...,xin}作为LSTM网络的输入,将所有问题的各个句子的单词全部分别输入LSTM网络之后,进行训练,将问题的每一句话输入LSTM网络后,LSTM网络的最后一层的输出作为问题中每一句话的语义表达,之后在该问题的所有句子的语义表达输出上面增加一最大池化层,将最大池化层的输出作为该问题的语义表达,记为qi。4.根据权利要求1所述利用排序标准网络学习解决社区问答任务的方法,其特征在于所述的步骤2)中,利用随机初始化获取用户的映射表达;针对于步骤1)构建的排序标准异质社区问答网络,利用随机游走的方法获取样本路径,之后对于样本路径中的每个点,获取损失函数值,并将损失函数值累加,结合模型中的参数得...

【专利技术属性】
技术研发人员:赵洲孟令涛高天祥杨启凡蔡登何晓飞庄越挺
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1