【技术实现步骤摘要】
面向社区问答的问题分类方法及系统
本专利技术属于自然语言处理与智能问答应用领域,具体涉及一种面向社区问答的问题分类方法及系统。
技术介绍
问答(QuestionAnswering,QA)系统起源于图灵测试,随着时间的发展,问答系统领域也发生了重大变革。按照处理的数据格式不同,问答系统分别经历了结构化知识库阶段、无结构文本阶段、基于问题.答案数据阶段。随着互联网的普及,网上出现了大量的文本和各种大型论坛,这为智能问答系统的兴起奠定了基础。在问答系统中,问题分类逐渐成了问答系统的一个重要研究分支。在早期,一些问题分类的方法主要在特定领域下采用模板或者规则来对问题进行分类,如依照一些特定的疑问词使用模板进行匹配,在一些问题分类任务上取得了一定的成果。除此之外,Yu等人通过半监督学习来进行问题分类,在数据集中协同使用未标注和已标注的数据,通过词间的语义相似性作为特征分类,实验结果得到较大的提高。Xu等人基于朴素贝叶斯来使用汉语依存语法提取问题文本的句法特征进行问题分类,有效提高了问题分类的精度。深度学习理论在答案抽取和排序任务上也有一定应用。Zhou等人将输入序列先输入CNN后,在输入LSTM来得问题句子的表征向量,输入到softmax中进行问题分类。,Wang等人则先使用LSTM来得到输入问题文本序列的隐藏序列,在利用CNN模型来得到最终的表征向量,最后进行问题分类。传统CQA系统使用有监督学习,训练问题分类模型,但该方法需要抽取复杂的文本特征,特征工程需要较多的工程经验,很难在特征构造上做到最优, ...
【技术保护点】
1.一种面向社区问答的问题分类方法,其特征在于,包括以下步骤:/n步骤A:采集网络问答社区中用户所提问题以及对应的问题类别,构建问题分类训练集TS;/n步骤B:对问题分类训练集TS中的问题进行字符级编码和词语级编码,得到问题的表征向量,以此训练基于双通道神经网络的深度学习网络模型;/n步骤C:问题分类系统接受用户提交的问题,将问题输入到训练好的深度学习网络模型中,输出模型划分的问题所述类别。/n
【技术特征摘要】
1.一种面向社区问答的问题分类方法,其特征在于,包括以下步骤:
步骤A:采集网络问答社区中用户所提问题以及对应的问题类别,构建问题分类训练集TS;
步骤B:对问题分类训练集TS中的问题进行字符级编码和词语级编码,得到问题的表征向量,以此训练基于双通道神经网络的深度学习网络模型;
步骤C:问题分类系统接受用户提交的问题,将问题输入到训练好的深度学习网络模型中,输出模型划分的问题所述类别。
2.根据权利要求1所述的面向社区问答的问题分类方法,其特征在于,所述步骤B具体包括以下步骤:
步骤B1:遍历问题分类训练集TS,TS中的每个训练样本表示为(q,y),其中q表示问题,y=c∈C表示问题q所属的问题类别,C={1,2,...,L}为问题类别集合,1≤c≤L,L表示问题类别数;将问题q输入深度学习网络模型的字符级编码模块,得到问题q的字符向量序列
步骤B2:将问题q的字符向量序列输入深度学习网络模型的双层Bi-LSTM网络模块,再输入注意力模块,得到问题q的表征向量
步骤B3:将问题q输入深度学习网络模型的词语级编码模块,得到问题q的词语级表征向量
步骤B4:将问题q的词语级表征向量输入到深度学习网络模型的带shortcut连接的卷积神经网络中,得到问题q的表征向量
步骤B5:将问题q的表征向量与输入全连接层进行融合,得到问题q的最终表征向量将输入到Softmax层中,计算问题q属于各个问题类别的概率选择作为预测的问题类别;
步骤B6:根据目标损失函数loss,利用反向传播方法计算深度学习网络模型中各参数的梯度,并利用随机梯度下降方法更新参数,以此训练深度学习网络模型;
步骤B7:当深度学习网络模型的损失值迭代变化小于设定阈值或者达到最大迭代次数时,则终止深度学习网络模型的训练。
3.根据权利要求2所述的面向社区问答的问题分类方法,其特征在于,所述步骤B1具体包括以下步骤:
步骤B11:对问题q进行分词处理,并去除停用词,得到问题q的词序列q={w1,w2,...,wk},其中wi,i=1,2,...,k为分词及去除停用词后的问题q中的第i个词,k为分词及去除停用词后的问题q中的词语数,其中ci,j,j=1,2,...,ni为构成wi的第j个字符,ni为wi中的字符数;
步骤B12:对问题q的词序列q={w1,w2,...,wk}中的每个词wi进行字符级编码,wi的字符序列为则wi的字符向量序列为其中为ci,j的字符向量,在预训练的字符向量矩阵中查询得到,其中d1表示字符向量的维度,|V1|表示字符向量矩阵E1中的字符总数;则问题q的字符向量序列为
4.根据权利要求3所述的面向社区问答的问题分类方法,其特征在于,所述步骤B2具体包括以下步骤:
步骤B21:遍历问题q的每个词wi,将其字符向量序列输入第一层Bi-LSTM网络,得到wi的隐藏状态序列取作为wi的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。