【技术实现步骤摘要】
一种计算机问答系统中的问句分类方法
本专利技术涉及自然语言智能问答
,特别涉及一种计算机问答系统中的问句分类方法。
技术介绍
聊天机器人、语音助手、自动客服等为人们的生活极大的便利的同时,也节约了一些行业的人力成本,是当前自然语言处理研究的热点。这些应用的成功不仅取决于语音内容的识别,更在于对句子含义的理解,称之为意图识别。意图识别旨在确定用户对话的意图,可以看成分类问题。事先在该领域在该领域定义各种可能的意图,再用分类方法将问句分到某类意图中,交给对话管理或任务管理器,就可以完成用户的需求或者生成相应领域的回应。相关问题在搜索引擎、智能问答等场景下有广泛的应用。意图识别,也就是意图分类,是一个典型的文本分类问题,所有传统的分类方法都可以使用,比如SVM,最大熵等,或者用一些深度学习的模型,如RNN(RecurrentNeuralNetwork)循环神经网络、CNN卷积神经网络(ConvolutionalNeuralNetworks,CNN)等。这类分类方法的一般步骤是,获取或者构造一批问句数据,对每条数据的意图进行标注,选取特定的算法进行训练,挖掘用户问句中隐含的特征,通过训练好的模型进行分类。然而,大部分的意图分类只是基于用户当前对话的,但在真实场景中,用户的问句在上下文或者环境背景下提出的。比如“明天呢?”,若前句问题是“今天还有没有去北京的高铁票”,那么用户意图是车票查询,若前句是“今天北京的天气怎么样”,那么用户意图是天气查询,比如用户想购买一件外套,根据气候和所处位置,有可能是一件夹克,也有可能是一件棉服;有时候一些词语本身就有歧义,如用 ...
【技术保护点】
1.一种计算机问答系统中的问句分类方法,其特征在于,包括以下步骤:步骤1,构建用于对问句进行分类的用户情境模型;步骤2,基于用户情境模型,获取用户的情境信息数据;步骤3,获取待分类的问句,并基于用户的情境信息数据,构建基于注意力机制的问题意图预测网络;步骤4,训练模型,并对问句进行分类预测。
【技术特征摘要】
1.一种计算机问答系统中的问句分类方法,其特征在于,包括以下步骤:步骤1,构建用于对问句进行分类的用户情境模型;步骤2,基于用户情境模型,获取用户的情境信息数据;步骤3,获取待分类的问句,并基于用户的情境信息数据,构建基于注意力机制的问题意图预测网络;步骤4,训练模型,并对问句进行分类预测。2.如权利要求1所述的方法,其特征在于,步骤1中所述的构建用户情境模型,是指根据问答系统需要定义的情境属性构建完整的情境信息描述,一组完整的情境信息ContextInfo需要从三个维度Y、H、E进行描述,表示如下:ContextInfo=<Y、H、E>其中,每个维度的含义如下:Y表示用户情境信息;H表示历史情境信息;E表示环境情境信息;所述用户情境信息是指用户的基本信息与行为偏好,包括性别、年龄段、职业和领域偏好;所述历史情境信息是指用户最近三轮对话中用户关注的意图领域;所述环境情境信息是指用户所在的区域、温度、时间;每个情境信息都用一个属性词表示,即最终情境信息的表示由10个词语组成。3.如权利要求2所述的方法,其特征在于,步骤3中,所述基于注意力机制的问题意图预测网络包含文本嵌入层、情境注意力层、模型层和输出层;其中,文本嵌入层用于将问题与情境中的每个词映射到高维向量空间;情境注意力层用于将情境信息嵌入问题,形成考虑情境的问题分布式表示G;模型层用于,使用G作为输入,采用双向LSTM,生成隐状态序列,获得输出矩阵M;输出层用于预测用户意图各分类的概率分布p。4.如权利要求3所述的方法,其特征在于,所述文本嵌入层用于将问题与情境中的每个词映射到高维向量空间,具体包括:获取待分类的问句,问句中包括问题,使用GloVe预训练的词向量来获取问题与情境中每个词的向量表示,得到两个d维的向量序列,即两个矩阵:问题矩阵Q∈Rd×T和情境矩阵C∈Rd×j,其中d取正整数,T与j分别表示问题中词的个数和情境中词的个数,R为实数;将表示结果Q和C输入到双向LSTM来建模词与词之间的时序交互,分别生成问题对应的隐状态向量序列H∈R2d×T和情境对应的隐状态向量序列U∈R2d×j;双向的LSTM进行拼接后,输出的隐状态向量序列H和U的维度变为输入的两倍,即2d。5.如权利要求4所述的方法,其特征在于,所述情境注意力层用于将情境信息嵌入问题,形成考虑情境的问题分布式表示,即情境到问题的注意力G,具体包括:步骤a1,通过关于问题对应的隐状态向量序列H和情境对应的隐状态向量序列U的相似度矩阵S∈Rt×j计算得到情境到问题的注意力G,相似度矩阵S的第t行第j列的元素为Stj,Stj表示问题中第t个词和情境中第j个词的相似度,Stj的计算公式为:Stj=α(H:t,U:j),其中,α是一个能够训练的标量函数,α的作用是对输入的两个向量衡量它们之间的相似度,H:t是H中的第t个列向量,U:j是U中的第j个列向量,采用如下公式计算两个输入的向量h和u的相似度α(h,u):通过上式即能够得到H:t和U:j的相似度...
【专利技术属性】
技术研发人员:吴振锋,荀智德,陆辰,葛唯益,贺成龙,王振宇,
申请(专利权)人:中国电子科技集团公司第二十八研究所,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。