【技术实现步骤摘要】
文本意图智能分类方法、装置及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种可用于智能化的文本意图分类方法、装置及计算机可读存储介质。
技术介绍
目前,各个行业,特别是电商行业,智能回答系统都有了一定程度的普及。但目前的智能回答系统一般使用关键字规则或简单的检索来匹配答案后回答客户的问题,这样的回答方式往往答非所问,智能程度不够高,因此不能很好的解决客户所提出的问题,既浪费客户的时间,也浪费服务器的计算资源,并没有达到减轻人工客服压力的初衷。
技术实现思路
本专利技术提供一种文本意图智能分类方法、装置及计算机可读存储介质,其主要目的在于当用户输入文本数据时,对所述用户输入的文本进行意图判断并输出判断结果。为实现上述目的,本专利技术提供的一种文本意图智能分类方法,包括:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。可选地,所述将所述初级文本集转换为词向量文本集包括:确定所述初级文 ...
【技术保护点】
1.一种文本意图智能分类方法,其特征在于,所述方法包括:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。
【技术特征摘要】
1.一种文本意图智能分类方法,其特征在于,所述方法包括:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。2.如权利要求1所述的文本意图智能分类方法,其特征在于,所述将所述初级文本集转换为词向量文本集包括:确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。3.如权利要求2所述的文本意图智能分类方法,其特征在于,所述概率模型为:其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。4.如权利要求3中的文本意图智能分类方法,其特征在于,所述对数似然函数为:其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。5.如权利要求1至4任意一项所述的文本意图智能分类方法,其特征在于,所述意图识别模型包括卷积神经网络、激活函数、损失函数,其中,所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层;所述步骤C包括:所述卷积神经网络接收所述训练集后,将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集,并将所述降维数据集输入至全连接层;所述全连接层接收所述降维数据集,并结合所述激活函数计算得到训练值集合,并将所述训练值集合和所述标签集输入至所述损失函数中,所述...
【专利技术属性】
技术研发人员:王健宗,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。