文本意图智能分类方法、装置及计算机可读存储介质制造方法及图纸

技术编号:22330144 阅读:30 留言:0更新日期:2019-10-19 12:17
本发明专利技术涉及一种人工智能技术,揭露了一种文本意图智能分类方法,包括:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集,将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集,将所述测试集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练,接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断,并输出判断结果。本发明专利技术还提出一种文本意图智能分类装置以及一种计算机可读存储介质。本发明专利技术可以实现精准的文本意图智能分类功能。

【技术实现步骤摘要】
文本意图智能分类方法、装置及计算机可读存储介质
本专利技术涉及人工智能
,尤其涉及一种可用于智能化的文本意图分类方法、装置及计算机可读存储介质。
技术介绍
目前,各个行业,特别是电商行业,智能回答系统都有了一定程度的普及。但目前的智能回答系统一般使用关键字规则或简单的检索来匹配答案后回答客户的问题,这样的回答方式往往答非所问,智能程度不够高,因此不能很好的解决客户所提出的问题,既浪费客户的时间,也浪费服务器的计算资源,并没有达到减轻人工客服压力的初衷。
技术实现思路
本专利技术提供一种文本意图智能分类方法、装置及计算机可读存储介质,其主要目的在于当用户输入文本数据时,对所述用户输入的文本进行意图判断并输出判断结果。为实现上述目的,本专利技术提供的一种文本意图智能分类方法,包括:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。可选地,所述将所述初级文本集转换为词向量文本集包括:确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。可选地,所述概率模型为:其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。可选地,所述对数似然函数ζ:其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。所述意图识别模型包括卷积神经网络、激活函数、损失函数,其中,所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层;所述步骤C包括:所述卷积神经网络接收所述训练集后,将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集,并将所述降维数据集输入至全连接层;所述全连接层接收所述降维数据集,并结合所述激活函数计算得到训练值集合,并将所述训练值集合和所述标签集输入至所述损失函数中,所述损失函数计算出损失值,判断所述损失值与预设训练阈值的大小关系,直至所述损失值小于所述预设训练阈值时,所述意图识别模型满足所述预设训练要求并退出训练。此外,为实现上述目的,本专利技术还提供一种文本意图智能分类装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的文本意图智能分类程序,所述文本意图智能分类程序被所述处理器执行时实现如下步骤:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集输入至词向量化转换模型中得到词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率,若所述判断准确率小于预设准确率,返回步骤C,若判断准确率大于预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断,并输出判断结果。可选地,所述将所述初级文本集转换为词向量文本集包括:确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。可选地,所述概率模型为:其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。可选地,所述对数似然函数为:其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有文本意图智能分类程序,所述文本意图智能分类程序可被一个或者多个处理器执行,以实现如上所述的文本意图智能分类方法的步骤。将所述初级文本集转换为词向量文本集可以有效的提高对文本特征的采集,增加文本分类的准确率,同时意图识别模型是基于深度学习,可有效的根据所述文本特征识别出文本关键字,并基于关键字进行意图分类,因此本专利技术提出的文本意图智能分类方法、装置及计算机可读存储介质可以实现精准的文本意图智能分类功能。附图说明图1为本专利技术一实施例提供的文本意图智能分类方法的流程示意图;图2为本专利技术一实施例提供的文本意图智能分类装置的内部结构示意图;图3为本专利技术一实施例提供的文本意图智能分类装置中文本意图智能分类程序的模块示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本专利技术提供一种文本意图智能分类方法。参照图1所示,为本专利技术一实施例提供的文本意图智能分类方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。在本实施例中,文本意图智能分类方法包括:S1、接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集。较佳地,所述原始文本集包括各种通过文字记录下的问题,如问题A:“什么时候发货”、问题B:“为什么还没有物流信息”、问题C:“双十一是否会降价”、问题D:“近期价格是否会发生变化?”等之类的问题。进一步地,所述标签集记录所述原始文本集内各种问题的分类结果,如问题A:“什么时候发货”和问题B:“为什么还没有物流信息”在所述标签集中被记录为“发货咨询”;问题C:“双十一是否会降价”和问题D:“近期价格是否会发生变化?”在所述标签集中被记录为“价格变动咨询”。本专利技术较佳实施例,所述停用词包括那个、这个、哎呀、比如、吧、但是等,所述标点符号包括句号、逗号、问好等。进一步地,本专利技术通过制作中文停用词表和中文标点符号表,通过比对所述原始文本集与本文档来自技高网...

【技术保护点】
1.一种文本意图智能分类方法,其特征在于,所述方法包括:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。

【技术特征摘要】
1.一种文本意图智能分类方法,其特征在于,所述方法包括:步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。2.如权利要求1所述的文本意图智能分类方法,其特征在于,所述将所述初级文本集转换为词向量文本集包括:确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。3.如权利要求2所述的文本意图智能分类方法,其特征在于,所述概率模型为:其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。4.如权利要求3中的文本意图智能分类方法,其特征在于,所述对数似然函数为:其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。5.如权利要求1至4任意一项所述的文本意图智能分类方法,其特征在于,所述意图识别模型包括卷积神经网络、激活函数、损失函数,其中,所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层;所述步骤C包括:所述卷积神经网络接收所述训练集后,将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集,并将所述降维数据集输入至全连接层;所述全连接层接收所述降维数据集,并结合所述激活函数计算得到训练值集合,并将所述训练值集合和所述标签集输入至所述损失函数中,所述...

【专利技术属性】
技术研发人员:王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1