一种意图识别模型生成方法、装置、设备及存储介质制造方法及图纸

技术编号:35500296 阅读:12 留言:0更新日期:2022-11-09 14:09
本申请公开了一种意图识别模型生成方法、装置、设备及存储介质。该方法的步骤包括:获取样本语句和与样本语句对应的样本意图;确定样本语句的词特征序列以及词共现关系;基于词共现关系、词特征序列以及样本意图训练得到意图识别模型。意图识别模型能够根据待识别语句中所出现的每个词与其它各词之间的关联性,综合分析待识别语句的语句意图,进而能够进一步确保意图识别模型对于语句意图分析的准确性。此外,本申请还提供一种意图识别模型生成装置、设备及存储介质,有益效果同上所述。有益效果同上所述。有益效果同上所述。

【技术实现步骤摘要】
一种意图识别模型生成方法、装置、设备及存储介质


[0001]本申请涉及机器学习领域,特别是涉及一种意图识别模型生成方法、装置、设备及存储介质。

技术介绍

[0002]在包括电商场景在内的网络业务平台场景中,智能客服可以随时根据用户发起的问题向用户提供答复,具有高效的工作效率,并且能够为用户提供优质的服务质量、标准化的服务流程,因此智能客服扮演着越发重要的角色。
[0003]语句意图识别是智能客服系统中的核心技术,精确的理解用户意图能够有效地提高用户对智能客服系统的体验。目前语句意图识别主要基于机器学习模型的方法实现,但是当前基于机器学习模型进行语句意图识别时,仅根据语句中相邻词与词之间的序列信息分析语句意图,并没有考虑到间隔较远的词之间的关联性,因此难以确保语句意图分析的准确性。
[0004]由此可见,提供一种意图识别模型生成方法,以相对确保意图识别模型对语句意图分析的准确性,是本领域技术人员需要解决的问题。

技术实现思路

[0005]本申请的目的是提供一种意图识别模型生成方法、装置、设备及存储介质,以相对确保意图识别模型对语句意图分析的准确性。
[0006]为解决上述技术问题,本申请提供一种意图识别模型生成方法,包括:
[0007]获取样本语句和与样本语句对应的样本意图;
[0008]确定样本语句的词特征序列以及词共现关系;
[0009]基于词共现关系、词特征序列以及样本意图训练得到意图识别模型。
[0010]优选地,确定样本语句的词特征序列以及词共现关系,包括:
[0011]对样本语句执行分词操作得到词序列;
[0012]基于词序列生成词特征序列以及词共现关系。
[0013]优选地,基于词序列生成词共现关系,包括:
[0014]基于滑动窗口算法获取词序列在各窗口滑动时刻下,同时处于窗口内的目标词元素;
[0015]建立各窗口滑动时刻下相应目标词元素之间的词共现关系。
[0016]优选地,基于词序列生成词特征序列,包括:
[0017]基于语言模型对词序列中的词元素执行特征提取得到词特征序列。
[0018]优选地,获取样本语句和与样本语句对应的样本意图,包括:
[0019]提取样本语句集合中的各样本语句;
[0020]对各样本语句执行分词操作得到相应的词序列;
[0021]基于各样本语句生成的词序列生成相应的待聚类词特征序列;
[0022]将相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合;
[0023]将对应相同聚类集合的样本语句标注相同的样本意图。
[0024]优选地,在将相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合之前,方法还包括:
[0025]统计待聚类词特征序列的特征累加和;
[0026]将相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合,包括:
[0027]将特征累加和的相似度达到预设阈值的待聚类词特征序列划分至相同的聚类集合。
[0028]优选地,基于词共现关系、词特征序列以及样本意图训练得到意图识别模型,包括:
[0029]基于词共现关系对应的邻接矩阵、词特征序列以及样本意图对门控图神经网络模型进行训练,得到意图识别模型。
[0030]此外,本申请还提供一种语句意图识别方法,包括:
[0031]获取待识别语句;
[0032]通过意图识别模型对待识别语句进行意图识别操作,得到意图识别结果;其中,意图识别模型基于样本语句的词共现关系、词特征序列以及与样本语句对应的样本意图训练生成。
[0033]优选地,意图识别模型基于样本语句的词共现关系、词特征序列以及与样本语句对应的样本意图训练生成,包括:
[0034]意图识别模型基于样本语句的词共现关系转化得到的邻接矩阵、样本语句的词特征序列以及与样本语句对应的样本意图,对门控图神经网络模型进行训练生成。
[0035]优选地,词共现关系基于滑动窗口算法对词序列进行提取生成;其中,词序列通过对样本语句执行分词操作得到。
[0036]优选地,词特征序列基于语言模型对词序列进行转化生成;其中,词序列通过对样本语句执行分词操作得到。
[0037]此外,本申请还提供一种意图识别模型生成装置,包括:
[0038]语句意图获取模块,用于获取样本语句和与样本语句对应的样本意图;
[0039]特征关系确定模块,用于确定样本语句的词特征序列以及词共现关系;
[0040]模型训练模块,用于基于词共现关系、词特征序列以及样本意图训练得到意图识别模型。
[0041]此外,本申请还提供一种语句意图识别装置,包括:
[0042]待识别获取模块,用于获取待识别语句;
[0043]模型识别模块,用于通过意图识别模型对待识别语句进行意图识别操作,得到意图识别结果;其中,意图识别模型基于样本语句的词特征序列、词共现关系以及与样本语句对应的样本意图训练生成。
[0044]此外,本申请还提供一种计算机设备,包括:
[0045]存储器,用于存储计算机程序;
[0046]处理器,用于执行计算机程序时实现如上述的意图识别模型生成方法的步骤和/或实现如上述的语句意图识别方法的步骤。
[0047]此外,本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的意图识别模型生成方法的步骤和/或实现如上述的语句意图识别方法的步骤。
[0048]本申请所提供的意图识别模型生成方法,首先获取样本语句和与样本语句对应的样本意图,并确定样本语句的词特征序列以及词共现关系,进而基于词共现关系、词特征序列以及样本意图训练得到意图识别模型。由于意图识别模型是基于样本语句的词特征序列、词共现关系以及样本意图训练生成,而词共现关系能够表征语句中的每个词与该语句中其它词之间的关联关系,不同词之间相关联后往往具有相应的语句意图,因此意图识别模型能够根据待识别语句中所出现的每个词与其它各词之间的关联性,综合分析待识别语句的语句意图,进而能够进一步确保意图识别模型对于语句意图分析的准确性。此外,本申请还提供一种意图识别模型生成装置、设备及存储介质,有益效果同上所述。
附图说明
[0049]为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0050]图1为本申请实施例公开的一种意图识别模型生成方法的流程图;
[0051]图2为本申请实施例公开的一种意图识别模型生成方法的流程图;
[0052]图3为本申请实施例提供的一种意图识别模型生成的示意图;
[0053]图4为本申请实施例公开的另一种意图识别模型生成方法的流程图本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种意图识别模型生成方法,其特征在于,包括:获取样本语句和与所述样本语句对应的样本意图;确定所述样本语句的词特征序列以及词共现关系;基于所述词共现关系、所述词特征序列以及所述样本意图训练得到意图识别模型。2.根据权利要求1所述的意图识别模型生成方法,其特征在于,所述确定所述样本语句的词特征序列以及词共现关系,包括:对所述样本语句执行分词操作得到词序列;基于所述词序列生成所述词特征序列以及所述词共现关系。3.根据权利要求2所述的意图识别模型生成方法,其特征在于,基于所述词序列生成所述词共现关系,包括:基于滑动窗口算法获取所述词序列在各窗口滑动时刻下,同时处于窗口内的目标词元素;建立各所述窗口滑动时刻下相应目标词元素之间的所述词共现关系。4.根据权利要求2所述的意图识别模型生成方法,其特征在于,基于所述词序列生成所述词特征序列,包括:基于语言模型对所述词序列中的词元素执行特征提取得到所述词特征序列。5.根据权利要求1所述的意图识别模型生成方法,其特征在于,所述获取样本语句和与所述样本语句对应的样本意图,包括:提取所述样本语句集合中的各所述样本语句;对所述各所述样本语句执行分词操作得到相应的词序列;基于各所述样本语句生成的词序列生成相应的待聚类词特征序列;将相似度达到预设阈值的所述待聚类词特征序列划分至相同的聚类集合;将对应相同所述聚类集合的所述样本语句标注相同的所述样本意图。6.根据权利要求5所述的意图识别模型生成方法,其特征在于,在所述将相似度达到预设阈值的所述待聚类词特征序列划分至相同的聚类集合之前,所述方法还包括:统计所述待聚类词特征序列的特征累加和;所述将相似度达到预设阈值的所述待聚类词特征序列划分至相同的聚类集合,包括:将所述特征累加和的相似度达到预设阈值的所述待聚类词特征序列划分至相同的所述聚类集合。7.根据权利要求1至6任意一项所述的意图识别模型生成方法,其特征在于,所述基于所述词共现关系、所述词特征序列以及所述样本意图训练得到意图识别模型,包括:基于所述词共现关系对应的邻接矩阵、所述词特征序列以及所述样本意图对门控图神经网络模型进行训练,得到所述意图识别模型。8.一种语句意图识别方法,其特征在于,包括...

【专利技术属性】
技术研发人员:乐雨泉赵宇明陈蒙
申请(专利权)人:京东科技控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1