【技术实现步骤摘要】
多意图识别模型训练方法和多意图识别方法及相关装置
本专利技术涉及计算机数据处理
,具体涉及一种多意图识别模型训练方法和多意图识别方法及相关装置。
技术介绍
在现有的对话系统中,存在许多非标准语言表达形式的句子,如句法的结构比较简单,大多是短句和省略形式,对话的内容很难在单轮对话中交代清楚,意图通常隐含在多轮对话中。通过多轮对话可以收集更多的语义信息,更准确的识别出提问者的意图。在实际应用场景中,无论是语音识别还是人的语言表述都是非精确的,这无形之中大大增加了机器人对用户的意图理解难度。如何正确识别提问者的意图,一直以来都是多轮对话系统研究的重点之一。早期的意图识别方法是将其视为语义话语分类问题,主要包括基于规则(rule-based)模板的方法、使用统计特征的方法以及基于机器学习分类算法的方法。基于规则模板的方法,通常针对于一些非常相似的句子,并且这些句子符合一定的规则。它需要人为地构建规则模板和类别信息,即哪些关键字对应于哪个意图。然后,通过规则模板解析的方式来确定提问者的意图。基于统计特征的方法,是使用意图 ...
【技术保护点】
1.一种多意图识别模型训练方法,其特征在于,包括:/n编码步骤:对训练数据进行编码,得到训练数据中的每条对话文本的编码向量,并计算每条对话文本的带有上下文相关的语境信息的特征向量;/n控制步骤:针对每一条对话文本,判断是否需要引入上下文相关的语境信息;/n分类训练步骤:针对每一条对话文本,若控制步骤判断为是,则将该条对话文本的编码向量及其带有上下文相关的语境信息的特征向量结合后输入分类器;否则,直接将该条对话文本的编码向量输入分类器;通过分类器训练,得到用于对对话文本的意图进行分类识别的多标签分类模型。/n
【技术特征摘要】
1.一种多意图识别模型训练方法,其特征在于,包括:
编码步骤:对训练数据进行编码,得到训练数据中的每条对话文本的编码向量,并计算每条对话文本的带有上下文相关的语境信息的特征向量;
控制步骤:针对每一条对话文本,判断是否需要引入上下文相关的语境信息;
分类训练步骤:针对每一条对话文本,若控制步骤判断为是,则将该条对话文本的编码向量及其带有上下文相关的语境信息的特征向量结合后输入分类器;否则,直接将该条对话文本的编码向量输入分类器;通过分类器训练,得到用于对对话文本的意图进行分类识别的多标签分类模型。
2.根据权利要求1所述的方法,其特征在于,
所述编码步骤具体包括:采用深度学习预训练模型对训练数据进行编码,得到训练数据中的每条对话文本的编码向量VQ3,以及,对于每条对话文本,使用一个滑动窗口获取包括该条对话文本在内的多轮对文文本,将滑动窗口内所有对话文本的编码向量加权求和,得到该条对话文本的带有上下文相关的语境信息的特征向量,记为VH。
3.根据权利要求2所述的方法,其特征在于,
所述控制步骤具体包括:针对每一条对话文本,根据该条对话文本的编码向量VQ3及其带有上下文相关的语境信息的特征向量VH进行状态值计算,计算公式为:S=sigmoid(WS*[VQ3,VH]),其中,WS为经验参数;根据状态值S是否超过预设值,判断是否需要引入上下文相关的语境信息。
4.根据权利要求2所述的方法,其特征在于,在所述分类训练步骤中,所述将该条对话文本的编码向量及其带有上下文相关的语境信息的特征向量结合后输入分类器,包括:
使用下述的sigmoid函数对该条对话文本的编码向量VQ3及其带有上下文相关的语境信息的特征向量VH进行结合,E=sigmoid(WE*[VQ3+SVH]),其中,WE为经验参数,将结合得到特征向量E输入分类器。
5.根据权利要求1-4任一所述的方法,其特征在于,还包括获得验证集中每个意图的得分的步骤,该步骤具体包括:
利用训练得到的多标签分类模型对验证集中的每一条对话文本进行测试,输出预测标签向量,并采用目标函数计算该预测标签向量和目标标签向量之间相似度的得分,从而得到验证集中每个意图的得分,该得分介于0到1之间。
6.根据权利要求5所述的方法,其特征在于,还包括确定验证集中每个意图的得分的最佳阈值的步骤,该步骤具体包括:
S1:设定一个初始阈值为threshold=0.01,选择验证集中的一个意图并计算该意图在整个验证集上的F1分数;
S2:判断阈值threshold是否在(0,1)之间,若是,则更新该意图阈值为:threshold=threshold+0.01,然后计算该意图的F1分数,并与上一个F1分数比较大小,记录最大的F1分数以及其对应的阈值;若否,则进入...
【专利技术属性】
技术研发人员:黄石磊,张剑,
申请(专利权)人:深圳市北科瑞声科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。