意图识别模型训练方法和对话方法及装置制造方法及图纸

技术编号:35585964 阅读:30 留言:0更新日期:2022-11-16 15:00
本发明专利技术实施例提供了一种意图识别模型训练方法和对话方法及装置,所述意图识别模型训练方法包括:获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练;其中一个上位概念实体信息对应同一类型的不同原始实体信息。从而可以使对话程序能够对没有训练过的实体信息进行意图识别,提高意图识别准确率和与用户交互的鲁棒性。用户交互的鲁棒性。用户交互的鲁棒性。

【技术实现步骤摘要】
意图识别模型训练方法和对话方法及装置


[0001]本专利技术涉及机器学习
,尤指一种意图识别模型训练方法和对话方法及装置。

技术介绍

[0002]智能语音对话系统是通过语音实时地与人类进行智能对话的系统。智能语音对话系统是语音识别、自然语言理解、对话管理、自然语言生成以及语音合成技术的集大成者,是语音识别技术走向实用阶段的一个重要研究领域。语音交互式的智能对话系统可以让用户通过自然语言直接发问,系统可以返回精确的答案,给用户更加智能的用户体验。
[0003]在智能语音对话系统中,目前的技术难点在于如何准确地识别用户提问的信息中所包含的意图信息。传统的意图识别算法直接从提问信息中提取实体信息来确定意图信息。但是若使用智能语音对话系统时,从用户提问信息中提取的实体信息没有在对系统中的模型的训练过程中训练过,将会导致意图识别准确率不高,与用户交互的鲁棒性较差的问题。

技术实现思路

[0004]本专利技术实施例提供一种意图识别模型训练方法和对话方法及装置,用以解决现有技术中存在的对话系统的模型对没有训练过的实体信息的意图识本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种意图识别模型训练方法,其特征在于,包括:获取训练数据,所述训练数据包括原始提问文本信息及对应的意图信息;将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息;利用所述转化文本信息和对应的所述意图信息对意图识别模型进行训练,直至满足训练结束条件时结束训练;其中一个上位概念实体信息对应同一类型的不同原始实体信息。2.如权利要求1所述的方法,其特征在于,根据所述训练数据中相同意图信息对应的原始提问文本信息,提取出能够表征意图信息的摘要文本信息,作为所述意图信息对应的提问模板;或者,对表征意图信息的不同自然语言文本信息进行语法分析,去除与意图表征无关的实体信息得到摘要文本信息,对所述摘要文本信息中的词语进行同义词替换,变换所述文本信息的句式,得到所述意图信息对应的提问模板。3.如权利要求1所述的方法,其特征在于,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,包括:使用人工智能标记语言AIML模板匹配算法,将所述原始提问文本信息与不同的提问模板进行匹配,确定与所述原始提问文本信息相匹配的目标提问模板;将所述原始提问文本信息中的原始实体信息转化为上位概念实体信息,得到转化文本信息。4.如权利要求3所述的方法,其特征在于,将所述原始提问文本信息中除目标提问模板外的原始实体信息转化为对应的上位概念实体信息,并与所述目标提问模板组合得到转化文本信息,包括:确定所述原始提问文本信息除目标提问模板外的原始实体信息,解析所述原始实体信息在所述原始提问文本信息中的语句成分;使用AIML模板匹配算法,从预设的数据库中或互联网中查找所述原始实体信息对应的所述上位概念实体信息;根据所述语句成分,将所述上位概念实体信息与所述目标提问模板组合,得到转化文本信息,所述语句成分包括主语和/或宾语。5.如权利要求1所述的方法,其特征在于,将所述原始提问文本信息与不同的提问模板进行匹配,包括:使用模糊匹配算法,将所述原始提问文本...

【专利技术属性】
技术研发人员:蒋鹏民王彦芳杜兆臣王月岭高雪松陈维强
申请(专利权)人:海信集团控股股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1