【技术实现步骤摘要】
基于人工智能的语义识别方法、装置和语义识别设备
本申请涉及人工智能中的语义识别
,特别涉及基于人工智能的语义识别方法、装置和语义识别设备。
技术介绍
人机对话系统是新一代的人机交互界面,Bot平台是一种模型训练平台,Bot平台为开发人员提供了一个快速能力构建的平台,支持诸如三方业务方快速构建对话的技能,用于其业务功能的交互触发。Bot平台为开发人员提供一键触发按钮可自动训练开发人员配置的技能模型。当开发人员重新训练模型时,重新训练获得的模型与之前训练获得的模型可能不一致,导致置信度波动较大,具体可以表现为上一次可以识别的语料在重新训练获得的模型下不能识别,或之前训练获得的模型无法识别的语料在重新训练获得的模型上可以识别。精心调整的语料,准确率和/或召回率等指标会有大幅波动不满足预期,这种重新训练模型导致的不稳定性最终会影响开发人员的体验。
技术实现思路
本申请提供了一种基于人工智能的语义识别方法、装置和语义识别设备,本申请还提供一种计算机可读存储介质,以实现在训练语料无添加、删除或修改的情况下,可以 ...
【技术保护点】
1.一种基于人工智能的语义识别方法,其特征在于,包括:/n获取用户输入的查询语句;/n通过预先训练的语义识别模型对所述查询语句进行识别,获得所述查询语句的意图;其中,所述预先训练的语义识别模型是利用训练语料和负向语料训练的,所述负向语料是根据所述训练语料的编码值映射到负向语料集合中抽取的;/n根据所述查询语句和所述查询语句的意图,获得所述查询语句对应的响应;/n显示所述查询语句对应的响应。/n
【技术特征摘要】
1.一种基于人工智能的语义识别方法,其特征在于,包括:
获取用户输入的查询语句;
通过预先训练的语义识别模型对所述查询语句进行识别,获得所述查询语句的意图;其中,所述预先训练的语义识别模型是利用训练语料和负向语料训练的,所述负向语料是根据所述训练语料的编码值映射到负向语料集合中抽取的;
根据所述查询语句和所述查询语句的意图,获得所述查询语句对应的响应;
显示所述查询语句对应的响应。
2.根据权利要求1所述的方法,其特征在于,所述获取用户输入的查询语句包括:
获取用户通过文本输入的查询语句;或者,
获取用户通过语音输入的查询语句;或者,
获取用户输入的图片,对所述图片进行识别,获取所述图片中包括的查询语句。
3.根据权利要求1或2所述的方法,其特征在于,所述语义识别模型的训练过程包括:
根据需要抽取的负向语料的数量,对训练语料进行分组;
对每组训练语料进行编码,获得每组训练语料的编码值;
根据所述编码值抽取第一类型的负向语料和第二类型的负向语料;
利用所述训练语料、所述第一类型的负向语料和所述第二类型的负向语料进行训练,获得所述语义识别模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述编码值抽取第一类型的负向语料包括:
获取第一负向语料集合中所包括的第一类型的负向语料的第一数量;
根据所述每组训练语料的编码值和所述第一数量,获得所述第一类型的负向语料的第一采样值;
根据所述第一采样值从所述第一负向语料集合中抽取第一类型的第一负向语料。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一采样值从所述第一负向语料集合中抽取第一类型的第一负向语料之后,还包括:
计算所述第一负向语料与所述训练语料的第一相似度;
如果所述第一相似度小于第一相似度阈值,则确定第一负向语料采样成功,将所述第一负向语料加入采样语料集合。
6.根据权利要求5所述的方法,其特征在于,所述计算所述第一负向语料与所述训练语料的第一相似度之后,还包括:
如果所述第一相似度大于或等于第一相似度阈值,则根据所述第一采样值,获得第二采样值;
根据所述第二采样值,从所述第一负向语料集合中抽取第一类型的第二负向语料;
计算所述第二负向语料与所述训练语料的第二相似度;
如果所述第二相似度小于第一相似度阈值,则确定所述第二负向语料采样成功,将所述第二负向语料加入所述采样语料集合。
7.根据权利要求6所述的方法,其特征在于,所述计算所述第二负向语料与所述训练语料的第二相似度之后,还包括:
如果所述第二相似度大于或等于第一相似度阈值,则重复执行所述根据所述第一采样值,获得第二采样值的步骤及后续步骤;
当重复执行的次数大于预先设定的重复次数阈值时,如果当前采样获得的负向语料与所述训练语料的相似度小于第二相似度阈值,则确定当前采样获得的负向语料采样成功,将当前采样获得的负向语料加入所述采样语料集合;如果当前采样获得的负向语料与所述训练语料的相似度大于或等于第二相似度阈值,则将上一次采样成功的负向语料再次加入所述采样语料集合。
8.根据权利要求3所述的方法,其特征在于,所述根据所述编码值抽取第二类型的负向语料包括:
从所述编码值中按顺序获取每M个编码值;
从获取的每M个编码值中选择第二数量的编码值;
根据所述第二数量的编码值从第二负向语料集合中抽取第二类型的负向语料;
对所述编码值进行排序;
从所述排序后的编码值中按顺序获取每N个编码值;
从获取的每N个编码值中选择第三数量的编码值;
根据所述第三数量的编码值从第二负向语料集合中抽取第二类型的负向语料;其中,M,N为正整数,M≠N。
9.根据权利要求3所述的方法,其特征在于,所述根据所述编码值抽取第一类型的负向语料和第二类型的负向语料包括:
根据所述每组训练语料的编码值和预先学习的映射关系,获得所述第一类型的负向语料的第三采样值和第二类型的负向语料的第四采样值;
根据所述第三采样值从所述第一负向语料集合中抽取第一类型的负向语料,并根据所述第四采样值从所述第二负向语料集合中抽取第二类型的负向语料。
10.根据权利要求9所述的方法,其特征在于,所述根据所述每组训练语料的编码值和预先学习的映射关系,获得所述第一类型的负向语料的第三采样值和第二类型的负向语料的第四采样值之前,还包括:
获取训练样本对,所述训练样本对包括训练语料的编码值和对应的负向语料的采样值;其中,所述训练语料对应的负向语料的采样值之间的距离满足预先设定的约束距离;
利用所述训练样本对进行映射关系的学习,所述映射关系包括所述训练语料的编码值与对应的负向语料的采样值之间的映射关系。
11.一种基于人工智能的语义识别装置,其特征在于,包括:
获取模块,用于获取用户输入的查询语句;
识别模块,用于通过预先训练的语义识别模型对所述查询语句进行识别,获得所述查询语句的意图;其中,所述预先训练的语义识别模型是利用训练语料和负向语料训练的,所述负向语料是根据所述训练语料的编码值映射到负向语料集合中抽取的;
查询模块,用于根据所述获取模块获取的查询语句和所述识别模块识别的所述查询语句的意图,获得所述查询语句对应的响应;
显示模块,用于显示所述查询语句对应的响应。
12.根据权利要求11所述的装置,其特征在于,
所述获取模块,具体用于获取用户通过文本输入的查询语句;或者,获取用户通过语音输入的查询语句;或者,获取用户输入的图片,对所述图片进行识别,获取所述图片中包括的查询语句。
13.根据权利要求11或12所述的装置,其特征在于,还包括:
分组模块,用于根据需要抽取的负向语料的数量,对训练语料进行分组;
编码模块,用于对每组训练语料进行编码,获得每组训练语料的编码值;
抽取模块,用于根据所述编码模块...
【专利技术属性】
技术研发人员:张晴,刘畅,杨瑞东,
申请(专利权)人:华为终端有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。