语料的意图识别方法及装置、电子设备、存储介质制造方法及图纸

技术编号:25835455 阅读:36 留言:0更新日期:2020-10-02 14:16
本申请提供一种语料的意图识别方法及装置、电子设备、存储介质,该方法包括:提取待识别语料的语料特征;根据语料特征确定待识别语料的至少两个相似意图;将待识别语料作为相似意图所对应意图模型的输入,得到意图模型输出的置信度;根据置信度,确定待识别语料的目标意图。本申请提供的技术方案,不同意图模型之间相互独立,其中一个意图模型在训练时,不影响其他意图模型的识别,从而无需离线训练,反馈更及时,模型更新更快速。

【技术实现步骤摘要】
语料的意图识别方法及装置、电子设备、存储介质
本申请涉及数据处理
,特别涉及一种语料的意图识别方法及装置、电子设备、计算机可读存储介质。
技术介绍
文字游戏是以文字为载体,以一定规则为约束的一种游戏,最终的目的都是为了达成一定的游戏目标。因此需要一种方法来判断玩家是否达成了系统所认可的游戏目标。比如,假设游戏的目标是为了让某个游戏内人物说出“日历”等相关表述,玩家可以通过猜灯谜的方式,问:“一物生来身穿三百多件衣,每天脱一件,年底剩张皮,猜是什么?”,当游戏内人物回答为“日历”、“是日历”等相似表述时,则游戏终结。此类话语可以被定义为一个意图,然后通过意图识别的方式来判断游戏内人物所说的话是否触发到了某个与游戏终结关联的意图。可见,对于游戏终结的判断可以转化为意图识别问题,意图识别就是一个典型的文本分类问题,而大部分的文本分类模型都是基于离线训练方式的,但是这种方式反馈不及时,模型更新慢。
技术实现思路
本申请实施例提供了一种语料的意图识别方式,用以快速实现意图识别。本申请实施例提供了一种语料的意图识别本文档来自技高网...

【技术保护点】
1.一种语料的意图识别方法,其特征在于,包括:/n提取待识别语料的语料特征;/n根据所述语料特征确定所述待识别语料的至少两个相似意图;/n将所述待识别语料作为所述相似意图所对应意图模型的输入,得到所述意图模型输出的置信度;/n根据所述置信度,确定所述待识别语料的目标意图。/n

【技术特征摘要】
1.一种语料的意图识别方法,其特征在于,包括:
提取待识别语料的语料特征;
根据所述语料特征确定所述待识别语料的至少两个相似意图;
将所述待识别语料作为所述相似意图所对应意图模型的输入,得到所述意图模型输出的置信度;
根据所述置信度,确定所述待识别语料的目标意图。


2.根据权利要求1所述的方法,其特征在于,所述提取待识别语料的语料特征,包括:
将所述待识别语料作为语言模型的输入,获得所述语言模型输出的所述待识别语料的语料特征。


3.根据权利要求1所述的方法,其特征在于,所述提取待识别语料的语料特征,包括:
根据不同意图对应配置的话术规则,进行所述待识别语料与所述话术规则的匹配;
当不存在与所述待识别语料匹配的话术规则时,提取所述待识别语料的语料特征。


4.根据权利要求3所述的方法,其特征在于,所述话术规则包括正样本语料和/或所述正样本语料对应的正则表达式;所述根据不同意图对应配置的话术规则,进行所述待识别语料与所述话术规则的匹配之后,所述方法还包括:
若所述待识别语料与任一意图对应配置的正样本语料或正则表达式匹配,则确定存在与所述待识别语料匹配的话术规则;
将所述话术规则对应的意图,作为所述待识别语料的目标意图。


5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若接收到指定意图新增的正样本语料,根据所述新增的正样本语料更新所述指定意图对应的话术规则。


6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若接收到指定意图新增的样本语料,根据所述新增的样本语料在线重新训练所述指定意图对应的意图模型。


7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若接收到新增意图的样本语料,在线执行所述新增意图对应的意图模型的训练。


8.根据权利要求6或7所述的方法,其特征在于,所述方法还包括:
在数据库中以文件形式保存训练得到的所述意图模型;
从数据库拉取训练得到的所述意图模型,更新线上参与识别的意图模型。


9.根据权利要求1所述的方法,其特征在于,所述根据所述语料特征确定所述待识别语料的至少两个相似意图,包括:
根据不同意图对应的意图特征,筛选出意图特征与所述语料特征相似的至少两个相似意图。


10.根据权利要求9所述的方法,其特征在于,所述根据不同意图对应的意图特征,筛选出意图特征与所述语料特征相似的至少两个相似意图,包括:
针对不同意图的意图特征,计算所述意图特征与所述语料特征之间的相似度;
根据不同意图的意图特征与所述语料特征之间的相似度,筛选出意图特征与所述语料特征相似度最高的至少两个相似意图。


11.根据权利要求9的方法,其特征在于,所述根据不同意图对应的意图特征,筛选出意图特征与所述语料特征相似的至少两个相似意图之前,所述方法还包括:
对于任一意图,根据所述意图对应的正样本语料的特征向量,计算向...

【专利技术属性】
技术研发人员:浦嘉澍张聪毛晓曦张林箭范长杰胡志鹏
申请(专利权)人:网易杭州网络有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1