【技术实现步骤摘要】
文本意图识别方法、装置及存储介质
[0001]本专利技术涉及人工智能
,具体涉及一种文本意图识别方法、装置及存储介质。
技术介绍
[0002]自然语言理解(Natural language understand,NLU)的任务主要由意图识别以及槽位填充组成。比如,语音助手执行用户的指令需要机器确定用户话语中表达出来的意图,然后将用户的意图转化为指令,即槽位填充。意图识别与槽位填充的准确性对于合理完成用户的指令,提升对话系统的质量具有非常重要的影响。
[0003]目前对意图的识别和槽位填充主要是通过句式与关键词来进行识别,而在实际业务场景中,一个句子的句式和关键词可能存在多个意图,比如,“请为我播放七里香”,对应的意图可能有播放音乐七里香和播放视频七里香,这就导致模型根据句式和关键词不能准确的识别出用户的意图,对口语理解和意图识别的精度较低。
技术实现思路
[0004]本申请提供了一种文本意图识别方法、装置及存储介质。通过对待识别文本添加实体标签,为意图识别提供先验知识,进而文本意图识别的准确度。
[0005]第一方面,本申请实施例提供一种文本意图识别方法,包括:
[0006]对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;
[0007]根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图。
[0008]可以看出,在本申请实 ...
【技术保护点】
【技术特征摘要】
1.一种文本意图识别方法,其特征在于,包括:对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图。2.根据权利要求1所述的方法,其特征在于,所述每对第一实体标签中的一个实体标签用于指示所述第一实体在所述待识别文本中的起始位置,另一个实体标签用于指示所述第一实体在所述待识别文本中的结束位置。3.根据权利要求1或2所述的方法,其特征在于,所述对待识别文本添加至少一对第一实体标签,包括:确定所述待识别文本中的第一实体;在所述待识别文本包含垂类词的情况下,对所述第一实体添加所述至少一对第一实体标签,其中,所述每对第一实体标签用于表征的一个实体类型是所述少一个第一实体类型中的一个实体类型或者不是所述少一个第一实体类型中的一个实体类型;在所述待识别文本不包含垂类词的情况下,确定与所述第一实体对应的至少一个第一实体类型,并对所述第一实体添加所述至少一对第一实体标签,其中,所述每对第一实体标签用于表征的一个实体类型是所述少一个第一实体类型中的一个实体类型。4.根据权利要求3所述的方法,其特征在于,所述根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图,包括:在所述待识别文本中包含垂类词的情况下,根据所述垂类词确定所述第一实体的实体类型,并根据所述第一实体的实体类型确定所述待识别文本的意图;在所述待识别文本中不包含垂类词的情况下,根据所述至少一对第一实体标签,确定所述第一实体的实体类型,并根据所述第一实体的实体类型确定所述待识别文本的意图。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述识别所述待识别文本的意图是通过网络模型执行的,所述网络模型通过以下步骤训练得到:获取第一文本序列;对所述第一文本序列添加至少一对第二实体标签,得到至少一个第一样本,其中,所述至少一对第二实体标签中的每对第二实体标签对应一个第一样本,其中,所述每对第二实体标签用于表征一个实体类型,所述每对第二实体标签所表征的实体类型用于指示一个意图;将所述每个第一样本输入到所述网络模型,预测所述每个第一样本中每个单词的槽位填充结果以及所述每个第一样本的意图;根据预测的所述每个第一样本中每个单词的槽位填充结果以及所述每个第一样本的意图,调整所述网络模型的模型参数,以对所述网络模型进行训练。6.根据权利要求5所述的方法,其特征在于,所述对所述第一文本序列添加至少一对第二实体标签,得到至少一个第一样本,包括:在所述第一文本序列不包含垂类词的情况下,确定与所述第一文本序列中的第二实体对应的至少一个第二实体类型,并在所述第一文本序列中为所述至少一个第二实体类型中的每个第二实体类型添加一对第二实体标签,得到所述至少一个第一样本,其中,所述至少
一个第一样本中的每个第一样本的意图是由所述每个第一样本对应的第二实体类型确定的;在所述第一文本序列包含垂类词的情况下,确定至少一个第三实体类型,并在所述第一文本序列中为所述至少一个第三实体类型中的每个第三实体类型添加一个第二实体标签,得到所述至少一个第一样本,其中,所述每个第三实体类型是与所述第一文本序列中的第二实体对应的至少一个第二实体类型中的一个实体类型或者不是所述至少一个第二实体类型中的一个实体类型,所述至少一个第一样本中的每个第一样本的意图是由所述每个第一样本中的垂类词确定的。7.一种文本意图识别装置,其特征在于,包括:收发单元,用于获取待识别文本;处理单元,用于对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;所述...
【专利技术属性】
技术研发人员:徐坤,张钊,孟函可,王宝军,张宇洋,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。