文本意图识别方法、装置及存储介质制造方法及图纸

技术编号:32438315 阅读:15 留言:0更新日期:2022-02-26 07:56
本申请涉及人工智能领域的文本意图识别,具体公开了一种文本意图识别方法、装置及存储介质。该方法包括:对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图。本申请有利于提高对文本意图识别的准确率。率。率。

【技术实现步骤摘要】
文本意图识别方法、装置及存储介质


[0001]本专利技术涉及人工智能
,具体涉及一种文本意图识别方法、装置及存储介质。

技术介绍

[0002]自然语言理解(Natural language understand,NLU)的任务主要由意图识别以及槽位填充组成。比如,语音助手执行用户的指令需要机器确定用户话语中表达出来的意图,然后将用户的意图转化为指令,即槽位填充。意图识别与槽位填充的准确性对于合理完成用户的指令,提升对话系统的质量具有非常重要的影响。
[0003]目前对意图的识别和槽位填充主要是通过句式与关键词来进行识别,而在实际业务场景中,一个句子的句式和关键词可能存在多个意图,比如,“请为我播放七里香”,对应的意图可能有播放音乐七里香和播放视频七里香,这就导致模型根据句式和关键词不能准确的识别出用户的意图,对口语理解和意图识别的精度较低。

技术实现思路

[0004]本申请提供了一种文本意图识别方法、装置及存储介质。通过对待识别文本添加实体标签,为意图识别提供先验知识,进而文本意图识别的准确度。
[0005]第一方面,本申请实施例提供一种文本意图识别方法,包括:
[0006]对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;
[0007]根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图。
[0008]可以看出,在本申请实施方式中,可根据预先为待识别文本添加的至少一对实体标签,确定该待识别文本的意图。由于每个第一实体标签指示了一个实体类型,所以,每对第一实体标签为意图识别提供了先验知识,进而实现根据先验知识进行意图识别,提高意图识别的准确率。
[0009]在一些可能的实施方式中,所述每对第一实体标签中的一个实体标签用于指示所述第一实体在所述待识别文本中的起始位置,另一个实体标签用于指示所述第一实体在所述待识别文本中的结束位置。
[0010]可以看出,在本实施方式中,通过一对实体标签指示待识别文本中的实体的位置,从而可以准确的确定出该待识别文本中哪些单词是实体,从而在槽位填充阶段,可以为这些单词填充与该实体标签所表征的类型对应的槽位填充结果,提高槽位填充结果的准确度,从而提高文本意图识别的准确率。
[0011]在一些可能的实施方式中,所述对待识别文本添加至少一对第一实体标签,包括:
[0012]确定所述待识别文本中的第一实体;
[0013]在所述待识别文本包含垂类词的情况下,对所述第一实体添加所述至少一对第一实体标签,其中,所述每对第一实体标签用于表征的一个实体类型是所述少一个第一实体类型中的一个实体类型或者不是所述少一个第一实体类型中的一个实体类型;
[0014]在所述待识别文本不包含垂类词的情况下,确定与所述第一实体对应的至少一个第一实体类型,并对所述第一实体添加所述至少一对第一实体标签,其中,所述每对第一实体标签用于表征的一个实体类型是所述少一个第一实体类型中的一个实体类型。
[0015]可以看出,在本实施方式中,在该待识别文本中包含垂类词的情况下,添加的实体标签所表征的实体类型可以不是该待识别文本中的第一实体所对应的实体类型,从而提高添加实体标签的灵活性;在该待识别文本中不包含垂类词的情况下,添加的实体标签用于表征该第一实体的实体类型,进而为该待识别文本提供正确的先验知识,进而提高文本意图识别准确率。
[0016]在一些可能的实施方式中,所述根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图,包括:
[0017]在所述待识别文本中包含垂类词的情况下,根据所述垂类词确定所述第一实体的实体类型,并根据所述第一实体的实体类型确定所述待识别文本的意图;
[0018]在所述待识别文本中不包含垂类词的情况下,根据所述至少一对第一实体标签,确定所述第一实体的实体类型,并根据所述第一实体的实体类型确定所述待识别文本的意图。
[0019]可以看出,在本实施方式中,在该待识别文本中包含垂类词的情况下,根据垂类词识别文本意图,即使文本中包含有噪声,也能正确的识别文本意图;在该待识别文本中不包含垂类词的情况下,根据实体标签识别文本意图,从而实现可以根据先验知识识别文本意图,进而提高文本意图识别准确率。
[0020]在一些可能的实施方式中,所述识别所述待识别文本的意图是通过网络模型执行的,所述网络模型通过以下步骤训练得到:
[0021]获取第一文本序列;
[0022]对所述第一文本序列添加至少一对第二实体标签,得到至少一个第一样本,其中,所述至少一对第二实体标签中的每对第二实体标签对应一个第一样本,其中,所述每对第二实体标签用于表征一个实体类型,所述每对第二实体标签所表征的实体类型用于指示一个意图;
[0023]将所述每个第一样本输入到所述网络模型,预测所述每个第一样本中每个单词的槽位填充结果以及所述每个第一样本的意图;
[0024]根据预测的所述每个第一样本中每个单词的槽位填充结果以及所述每个第一样本的意图,调整所述网络模型的模型参数,以对所述网络模型进行训练。
[0025]可以看出,在本实施方式中,在对模型进行训练的过程中,为原始的文本序列(第一文本序列)添加实体标签,从而在对模型训练完成后,具备根据实体标签识别文本意图的能力。
[0026]在一些可能的实施方式中,所述对所述第一文本序列添加至少一对第二实体标签,得到至少一个第一样本,包括:
[0027]在所述第一文本序列不包含垂类词的情况下,确定与所述第一文本序列中的第二
实体对应的至少一个第二实体类型,并在所述第一文本序列中为所述至少一个第二实体类型中的每个第二实体类型添加一对第二实体标签,得到所述至少一个第一样本,其中,所述至少一个第一样本中的每个第一样本的意图是由所述每个第一样本对应的第二实体类型确定的;
[0028]在所述第一文本序列包含垂类词的情况下,确定至少一个第三实体类型,并在所述第一文本序列中为所述至少一个第三实体类型中的每个第三实体类型添加一个第二实体标签,得到所述至少一个第一样本,其中,所述每个第三实体类型是与所述第一文本序列中的第二实体对应的至少一个第二实体类型中的一个实体类型或者不是所述至少一个第二实体类型中的一个实体类型,所述至少一个第一样本中的每个第一样本的意图是由所述每个第一样本中的垂类词确定的。
[0029]可以看出,在本实施方式中,在该待识别文本中包含垂类词的情况下,添加的实体标签所表征的实体类型可以不是该待识别文本中的第一实体所对应的实体类型,从而提高添加实体标签的灵活性;在该待识别文本中不包含垂类词的情况下,添加的实体标签用于表征该第一实体的实体类型,进而为该待识别文本提供正确的先验知识,使模型学会在实体标签为正确的先验知识的情况下,可根据实体标签正确的识别出文本意图的能力。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本意图识别方法,其特征在于,包括:对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图。2.根据权利要求1所述的方法,其特征在于,所述每对第一实体标签中的一个实体标签用于指示所述第一实体在所述待识别文本中的起始位置,另一个实体标签用于指示所述第一实体在所述待识别文本中的结束位置。3.根据权利要求1或2所述的方法,其特征在于,所述对待识别文本添加至少一对第一实体标签,包括:确定所述待识别文本中的第一实体;在所述待识别文本包含垂类词的情况下,对所述第一实体添加所述至少一对第一实体标签,其中,所述每对第一实体标签用于表征的一个实体类型是所述少一个第一实体类型中的一个实体类型或者不是所述少一个第一实体类型中的一个实体类型;在所述待识别文本不包含垂类词的情况下,确定与所述第一实体对应的至少一个第一实体类型,并对所述第一实体添加所述至少一对第一实体标签,其中,所述每对第一实体标签用于表征的一个实体类型是所述少一个第一实体类型中的一个实体类型。4.根据权利要求3所述的方法,其特征在于,所述根据所述待识别文本以及所述至少一对第一实体标签,确定所述待识别文本的意图,包括:在所述待识别文本中包含垂类词的情况下,根据所述垂类词确定所述第一实体的实体类型,并根据所述第一实体的实体类型确定所述待识别文本的意图;在所述待识别文本中不包含垂类词的情况下,根据所述至少一对第一实体标签,确定所述第一实体的实体类型,并根据所述第一实体的实体类型确定所述待识别文本的意图。5.根据权利要求1-4中任一项所述的方法,其特征在于,所述识别所述待识别文本的意图是通过网络模型执行的,所述网络模型通过以下步骤训练得到:获取第一文本序列;对所述第一文本序列添加至少一对第二实体标签,得到至少一个第一样本,其中,所述至少一对第二实体标签中的每对第二实体标签对应一个第一样本,其中,所述每对第二实体标签用于表征一个实体类型,所述每对第二实体标签所表征的实体类型用于指示一个意图;将所述每个第一样本输入到所述网络模型,预测所述每个第一样本中每个单词的槽位填充结果以及所述每个第一样本的意图;根据预测的所述每个第一样本中每个单词的槽位填充结果以及所述每个第一样本的意图,调整所述网络模型的模型参数,以对所述网络模型进行训练。6.根据权利要求5所述的方法,其特征在于,所述对所述第一文本序列添加至少一对第二实体标签,得到至少一个第一样本,包括:在所述第一文本序列不包含垂类词的情况下,确定与所述第一文本序列中的第二实体对应的至少一个第二实体类型,并在所述第一文本序列中为所述至少一个第二实体类型中的每个第二实体类型添加一对第二实体标签,得到所述至少一个第一样本,其中,所述至少
一个第一样本中的每个第一样本的意图是由所述每个第一样本对应的第二实体类型确定的;在所述第一文本序列包含垂类词的情况下,确定至少一个第三实体类型,并在所述第一文本序列中为所述至少一个第三实体类型中的每个第三实体类型添加一个第二实体标签,得到所述至少一个第一样本,其中,所述每个第三实体类型是与所述第一文本序列中的第二实体对应的至少一个第二实体类型中的一个实体类型或者不是所述至少一个第二实体类型中的一个实体类型,所述至少一个第一样本中的每个第一样本的意图是由所述每个第一样本中的垂类词确定的。7.一种文本意图识别装置,其特征在于,包括:收发单元,用于获取待识别文本;处理单元,用于对待识别文本添加至少一对第一实体标签,其中,所述至少一对第一实体标签中的每对第一实体标签用于表征一个实体类型,所述每对第一实体标签所表征的实体类型用于指示一个意图;所述...

【专利技术属性】
技术研发人员:徐坤张钊孟函可王宝军张宇洋
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1