一种文本意图的识别方法及装置制造方法及图纸

技术编号:26690315 阅读:33 留言:0更新日期:2020-12-12 02:40
本发明专利技术提供了一种文本意图的识别方法、装置、计算机设备及计算机可读存储介质,包括:获取目标文本;针对目标文本,识别目标文本中的目标槽位和与目标槽位对应的目标关键词;针对目标文本,从预先设置的样本库中,确定与目标文本匹配的目标意图,样本库中包含文本与意图的对应关系;根据目标意图、目标关键词和目标槽位,生成目标文本的意图识别结果。本发明专利技术中针对目标文本,确定与目标文本匹配的目标意图的过程,与识别目标文本中的目标槽位和目标关键词的过程相互独立,使得识别槽位和关键词步骤中产生的误差,不会影响确定目标意图过程的准确度,避免了错误的积累,从而提高了用户意图识别过程的准确度。

【技术实现步骤摘要】
一种文本意图的识别方法及装置
本专利技术属于自然语言处理
,特别是涉及一种文本意图的识别方法、装置、计算机设备及计算机可读存储介质。
技术介绍
随着问答系统、人机交互系统等涉及自然语言处理的系统应用越来越广泛,在自然语言处理中将文本处理成意图和槽-值对表示的语义理解过程尤为重要,当获得用户提出的问题后,判断用户问题对应的文本的意图,并确定文本中与该意图相关的关键槽-值信息,从而给出用户所需的答案或者相应操作,可以大大简化人机交互的流程。目前,对用户的语句进行理解的过程主要包括:先将用户语句转化成文本形式,再对用户文本进行实体词识别,即从用户文本中识别出关键的实体词及对应的属性,构成用于对用户的意图进行细节内容补充的槽-值对,进一步的,通过检索预先存储有样本文本与对应的样本意图的文本模板库,确定与用户文本匹配的多个样本文本,为减少检索的数量,缩短检索时间,可以将用户文本中的实体词替换为对应的属性,再将其与文本模板库中的样本文本进行匹配,最后,计算每个样本文本与用户文本的语义相似度,将其中语义相似度最高的样本文本对应的意图确定为用户文本文档来自技高网...

【技术保护点】
1.一种文本意图的识别方法,其特征在于,所述方法包括:/n获取目标文本;/n针对所述目标文本,识别所述目标文本中的目标槽位和与所述目标槽位对应的目标关键词;/n针对所述目标文本,从预先设置的样本库中,确定与所述目标文本匹配的目标意图,所述样本库中包含文本与意图的对应关系;/n根据所述目标意图、所述目标关键词和所述目标槽位,生成所述目标文本的意图识别结果。/n

【技术特征摘要】
1.一种文本意图的识别方法,其特征在于,所述方法包括:
获取目标文本;
针对所述目标文本,识别所述目标文本中的目标槽位和与所述目标槽位对应的目标关键词;
针对所述目标文本,从预先设置的样本库中,确定与所述目标文本匹配的目标意图,所述样本库中包含文本与意图的对应关系;
根据所述目标意图、所述目标关键词和所述目标槽位,生成所述目标文本的意图识别结果。


2.根据权利要求1所述的方法,其特征在于,所述样本库中包含多个样本文本,以及样本文本与样本意图的对应关系;
所述从预先设置的样本库中,确定与所述目标文本匹配的目标意图的步骤,包括:
从所述预先设置的样本库的多个样本文本中,确定与所述目标文本匹配的至少一个候选样本文本;
计算每一个所述候选样本文本与所述目标文本的相似度,并根据所述对应关系,将与所述目标文本的相似度最大的候选样本文本对应的样本意图确定为所述目标意图。


3.根据权利要求2所述的方法,其特征在于,所述样本库中还包含所述样本文本对应的样本文本向量;
所述从所述预先设置的样本库的多个样本文本中,确定与所述目标文本匹配的至少一个候选样本文本的步骤,包括:
利用深度学习模型,获取所述目标文本对应的目标文本向量;
根据所述目标文本向量和所述样本文本向量,从所述样本库的多个样本文本中,确定与所述目标文本匹配的至少一个候选样本文本。


4.根据权利要求3所述的方法,其特征在于,所述根据所述目标文本向量和所述样本文本向量,从所述样本库的多个样本文本中,确定与所述目标文本匹配的至少一个候选样本文本的步骤,具体包括:
根据所述目标文本向量和所述样本文本向量,计算所述目标文本与每个所述样本文本之间的文本距离;
将与所述目标文本的文本距离小于或等于预设距离的样本文本确定为所述候选样本文本。


5.根据权利要求4所述的方法,其特征在于,所述文本距离包括:欧几里得距离和余弦距离。


6.根据权利要求3所述的方法,其特征在于,所述样本库中还包含所述样本文本中的样本槽位和与所述样本槽位对应的样本关键词;
所述根据所述目标文本向量和所述样本文本向量,从所述样本库的多个样本文本中,确定与所述目标文本匹配的至少一个候选样本文本的步骤,包括:
在每个所述样本文本中的样本槽位中确定目标样本槽位,所述目标样本槽位与所述目标槽位相同,并将每个所述样本文本中与所述目标样本槽位对应的样本关键词,替换为所述目标关键词,得到替换文本;
获取所述替换文本对应的替换文本向量;
根据所述目标文本向量和所述替换文本向量...

【专利技术属性】
技术研发人员:王卓然沈寓实汝聪翀
申请(专利权)人:飞诺门阵北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1