System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种意图抽取的方法、装置、电子设备和存储介质制造方法及图纸_技高网

一种意图抽取的方法、装置、电子设备和存储介质制造方法及图纸

技术编号:40801235 阅读:2 留言:0更新日期:2024-03-28 19:27
本申请提供了一种意图抽取的方法、装置、电子设备和存储介质,该方法包括:获取目标文本数据;对目标文本数据进行语义依存分析,确定目标文本数据中的语义依存关系;根据语义依存关系对目标文本数据进行意图抽取,得到第一意图集合;和/或,对目标文本数据进行依存句法分析,确定目标文本数据中的依存句法关系;根据依存句法关系对目标文本数据进行意图抽取,得到第二意图集合;将第一意图集合和/或第二意图集合进行确定为目标意图集合。该方法在进行意图抽取时不依赖于传统的模板规则,可以实现抽取多个意图,并且抽取的个数无限制,分别用两种分析方法抽取可以识别目标文本中的所有意图,避免丢失意图。

【技术实现步骤摘要】

本申请涉及计算机领域,并且更具体地,涉及计算机领域中一种意图抽取的方法、装置、电子设备和存储介质


技术介绍

1、用户在使用车载语音功能时,一句语音中可能会包含多个意图(指令),现有技术中,使用传统的模板规则匹配的方式完成多意图抽取功能。

2、现有技术中的基于模板规则匹配的方式识别用户意图的个数有限、并且可能会存在意图丢失的问题。而且模板复杂度会随着句子中意图个数的增长呈现出指数式增长、泛化能力较差,需要更多专业开发人员去定制模板。


技术实现思路

1、本申请提供了一种意图抽取的方法、装置、电子设备和存储介质,该方法能够在进行意图抽取时不依赖于传统的模板规则,可以实现抽取多个意图,并且抽取的个数无限制,用两种分析方法抽取可以识别目标文本中的所有意图,避免丢失意图。

2、第一方面,提供了一种意图抽取的方法,该方法包括:获取目标文本数据;对目标文本数据进行语义依存分析,确定目标文本数据中的语义依存关系;根据语义依存关系对目标文本数据进行意图抽取,得到第一意图集合;和/或,对目标文本数据进行依存句法分析,确定目标文本数据中的依存句法关系;根据依存句法关系对目标文本数据进行意图抽取,得到第二意图集合;将第一意图集合和/或第二意图集合进行合并确定为目标意图集合。

3、在上述技术方案中,基于依存句法分析和/或依存句法关系对目标文本数据进行分析,抽取意图,得到目标意图集合,该方案在进行意图抽取时不依赖于传统的模板规则,可以实现抽取多个意图,并且抽取的个数无限制,用两种分析方法抽取可以识别目标文本中的所有意图,避免丢失意图。

4、结合第一方面,在某些可能的实现方式中,根据语义依存关系对目标文本数据进行意图抽取,得到第一意图集合,包括:从语义依存关系中确定目标语义依存关系;其中,目标语义依存关系与意图相关联;从目标文本数据中抽取存在目标语义依存关系的第一意图文本;根据第一意图文本,确定第一意图集合。

5、结合第一方面和上述实现方式,在某些可能的实现方式中,目标语义依存关系包括第一关系和第二关系,第一关系用于描述不同角色类型的实词之间的关系,第二关系用于描述相同角色类型的实词之间的关系,第一意图文本包括实词组合和/或单个实词,从目标文本数据中抽取存在目标语义依存关系的第一意图文本,根据语义依存关系,从目标文本数据中抽取与目标语义依存关系相关联的实词,包括:以目标文本数据包括的实词为节点,以语义依存关系为枝干,建立目标文本数据的树结构;对于语义依存关系中的第一关系,将树结构中第一关系的枝干两端节点的实词进行组合,得到实词组合;对于语义依存关系中的第二关系,判断树结构中第二关系的枝干两端是否存在叶子节点,若存在叶子节点,则将叶子节点的实词作为单个实词。

6、结合第一方面和上述实现方式,在某些可能的实现方式中,第一关系包括受事关系和/或客事关系,第二关系包括以下任意一个或其组合:并列关系、先行关系、后继关系和顺承关系。

7、结合第一方面和上述实现方式,在某些可能的实现方式中,根据依存句法关系对目标文本数据进行意图抽取,得到第二意图集合,包括:从依存句法关系中确定目标依存句法关系;其中,目标依存句法关系与意图相关联;从目标文本数据中抽取存在目标依存句法关系的第二意图文本;根据第二意图文本,确定第二意图集合。

8、结合第一方面和上述实现方式,在某些可能的实现方式中,获取目标文本数据包括:采集目标用户的语音指令;识别语音指令对应的文本数据;将文本数据中的停用词进行过滤,得到目标文本数据。

9、在上述技术方案中,通过过滤文本数据中对意图判断无影响的停用词,得到目标文本数据,可以提高后续对目标文本数据进行分析,抽取意图的准确率。

10、结合第一方面和上述实现方式,在某些可能的实现方式中,当目标意图集合包括第一意图集合和第二意图集合时,该方法还包括:将目标意图集合中的意图转化为指令;对指令中的重复指令进行去重操作。

11、综上,本申请基于依存句法分析和/或依存句法关系对目标文本数据进行分析,抽取意图,得到目标意图集合,该方案在进行意图抽取时不依赖于传统的模板规则,可以实现抽取多个意图,并且抽取的个数无限制,用两种分析方法抽取可以识别目标文本中的所有意图,避免丢失意图。通过过滤文本数据中对意图判断无影响的停用词,得到目标文本数据,可以提高后续对目标文本数据进行分析,抽取意图的准确率。

12、第二方面,提供了一种意图抽取的装置,该装置包括:获取模块,用于获取目标文本数据;第一分析模块,用于对目标文本数据进行语义依存分析,确定目标文本数据中的语义依存关系;第一抽取模块,用于根据语义依存关系对目标文本数据进行意图抽取,得到第一意图集合;和/或,第二分析模块,用于对目标文本数据进行依存句法分析,确定目标文本数据中的依存句法关系;第二抽取模块,用于根据依存句法关系对目标文本数据进行意图抽取,得到第二意图集合;确定模块,用于将第一意图集合和/或第二意图集合,确定为目标意图集合。

13、结合第二方面,在某些可能的实现方式中,第一抽取模块具体用于:从语义依存关系中确定目标语义依存关系;其中,目标语义依存关系与意图相关联;从目标文本数据中抽取存在目标语义依存关系的第一意图文本;根据第一意图文本,确定第一意图集合。

14、结合第二方面上述实现方式,在某些可能的实现方式中,目标语义依存关系包括第一关系和第二关系,第一关系用于描述不同角色类型的实词之间的关系,第二关系用于描述相同角色类型的实词之间的关系,第一意图文本包括实词组合和/或单个实词,第一抽取模块具体用于:以目标文本数据包括的实词为节点,以语义依存关系为枝干,建立目标文本数据的树结构;对于语义依存关系中的第一关系,将树结构中第一关系的枝干两端节点的实词进行组合,得到实词组合;对于语义依存关系中的第二关系,判断树结构中第二关系的枝干两端是否存在叶子节点,若存在叶子节点,则将叶子节点的实词作为单个实词。

15、结合第二方面和上述实现方式,在某些可能的实现方式中,第一关系包括受事关系和/或客事关系,第二关系包括以下任意一个或其组合:并列关系、先行关系、后继关系和顺承关系。

16、结合第二方面和上述实现方式,在某些可能的实现方式中,第二抽取模块具体用于:从依存句法关系中确定目标依存句法关系;其中,目标依存句法关系与意图相关联;从目标文本数据中抽取存在目标依存句法关系的第二意图文本;根据第二意图文本,确定第二意图集合。

17、结合第二方面和上述实现方式,在某些可能的实现方式中,获取模块具体用于:采集目标用户的语音指令;识别语音指令对应的文本数据;将文本数据中的停用词进行过滤,得到目标文本数据。

18、结合第二方面和上述实现方式,在某些可能的实现方式中,该装置还包括:去重模块,用于当目标意图集合包括第一意图集合和第二意图集合时,将目标意图集合中的意图转化为指令;对指令中的重复指令进行去重操作。

19、第本文档来自技高网...

【技术保护点】

1.一种意图抽取的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述语义依存关系对所述目标文本数据进行意图抽取,得到第一意图集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述目标语义依存关系包括第一关系和第二关系,所述第一关系用于描述不同角色类型的实词之间的关系,所述第二关系用于描述相同角色类型的实词之间的关系,所述第一意图文本包括实词组合和/或单个实词,从所述目标文本数据中抽取存在目标语义依存关系的第一意图文本,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一关系包括受事关系和/或客事关系,所述第二关系包括以下任意一个或其组合:并列关系、先行关系、后继关系和顺承关系。

5.根据权利要求1至4中任意一项所述的方法,其特征在于,所述根据所述依存句法关系对所述目标文本数据进行意图抽取,得到第二意图集合,包括:

6.根据权利要求1至4中任意一项所述的方法,其特征在于,所述获取目标文本数据包括:

7.根据权利要求1至4中任意一项所述的方法,其特征在于,当所述目标意图集合包括所述第一意图集合和所述第二意图集合时,所述方法还包括:

8.一种意图抽取的装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被执行时,实现如权利要求1至7中任意一项所述的方法。

...

【技术特征摘要】

1.一种意图抽取的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述语义依存关系对所述目标文本数据进行意图抽取,得到第一意图集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述目标语义依存关系包括第一关系和第二关系,所述第一关系用于描述不同角色类型的实词之间的关系,所述第二关系用于描述相同角色类型的实词之间的关系,所述第一意图文本包括实词组合和/或单个实词,从所述目标文本数据中抽取存在目标语义依存关系的第一意图文本,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一关系包括受事关系和/或客事关系,所述第二关系包括以下任意一个或其组合:并列关系、先行关系、后继关系和顺承关系。

【专利技术属性】
技术研发人员:肖雷雷
申请(专利权)人:长城汽车股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1