一种语料理解方法及设备技术

技术编号:26479155 阅读:53 留言:0更新日期:2020-11-25 19:23
本发明专利技术公开了一种语料理解方法及设备,所述方法包括:获得用于表征用户意图的语料样本;通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;根据所述主干样本对分类模型进行训练,获得第一理解模型;根据所述语料样本对语义理解模型进行训练,获得第二理解模型;其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;所述第一条件和第二条件不同。

【技术实现步骤摘要】
一种语料理解方法及设备
本专利技术涉及语料处理
,尤其涉及一种语料理解方法及设备。
技术介绍
语义理解通常是指将语料解析为结构化的、机器可读的意图与词槽信息,以便于机器更好地理解并满足用户需求。现有的语料理解模型通常是根据用户的输入语料对用户的意图进行判断的。但是不同人具有不同的输入习惯,当人们习惯输入省略句子中的非主干成分的短句时,现有的语义理解模型难以获得足够的信息内容,容易出现理解错误的情况。
技术实现思路
本专利技术实施例提供了一种语料理解方法及设备,具有提高语料理解的准确度的效果。本专利技术实施例一方面提供一种语料理解方法,所述方法包括:获得用于表征用户意图的语料样本;通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;根据所述主干样本对分类模型进行训练,获得第一理解模型;根据所述语料样本对语义理解模型进行训练,获得第二理解模型;其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;所述第一条件和第二条件不同。在一可实施方式中,所述第一条件为特定长度范围;相应的,所述方法还包括:获得指定语料;在判断为所述指定语料满足特定长度范围的情况下,通过第一理解模型对指定语料进行意图理解,获得第一主干意图信息;所述第一主干意图信息为所述主干意图信息的其中之一。在一可实施方式中,所述方法还包括:在判断为所述指定语料不满足特定长度范围的情况下,通过句法分析器对所述指定语料进行主干提取,获得主干文本;通过第一理解模型对所述主干文本进行意图理解,获得第二主干意图信息;所述第二主干意图信息为所述主干意图信息的其中之一。在一可实施方式中,所述第二条件为非特定长度范围;相应的,所述方法还包括:在判断为所述指定语料满足非特定长度范围的情况下,通过第二理解模型对指定语料进行意图理解,获得第一语料意图信息;所述第一语料意图信息为所述语料意图信息的其中之一。在一可实施方式中,所述第二条件为经过第一理解模型处理;相应的,所述方法还包括:在判断为所述指定语料结果第一理解模型处理后,通过第二理解模型对指定语料进行处理,获得第二语料意图信息;所述第二语料意图信息为所述语料意图信息的其中一种。在一可实施方式中,所述方法还包括:将所述语料意图信息和所述主干意图信息进行整合,获得与所述指定语料对应的第一指定意图信息。在一可实施方式中,所述方法还包括:根据与所述主干样本对应的主干意图信息样本和与所述语料样本对应的语料意图信息样本对意图理解模型进行训练,获得第三理解模型;所述第三理解模型用于对所述语料意图信息和所述主干意图信息进行预测,获得与所述指定语料对应的第一指定意图信息。本专利技术实施例另一方面提供一种语料理解设备,所述设备包括:获得模块,用于获得用于表征用户意图的语料样本;提取模块,用于通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;训练模块,用于根据所述主干样本对分类模型进行训练,获得第一理解模型;所述训练模块,用于根据所述语料样本对语义理解模型进行训练,获得第二理解模型;其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;所述第一条件和第二条件不同。在一可实施方式中,所述第一条件为特定长度范围;相应的,所述获得模块,还用于获得指定语料;所述设备还包括:理解模块,用于在判断为所述指定语料满足特定长度范围的情况下,通过第一理解模型对指定语料进行意图理解,获得第一主干意图信息;所述第一主干意图信息为所述主干意图信息的其中之一。在一可实施方式中,所述提取模块,还用于在判断为所述指定语料不满足特定长度范围的情况下,通过句法分析器对所述指定语料进行主干提取,获得主干文本;所述理解模块,用于通过第一理解模型对所述主干文本进行意图理解,获得第二主干意图信息;所述第二主干意图信息为所述主干意图信息的其中之一。在一可实施方式中,所述第二条件为非特定长度范围;相应的,所述理解模块,还用于在判断为所述指定语料满足非特定长度范围的情况下,通过第二理解模型对指定语料进行意图理解,获得第一语料意图信息;所述第一语料意图信息为所述语料意图信息的其中之一。在一可实施方式中,所述第二条件为经过第一理解模型处理;相应的,所述设备还包括:处理模块,用于在判断为所述指定语料结果第一理解模型处理后,通过第二理解模型对指定语料进行处理,获得第二语料意图信息;所述第二语料意图信息为所述语料意图信息的其中一种。在一可实施方式中,所述设备还包括:整合模块,用于将所述语料意图信息和所述主干意图信息进行整合,获得与所述指定语料对应的第一指定意图信息。在一可实施方式中,所述训练模块,还用于根据与所述主干样本对应的主干意图信息样本和与所述语料样本对应的语料意图信息样本对意图理解模型进行训练,获得第三理解模型;所述第三理解模型用于对所述语料意图信息和所述主干意图信息进行预测,获得与所述指定语料对应的第一指定意图信息。本专利技术实施例提供的语料理解方法和设备通过训练第一理解模型和第二理解模型,并根据指定语料的满足条件情况,在第一理解模型和第二理解模型中确定具有针对性的模型,通过具有针对性的模型对指定语料进行意图理解,提高模型对指定语料的理解率,获得对指定语料的意图理解更加准确的意图信息。附图说明通过参考附图阅读下文的详细描述,本专利技术示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本专利技术的若干实施方式,其中:在附图中,相同或对应的标号表示相同或对应的部分。图1为本专利技术实施例一种语料理解方法的实现流程示意图;图2为本专利技术实施例一种语料理解方法意图理解的实现流程示意图;图3为本专利技术另一实施例一种语料理解方法意图理解的实现流程示意图;图4为本专利技术实施例一种语料理解设备的实现模块示意图。具体实施方式为使本专利技术的目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例一种语料理解方法的实现流程示意图。参考图1,本专利技术实施例一方面提供一种语料理解方法,方法包括:操作101,获得用于表征用户意图的语料样本;操作102,通过句法分析器对语料样本进行主干提取,获得主干样本,主干样本用于表征语料样本中的主干信息;操作103,根据主干样本对分类模型进行训本文档来自技高网...

【技术保护点】
1.一种语料理解方法,其特征在于,所述方法包括:/n获得用于表征用户意图的语料样本;/n通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;/n根据所述主干样本对分类模型进行训练,获得第一理解模型;/n根据所述语料样本对语义理解模型进行训练,获得第二理解模型;/n其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;/n所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;/n所述第一条件和第二条件不同。/n

【技术特征摘要】
1.一种语料理解方法,其特征在于,所述方法包括:
获得用于表征用户意图的语料样本;
通过句法分析器对所述语料样本进行主干提取,获得主干样本,所述主干样本用于表征所述语料样本中的主干信息;
根据所述主干样本对分类模型进行训练,获得第一理解模型;
根据所述语料样本对语义理解模型进行训练,获得第二理解模型;
其中,所述第一理解模型用于在指定语料满足第一条件的情况下,对指定语料进行意图理解,以获得主干意图信息;
所述第二理解模型用于在指定语料满足第二条件的情况下,对指定语料进行意图理解,以获得语料意图信息;
所述第一条件和第二条件不同。


2.根据权利要求1所述的方法,其特征在于,所述第一条件为特定长度范围;
相应的,所述方法还包括:
获得指定语料;
在判断为所述指定语料满足特定长度范围的情况下,通过第一理解模型对指定语料进行意图理解,获得第一主干意图信息;
所述第一主干意图信息为所述主干意图信息的其中之一。


3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在判断为所述指定语料不满足特定长度范围的情况下,通过句法分析器对所述指定语料进行主干提取,获得主干文本;
通过第一理解模型对所述主干文本进行意图理解,获得第二主干意图信息;
所述第二主干意图信息为所述主干意图信息的其中之一。


4.根据权利要求1或2或所述的方法,其特征在于,所述第二条件为非特定长度范围;
相应的,所述方法还包括:
在判断为所述指定语料满足非特定长度范围的情况下,通过第二理解模型对指定语料进行意图理解,获得第一语料意图信息;
所述第一语料意图信息为所述语料意图信息的其中之一。


5.根据权利要求1或3所述的方法,其特征在于,所述第二条件为经过第一理解模型处理;
相应的,所述方法还包括:
在判断为所述指定语料结果第一理解模型处理后,通过第二理解模型对指定语料进行处理,获得第二语料意图信息;
所述第二语料意图信息为所述语料意图信息的其中一种。

【专利技术属性】
技术研发人员:孙佳宋鸣张东海陈红
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1