一种自然语言问句答案的生成方法、装置及服务器制造方法及图纸

技术编号:18763821 阅读:84 留言:0更新日期:2018-08-25 10:30
本申请提供了一种自然语言问句答案的生成方法、装置及服务器,其中,问句答案的生成方法包括:响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,所述词标注结果包括:所述问句的各分词是否为关键词以及各关键词的词类型;依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图;依据预先配置的、与所述目标意图对应的目标意图模板,获取所述目标意图对应的目标答案。采用本申请实施例,基于意图模板来训练得到能够更为准确的识别用户意图的意图识别模型,以及采用关键词提取模型来提取用户的问句的关键词来为意图模板中的意图参数赋值,从而可以执行意图模板中的逻辑来自动生成问句的答案。

【技术实现步骤摘要】
一种自然语言问句答案的生成方法、装置及服务器
本申请涉及智能问答
,特别涉及一种基于意图识别模型和关键词提取模型的、自然语言问句答案的生成方法,装置及服务器。
技术介绍
在互联网越来越发展的今天,很多网站或者网店等都采用智能问答系统来回答各种问题的咨询。智能问答系统是以一问一答的形式,精确的定位网站或网店等用户所需要的提问知识,通过与用户进行交互,为用户提供个性化的信息服务的系统。在现有技术中,通过采用预先设定规则的方式来实现智能问答。例如,枚举所有可能的问句以及问句的回答,然后对每种问句抽象出一个规则。具体在生成当前问句的回答时,依次检查当前问句和每个规则是否匹配,如果匹配,则执行该规则指定的回答方式获取答案。
技术实现思路
但是专利技术人在研究过程中发现,现有技术中,对规则的配置比较麻烦,将规则配错的可能性很大,而且各个规则之间可能互相矛盾,添加新规则的时候还需要不和其他的已有规则冲突。因此,基于规则的智能问答的维护成本较大。具体执行时,因为问句要和每个规则的对应关系都尝试匹配,如果规则的数量较多,就会使得匹配的效率也较低。并且,匹配不到规则的时候,就无法回答用户提出的问题,因此灵活性较低,即如果希望能够回答某个问句,就必须增加一条和该问句对应的规则才行。基于此,本申请提供了一种基于预先训练的意图识别模型和关键词提取模型的问句答案的自动生成方法,用以采用预先建立本体的方式枚举领域内的所有意图,即一个问句的询问目的,再依据意图来配置相对应的意图模板,即配置好什么样的问句能够被该意图模板回答以及如何回答,进一步的,基于意图模板来训练得到能够更为准确的识别用户意图的意图识别模型,以及采用关键词提取模型来提取用户的问句的关键词来为意图模板中的意图参数赋值,从而可以执行意图模板中的逻辑来自动生成问句的答案。本申请还提供了一种问句答案的自动生成装置和服务器例如问答引擎等,用以保证上述方法在实际中的实现及应用。为了解决上述问题,本申请公开了一种问句答案的生成方法,该方法包括:响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,所述词标注结果包括:所述问句的各分词是否为关键词以及各关键词的词类型;依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图;依据预先配置的、与所述目标意图对应的目标意图模板,获取所述目标意图对应的目标答案。其中,所述响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,包括:对所述问句进行分词,得到所述问句的分词集合;基于所述问句所属的领域对应的领域词典,对所述分词集合中的各分词进行关键词标记得到第一标记结果;以及,基于预先训练的关键词提取模型,对所述分词集合中的各分词进行关键词标记得到第二标记结果;所述领域词典用于保存各领域词及其对应的词类型之间的对应关系;依据所述第一标记结果和第二标记结果,确定所述分词集合中的各分词的词标注结果。其中,所述依据所述第一标记结果和第二标记结果,确定所述分词集合中的各分词的词标注结果,包括:针对分词集合中的各分词,判断所述第一标记结果和第二标记结果是否都标注为关键词,如果是,则将该分词确定为关键词,并依据所述第一标记结果或第二标记结果确定所述关键词的词类型;如果第一标记结果标注为关键词而第二标记结果标注为非关键词,则将该分词确定为非关键词。其中,所述领域词典通过以下方式生成:获取领域内各实体的各属性;将所述各属性对应的属性值作为关键词,并将实体标签和属性名作为关键词的词类型,以及,将所述关键词的关联词汇也确定为关键词,所述关联词汇包括:同义词、近义词、口语表达词和别名。其中,所述依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图,包括:将所述词标注结果作为所述预先训练的意图识别模型的输入,得到多个候选意图及对应的可信度;将所述多个候选意图中可信度最高的候选意图确定为当前意图;依据所述当前意图对应的当前意图模板,判断所述词标注结果中各关键词是否完整;所述意图模板包括:确定一意图所需要的全部意图参数;如果完整,则将所述当前意图确定为目标意图;如果不完整,则按照可信度从高到底的顺序选择下一个候选意图作为当前意图,并执行所述依据所述当前意图对应的当前意图模板,判断所述词性标注结果中各关键词是否完整的步骤,直至所述多个候选意图都选择完毕。其中,所述依据所述当前意图对应的当前意图模板,判断所述词标注结果中各关键词是否完整,包括:获取所述当前意图模板中配置的全部意图参数;采用所述词标注结果中的各关键词的词类型,为所述全部意图参数进行赋值,并判断所述全部意图参数是否能赋值成功。其中,所述依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图,包括:至少将所述词标注结果作为所述预先训练的意图识别模型的输入,得到多个候选意图及其对应的可信度;将所述多个候选意图中可信度最高的候选意图确定为当前意图;判断所述当前意图的可信度是否大于预设可信度阈值,如果大于,则将所述当前意图确定为所述目标意图;如果不大于,则选取预设个数的前若干个候选意图作为待选择意图,并将所述待选择意图发送至终端以供用户选择,以及,将所述终端返回的、用户选择的意图确定为目标意图;依据所述目标意图对应的目标意图模板,判断所述词标注结果中各关键词是否完整,如果不完整,则将不完整的关键词对应的意图参数确定为缺少的意图参数;依据所述缺少的意图参数和所述目标意图模板,生成所述目标意图相关的参数问题;将所述参数问题返回给客户端以便显示给用户;所述意图模板包括:所述意图参数和参数问题之间的对应关系;根据所述客户端返回的、用户输入的参数答案获取所述缺少的意图参数。其中,所述方法还包括:将用户输入的对话内容保存至会话数据库中,所述对话内容包括:用户选择的意图和/或用户输入的参数答案。其中,所述方法还包括:对所述会话数据库中的对话内容进行更新,或者,在到达预设的时间周期的时候,将用户输入的对话内容进行删除。其中,所述至少将所述词标注结果作为所述预先训练的意图识别模型的输入,得到多个候选意图及其对应的可信度,包括:从会话数据库中获取所述对话内容;将所述词标注结果和所述对话内容输入预先训练的意图识别模型的,得到多个候选意图及其对应的可信度。其中,所述依据所述目标意图对应的目标意图模板,判断所述词标注结果中各关键词是否完整,包括:获取所述目标意图模板中配置的全部意图参数;采用所述词标注结果中的各关键词的词类型,为所述目标意图模板中的全部意图参数进行赋值,并判断所述全部意图参数是否能赋值成功。其中,所述意图模板通过以下方式生成:依据领域内各本体所表示出的各实体之间的关系,确定各领域内所有问句的意图;所述意图用于表述问句的询问目的,所述意图包括:询问实体的属性,询问实体之间的所有关系,通过实体的一个或多个属性询问该实体的其他属性或所有属性,和/或,通过实体的一个或多个属性询问该实体的关系;为确定的各意图配置对应的意图模板,所述意图模板包括:模板标识,模板描述,意图参数及意图参数对应的参数问题,意图对应的例句组,以及,各例句组的组合规则;所述模板标识用于唯一表示一个意图模板,所述模板描述用于描述所述意图模板的目的;所述意图参数为确定一本文档来自技高网...

【技术保护点】
1.一种自然语言问句答案的生成方法,其特征在于,该方法包括:响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,所述词标注结果包括:所述问句的各分词是否为关键词以及各关键词的词类型;依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图;依据预先配置的、与所述目标意图对应的目标意图模板,获取所述目标意图对应的目标答案。

【技术特征摘要】
1.一种自然语言问句答案的生成方法,其特征在于,该方法包括:响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,所述词标注结果包括:所述问句的各分词是否为关键词以及各关键词的词类型;依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图;依据预先配置的、与所述目标意图对应的目标意图模板,获取所述目标意图对应的目标答案。2.根据权利要求1所述的方法,其特征在于,所述响应于触发问句,至少依据预先训练的关键词提取模型对所述问句进行标注得到词标注结果,包括:对所述问句进行分词,得到所述问句的分词集合;基于所述问句所属的领域对应的领域词典,对所述分词集合中的各分词进行关键词标记得到第一标记结果;以及,基于预先训练的关键词提取模型,对所述分词集合中的各分词进行关键词标记得到第二标记结果;所述领域词典用于保存各领域词及其对应的词类型之间的对应关系;依据所述第一标记结果和第二标记结果,确定所述分词集合中的各分词的词标注结果。3.根据权利要求2所述的方法,其特征在于,所述依据所述第一标记结果和第二标记结果,确定所述分词集合中的各分词的词标注结果,包括:针对分词集合中的各分词,判断所述第一标记结果和第二标记结果是否都标注为关键词,如果是,则将该分词确定为关键词,并依据所述第一标记结果或第二标记结果确定所述关键词的词类型;如果第一标记结果标注为关键词而第二标记结果标注为非关键词,则将该分词确定为非关键词。4.根据权利要求2所述的方法,其特征在于,所述领域词典通过以下方式生成:获取领域内各实体的各属性;将所述各属性对应的属性值作为关键词,并将实体标签和属性名作为关键词的词类型,以及,将所述关键词的关联词汇也确定为关键词,所述关联词汇包括:同义词、近义词、口语表达词和别名。5.根据权利要求1所述的方法,其特征在于,所述依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图,包括:将所述词标注结果作为所述预先训练的意图识别模型的输入,得到多个候选意图及对应的可信度;将所述多个候选意图中可信度最高的候选意图确定为当前意图;依据所述当前意图对应的当前意图模板,判断所述词标注结果中各关键词是否完整;所述意图模板包括:确定一意图所需要的全部意图参数;如果完整,则将所述当前意图确定为目标意图;如果不完整,则按照可信度从高到底的顺序选择下一个候选意图作为当前意图,并执行所述依据所述当前意图对应的当前意图模板,判断所述词性标注结果中各关键词是否完整的步骤,直至所述多个候选意图都选择完毕。6.根据权利要求5所述的方法,其特征在于,所述依据所述当前意图对应的当前意图模板,判断所述词标注结果中各关键词是否完整,包括:获取所述当前意图模板中配置的全部意图参数;采用所述词标注结果中的各关键词的词类型,为所述全部意图参数进行赋值,并判断所述全部意图参数是否能赋值成功。7.根据权利要求1所述的方法,其特征在于,所述依据所述词标注结果和预先训练的意图识别模型,确定所述问句的目标意图,包括:至少将所述词标注结果作为所述预先训练的意图识别模型的输入,得到多个候选意图及其对应的可信度;将所述多个候选意图中可信度最高的候选意图确定为当前意图;判断所述当前意图的可信度是否大于预设可信度阈值,如果大于,则将所述当前意图确定为所述目标意图;如果不大于,则选取预设个数的前若干个候选意图作为待选择意图,并将所述待选择意图发送至终端以供用户选择,以及,将所述终端返回的、用户选择的意图确定为目标意图;依据所述目标意图对应的目标意图模板,判断所述词标注结果中各关键词是否完整,如果不完整,则将不完整的关键词对应的意图参数确定为缺少的意图参数;依据所述缺少的意图参数和所述目标意图模板,生成所述目标意图相关的参数问题;将所述参数问题返回给客户端以便显示给用户;所述意图模板包括:所述意图参数和参数问题之间的对应关系;根据所述客户端返回的、用户输入的参数答案获取所述缺少的意图参数。8.根据权利要求7所述的方法,其特征在于,还包括:将用户输入的对话内容保存至会话数据库中,所述对话内容包括:用户选择的意图和/或用户输入的参数答案。9.根据权利要求8所述的方法,其特征在于,还包括:对所述会话数据库中的对话内容进行更新,或者,在到达预设的时间周期的时候,将用户输入的对话内容进行删除。10.根据权利要求8所述的方法,其特征在于,所述至少将所述词标注结果作为所述预先训练的意图识别模型的输入,得到多个候选意图及其对应的可信度,包括:从会话数据库中获取所述对话内容;将所述词标注结果和所述对话内容输入预先训练的意图识别模型的,得到多个候选意图及其对应的可信度。11.根据权利要求7所述的方法,其特征在于,所述依据所述目标意图对应的目标意图模板,判断所述词标注结果中各关键词是否完整,包括:获取所述目标意图模板中配置的全部意图参数;采用所述词标注结果中的各关键词的词类型,为所述目标意图模板中的全部意图参数进行赋值,并判断所述全部意图参数是否能赋值成功。12.根据权利要求1所述的方法,其特征在于,所述意图模板通过以下方式生成:依据领域内各本体所表示出的各实体之间的关系,确定各领域内所有问句的意图;所述意图用于表述问句的询问目的,所述意图包括:询问实体的属性,询问实体之间的所有关系,通过实体的一个或多个属性询问该实体的其他属性或所有属性,和/或,通过实体的一个或多个属性询问该实体的关系;为确定的各意图配置对应的意图模板,所述意图模板包括:模板标识,模板描述,意图参数及意图参数对应的参数问题,意图对应的例句组,以及,各例句组的组合规则;所述模板标识用于唯一表示一个意图模板,所述模板描述用于描述所述意图模板的目的;所述意图参数为确定一个意图所对应的参数,所述参数问题为:对应的意图参数缺失时需要向用户发送的问题,所述例句组中的例句包...

【专利技术属性】
技术研发人员:张增明姜飞俊陈永健汪洋胡于响沈慧王成龙杨洋
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1