自然语言提问的理解方法、装置及电子设备制造方法及图纸

技术编号:18115143 阅读:27 留言:0更新日期:2018-06-03 08:18
本发明专利技术提供一种自然语言提问的理解方法、装置及电子设备,涉及自然语言处理技术领域,其中,自然语言提问的理解方法包括:获取用户端输入的自然语言提问信息;自然语言提问信息为与数据查询相关的提问信息;对自然语言提问信息进行解析,得到最小解析单元;基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令;根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果;预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。该方法能够对自然语言提问信息进行准确的识别,并匹配出高准确度的数据结果,可以应用于数据分析领域等专业的场景。

【技术实现步骤摘要】
自然语言提问的理解方法、装置及电子设备
本专利技术涉及自然语言处理
,尤其是涉及一种自然语言提问的理解方法、装置及电子设备。
技术介绍
自然语言处理是一项被人类长期关注并研究的技术,目前该技术主要应用于多语言翻译、信息查询等多个领域,并且均有很好的进展,然而将自然语言处理直接运用在数据分析上国内尚无先例。自然语言处理分为多种不同的技术流派,一开始,基于形式语言的自然语言处理方法居主流地位,但这种技术路线无法处理富于变化的表达方法,只能机械的按照某些写好的模板或规则对语言进行翻译或生成,显得非常生硬。之后,出现了将统计数学理论引入语言处理的方式,比如,当前谷歌翻译、百度翻译等大部分机器翻译系统均是在此类系统的基础上开发而成。这种基于统计理论的自然语言处理方法,可以有效的运用大量的语料库对模型进行训练,从而习得各种语言表达的变化形式。目前在多语言翻译上表现是很好的。但是这种技术路线仍然存在如下缺陷:(1)如果某些场景没有大量的语料积累,其识别性能就大打折扣;(2)通过统计方法训练出来的模型,不具有精确性,难以表达或解析准确的含义。因此,现有的自然语言处理方法无法运用于一些很专业的场景,比如数据分析领域。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种自然语言提问的理解方法、装置及电子设备,能够对用户的自然语言提问信息进行准确的识别,并匹配出高准确度的数据结果,可以应用于数据分析领域等专业的场景。第一方面,本专利技术实施例提供了一种自然语言提问的理解方法,包括:获取用户端输入的自然语言提问信息;自然语言提问信息为与数据查询相关的提问信息;对自然语言提问信息进行解析,得到最小解析单元;基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令;根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果;预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,对自然语言提问信息进行解析,得到最小解析单元,具体包括:对自然语言提问信息进行分词处理,得到多个分词片段;对多个分词片段进行实体名词识别,得到最小解析单元;最小解析单元包括:属性最小解析单元、度量最小解析单元及时间修饰结构词。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,属性最小解析单元包括属性项、计算操作项、属性逻辑关系项中至少一项;度量最小解析单元包括度量项、度量逻辑关系项、计算修饰项中至少一项。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令,具体包括:根据最小解析单元推断自然语言提问信息所包含的数据查询逻辑;根据数据查询逻辑,从预设指令集中提取相应指令进行组合,生成自然语言提问信息对应的查询指令。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,在根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果之前,还包括:获取知识库样本数据;知识库样本数据包括:用户提供的数据库数据、用户的输入信息数据和/或第三方数据;根据知识库样本数据,生成预设知识库。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,在根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果后,还包括:将自然语言提问信息及其对应的数据结果添加至预设知识库中。第二方面,本专利技术实施例提供一种自然语言提问的理解装置,包括:信息获取模块,用于获取用户端输入的自然语言提问信息;自然语言提问信息为与数据查询相关的提问信息;信息解析模块,用于对自然语言提问信息进行解析,得到最小解析单元;指令生成模块,用于基于最小解析单元以及预设指令集,生成自然语言提问信息对应的查询指令;检索模块,用于根据查询指令从预设知识库中进行检索,得到自然语言提问信息对应的数据结果;预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。结合第二方面,本专利技术实施例提供了第二方面的第一种可能的实施方式,其中,信息解析模块包括:分词模块,用于对自然语言提问信息进行分词处理,得到多个分词片段;识别模块,用于对多个分词片段进行实体名词识别,得到最小解析单元;最小解析单元包括:属性最小解析单元、度量最小解析单元及时间修饰结构词。第三方面,本专利技术实施例还提供一种电子设备,包括存储器、处理器,存储器上存储有可在处理器上运行的计算机程序,处理器执行计算机程序时实现第一方面所述的方法的步骤。第四方面,本专利技术实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,程序代码使处理器执行第一方面所述的方法。本专利技术实施例带来了以下有益效果:在本专利技术实施例提供的自然语言提问的理解方法中,首先对自然语言提问信息进行解析,得到最小解析单元,然后基于最小解析单元以及预设的指令集,构造出该自然语言提问信息的查询语句,进而依据该查询语句从预先建立的知识库中进行检索,得到该提问信息对应的数据结果,该方法中,知识库的建立基于用户提供的数据库数据、用户的输入信息数据和/或第三方数据,可以为提问信息提供准确的、经过计算统计之后得到的数据结果,从而使得该方法可以应用于数据分析领域等专业的场景本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种自然语言提问的理解方法的流程图;图2为本专利技术实施例提供的另一种自然语言提问的理解方法的流程图;图3为本专利技术实施例提供的另一种自然语言提问的理解方法的流程图;图4为本专利技术实施例提供的另一种自然语言提问的理解方法的流程图;图5为本专利技术实施例提供的另一种自然语言提问的理解方法的流程图;图6为本专利技术实施例提供的一种自然语言提问的理解装置的结构示意图;图7为本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。目前现有的自然语言处理方法存在如下缺陷:(1)如果某些场景没有大量的语料积累,其识别性能就大打折扣;(2)通过统计方法训练出来的模型,不具有精确性,难以表达或解析准确的含义。因此,无法运用于一些很专业的场景,比如数据分析领域。基于此,本专利技术实施例提供的一种自然语言提问的理解方法、装置及电子设备,能够对用户的自然语本文档来自技高网...
自然语言提问的理解方法、装置及电子设备

【技术保护点】
一种自然语言提问的理解方法,其特征在于,包括:获取用户端输入的自然语言提问信息;所述自然语言提问信息为与数据查询相关的提问信息;对所述自然语言提问信息进行解析,得到最小解析单元;基于所述最小解析单元以及预设指令集,生成所述自然语言提问信息对应的查询指令;根据所述查询指令从预设知识库中进行检索,得到所述自然语言提问信息对应的数据结果;所述预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。

【技术特征摘要】
1.一种自然语言提问的理解方法,其特征在于,包括:获取用户端输入的自然语言提问信息;所述自然语言提问信息为与数据查询相关的提问信息;对所述自然语言提问信息进行解析,得到最小解析单元;基于所述最小解析单元以及预设指令集,生成所述自然语言提问信息对应的查询指令;根据所述查询指令从预设知识库中进行检索,得到所述自然语言提问信息对应的数据结果;所述预设知识库根据用户提供的数据库数据、用户的输入信息数据和/或第三方数据生成。2.根据权利要求1所述的方法,其特征在于,所述对所述自然语言提问信息进行解析,得到最小解析单元,具体包括:对所述自然语言提问信息进行分词处理,得到多个分词片段;对所述多个分词片段进行实体名词识别,得到最小解析单元;所述最小解析单元包括:属性最小解析单元、度量最小解析单元及时间修饰结构词。3.根据权利要求2所述的方法,其特征在于,所述属性最小解析单元包括属性项、计算操作项、属性逻辑关系项中至少一项;所述度量最小解析单元包括度量项、度量逻辑关系项、计算修饰项中至少一项。4.根据权利要求1所述的方法,其特征在于,所述基于所述最小解析单元以及预设指令集,生成所述自然语言提问信息对应的查询指令,具体包括:根据所述最小解析单元推断所述自然语言提问信息所包含的数据查询逻辑;根据所述数据查询逻辑,从预设指令集中提取相应指令进行组合,生成所述自然语言提问信息对应的查询指令。5.根据权利要求1所述的方法,其特征在于,在所述根据所述查询指令从预设知识库中进行检索,得到所述自然语言提问信息对应的数据结果之前,还包括:获取知识库样本数据;所述知识库样本数据包括:用户提供的...

【专利技术属性】
技术研发人员:王碧波董雪梅
申请(专利权)人:杭州网蛙科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1