一种结构化查询语句的生成方法、装置和设备制造方法及图纸

技术编号:28558737 阅读:17 留言:0更新日期:2021-05-25 17:53
本说明书实施例提供了一种结构化查询语句的生成方法、装置和设备,涉及大数据技术领域,其中,该方法包括:获取目标文本;基于所述目标文本生成目标依存句法树;基于所述目标依存句法树,确定所述目标文本的语义依存结构;利用所述语义依存结构,确定结构化查询参数集;其中,所述结构化查询参数集中包含所述目标文本对应的多个生成结构化查询语句所需的结构化查询参数值;根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句。在本说明书实施例中,可以基于语义依存结构准确地生成目标文本的结构化查询语句,使得非技术背景的业务人员也可以便捷地利用结构化查询语句来访问大数据。

【技术实现步骤摘要】
一种结构化查询语句的生成方法、装置和设备
本说明书实施例涉及大数据
,特别涉及一种结构化查询语句的生成方法、装置和设备。
技术介绍
随着大数据技术的迅速发展和广泛应用,数据已经成为生产要素之一。许多业务人员的日常工作已经离不开大数据,通过结构化查询语句查询数据湖的场景越来越多,许多非技术背景的业务人员也需要通过编写结构化查询语句来访问大数据,以获得所需要的信息。然而编写结构化查询语句对于非技术背景的业务人员来说不是一件轻松的事情,需要一个学习过程才能熟练掌握,从而给很多业务人员带来了不便。现有技术中通常是基于语法分析技术生成结构化查询语句,但是由于语法结构的多样性,当用户输入不同语法结构的句子时,系统可能无法跨越句子表层语法结构的束缚正确理解其深层语义信息,从而生成正确的结构化查询语句。由此可见,采用现有技术中的技术方案无法准确地基于用户输入的语句生成对应的结构化查询语句。针对上述问题,目前尚未提出有效的解决方案。
技术实现思路
本说明书实施例提供了一种结构化查询语句的生成方法、装置和设备,以解决现有技术中无法准确地基于用户输入的语句生成对应的结构化查询语句的问题。本说明书实施例提供了一种结构化查询语句的生成方法,包括:获取目标文本;基于所述目标文本生成目标依存句法树;基于所述目标依存句法树,确定所述目标文本的语义依存结构;其中,所述语义依存结构用于表征所述目标文本中各成分之间的语义关联;利用所述语义依存结构,确定结构化查询参数集;其中,所述结构化查询参数集中包含所述目标文本对应的多个生成结构化查询语句所需的结构化查询参数值;根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句。本说明书实施例还提供了一种结构化查询语句的生成装置,包括:获取模块,用于获取目标文本;转换模块,用于基于所述目标文本生成目标依存句法树;第一确定模块,用于基于所述目标依存句法树,确定所述目标文本的语义依存结构;其中,所述语义依存结构用于表征所述目标文本中各成分之间的语义关联;第二确定模块,用于利用所述语义依存结构,确定结构化查询参数集;其中,所述结构化查询参数集中包含所述目标文本对应的多个生成结构化查询语句所需的结构化查询参数值;生成模块,用于根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句。本说明书实施例还提供了一种结构化查询语句的生成设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述结构化查询语句的生成方法的步骤。本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述结构化查询语句的生成方法的步骤。本说明书实施例提供了一种结构化查询语句的生成方法,可以通过获取目标文,基于所述目标文本生成目标依存句法树,从而可以确定目标文本的句法结构。由于语义信息与句子的句法和词义信息有着密切的联系,因此,为了跨越句子表层语法结构的束缚获取深层语义信息,可以基于上述目标依存句法树进行语义依存分析,确定所述目标文本的语义依存结构,其中,上述语义依存结构用于表征所述目标文本中各成分之间的语义关联。进一步的,可以利用所述语义依存结构,确定目标文本对应的多个生成结构化查询语句所需的结构化查询参数值,得到结构化查询参数集。并根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句。从而可以基于语义依存结构准确地生成目标文本的结构化查询语句,使得非技术背景的业务人员也可以便捷地利用结构化查询语句来访问大数据。附图说明此处所说明的附图用来提供对本说明书实施例的进一步理解,构成本说明书实施例的一部分,并不构成对本说明书实施例的限定。在附图中:图1是根据本说明书实施例提供的结构化查询语句的生成方法的步骤示意图;图2是根据本说明书实施例具体实施例提供的语义依存结构的示意图;图3是根据本说明书实施例提供的结构化查询语句的生成装置的结构示意图;图4是根据本说明书实施例提供的结构化查询语句的生成设备的结构示意图。具体实施方式下面将参考若干示例性实施方式来描述本说明书实施例的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本说明书实施例,而并非以任何方式限制本说明书实施例的范围。相反,提供这些实施方式是为了使本说明书实施例公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。本领域的技术人员知道,本说明书实施例的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本说明书实施例公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。虽然下文描述流程包括以特定顺序出现的多个操作,但是应该清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。请参阅图1,本实施方式可以提供一种结构化查询语句的生成方法。该结构化查询语句的生成方法可以用于准确地基于目标文本生成对应的结构化查询语句。上述结构化查询语句的生成方法可以包括以下步骤。S101:获取目标文本。在本实施方式中,可以获取目标文本。上述目标文本可以为需要生成结构化查询语句的文本,可以是用户输入的也可以是系统自动抓取的,具体的可以根据实际情况确定,本说明书实施例对此不作限定。在本实施方式中,上述目标文本中可以包含至少两个字符,上述目标文本可以为一段自然语言,例如:我想查上海分行2020年的日均存款余额。当然,目标文本不限于上述举例,所属领域技术人员在本说明书实施例技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本说明书实施例相同或相似,均应涵盖于本说明书实施例保护范围内。在本实施方式中,获取目标文本的方式可以包括:接收用户输入的目标样本,或者,可以从预设数据库中拉取得到。其中,上述预设数据库可以为存储用户实时提交、产生的数据的数据库,获取的渠道可以是WEB(全球广域网)页面、电子邮件或其他用户界面。当然可以理解的是,还可以采用其它可能的方式获取上述样本数据集,例如,在WEB页面中按照一定的查找条件搜索目标文本,具体的可以根据实际情况确定,本说明书实施例对此不作限定。S102:基于目标文本生成目标依存句法树。在本实施方式中,可以对目标文本先进行依存句法分析,从而生成目标依存句法树。其中,句法分析(syntacticparsing)是自然语言处理中的关键技术之一,它是对输入的文本句子进行分析以得到句子的句法结构的处理过程。在本实施方式中,依存句法分析可以包括句法结构分析和依存关系分析,句法结构分析作用是识别出句子中的短语结构以及短语之间的层次句法关系,依存关系分析作用是识别句子中词汇与词汇之间的相互依存关系。依存句法分析可以将句子分析成一颗依存句法树,描述出各个词语之间的依存关系,也即指出了词语之间在本文档来自技高网...

【技术保护点】
1.一种结构化查询语句的生成方法,其特征在于,包括:/n获取目标文本;/n基于所述目标文本生成目标依存句法树;/n基于所述目标依存句法树,确定所述目标文本的语义依存结构;其中,所述语义依存结构用于表征所述目标文本中各成分之间的语义关联;/n利用所述语义依存结构,确定结构化查询参数集;其中,所述结构化查询参数集中包含所述目标文本对应的多个生成结构化查询语句所需的结构化查询参数值;/n根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句。/n

【技术特征摘要】
1.一种结构化查询语句的生成方法,其特征在于,包括:
获取目标文本;
基于所述目标文本生成目标依存句法树;
基于所述目标依存句法树,确定所述目标文本的语义依存结构;其中,所述语义依存结构用于表征所述目标文本中各成分之间的语义关联;
利用所述语义依存结构,确定结构化查询参数集;其中,所述结构化查询参数集中包含所述目标文本对应的多个生成结构化查询语句所需的结构化查询参数值;
根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句。


2.根据权利要求1所述的方法,其特征在于,基于所述目标文本生成目标依存句法树,包括:
对所述目标文本进行预处理,得到预处理结果;其中,所述预处理包括:分词和词性标注;
对所述预处理结果进行命名实体识别,得到识别结果;
根据所述预处理结果和所述识别结果进行语法成分分析,得到所述目标依存句法树。


3.根据权利要求2所述的方法,其特征在于,利用所述语义依存结构,确定结构化查询参数集,包括:
将所述语义依存结构转换为可扩展标记语言的格式,得到目标语义依存结构信息;
根据命名实体与结构化查询参数之间的对应关系,从预设知识图谱中查询所述目标语义依存结构信息包含的各个命名实体对应的结构化查询参数值,得到结构化查询参数集。


4.根据权利要求3所述的方法,其特征在于,所述结构化查询参数包括:表名、字段名、结构化查询函数名。


5.根据权利要求2所述的方法,其特征在于,根据所述结构化查询参数集和语义依存结构,生成所述目标文本对应的结构化查询语句,包括:
在确定所述结构化查询参数集中包含至少一个结构化查询参数值的情况下,根据所述结构化查询参数集和语义依存结构,生成...

【专利技术属性】
技术研发人员:陈剑
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1