本发明专利技术提供了一种结构化数据与非结构化数据的转换查询方法及系统,通过对结构化业务数据进行数据结构分析与存储规则分析,得到对非结构化数据对应的转换规则,通过转换规则,提高了结构化数据与非结构化数据之间的转换效率。另外,本发明专利技术通过查询条件先检索非结构化数据,并将非结构化数据转换为对应的结构化数据作为查询结果,大大提高了查询结构化数据的效率,实现了结构化数据高效查询的目的。实现了结构化数据高效查询的目的。实现了结构化数据高效查询的目的。
【技术实现步骤摘要】
一种结构化数据与非结构化数据的转换查询方法及系统
[0001]本专利技术涉及数据查询及转化领域,更具体的,涉及一种结构化数据与非结构化数据的转换查询方法及系统。
技术介绍
[0002]随着企业的发展,企业内各业务系统中的数据量越来越大,各种查询场景越来越复杂,使用传统关系型数据库的低效率查询方式俨然已经不能满足当下大数据前提下的查询任务。在进行大任务量查询数据数时,系统负载越来越高,每种业务场景用到的结构化数据的种类越来越多,而用户对系统的性能要求也变得越来越高。
[0003]因此,如何高效快速地从海量的结构化数据中查询满足任意组合条件的数据是当下亟待解决的问题。
技术实现思路
[0004]为了解决上述至少一个技术问题,本专利技术提出了一种结构化数据与非结构化数据的转换查询。
[0005]本专利技术第一方面提供了一种结构化数据与非结构化数据的转换查询方法,包括:通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则;根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据;将非结构化业务数据进行语义分词与创建索引,并保存索引得到查询索引表;获取查询条件信息,根据查询条件信息进行数据检索得到结构化结果数据。
[0006]本方案中,所述通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则,具体为:通过业务系统从数据库中获取用户数据,产品数据,行为数据;将所述用户数据,产品数据,行为数据进行数据结构化转换,得到结构化业务数据;将结构化业务数据进行数据结构与数据关系分析,得到对应数据存储规则。
[0007]本方案中,所述根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据,具体为:将结构化业务数据进行特征分析,得到结构数据特征信息;获取非结构数据特征信息,将结构数据特征信息与非结构数据特征信息进行对比分析,得到结构转换规则;根据结构转换规则将结构化业务数据进行非结构化转换得到非结构化业务数据。
[0008]本方案中,所述根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据,还包括:获取非结构化业务数据;
将非结构化业务数据进行数据类型划分,得到非结构化的用户数据,产品数据,行为数据;将非结构化的用户数据,产品数据,行为数据分别进行结构特征分析与结构转化,得到对应的用户数据转化规则,产品数据转化规则,行为数据转化规则;将所述户数据转化规则,产品数据转化规则,行为数据转化规则进行信息合并整理得到非结构转换规则。
[0009]本方案中,所述将非结构化数据进行语义分词与创建索引,并保存索引得到查询索引表,具体为:获取结构化业务数据中的历史查询数据记录;根据历史查询数据记录进行统计分析,得到数据频率排序查询表;将非结构化数据进行语义分词与创建索引得到初始索引表;根据初始索引表结合数据频率排序查询表,对初始索引表进行索引分类得到关键索引表与普通索引表;将关键索引表与普通索引表进行合并得到查询索引表。
[0010]本方案中,所述获取查询条件信息,根据查询条件信息进行数据检索得到结构化结果数据,具体为:根据查询条件信息进行查询数据特征分析,得到查询数据特征信息;根据查询数据特征信息进行索引分析,得到索引分类信息;根据索引分类信息从查询索引表进行索引查询,得到结果索引值。
[0011]本方案中,所述获取查询条件信息,根据查询条件信息进行数据检索得到结构化结果数据,具体为:根据结果索引值从非结构化数据中进行数据获取,得到非结构化结果数据;获取对应的非结构转换规则,根据非结构转换规则,将非结构化结果数据转换为结构化结果数据,并将所述结构化结果数据作为最终查询结果数据。
[0012]本专利技术第二方面还提供了一种结构化数据与非结构化数据的转换查询系统,该系统包括:存储器、处理器,所述存储器中包括结构化数据与非结构化数据的转换查询方法程序,所述结构化数据与非结构化数据的转换查询方法程序被所述处理器执行时实现如下步骤:通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则;根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据;将非结构化业务数据进行语义分词与创建索引,并保存索引得到查询索引表;获取查询条件信息,根据查询条件信息进行数据检索得到结构化结果数据。
[0013]本方案中,所述通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则,具体为:通过业务系统从数据库中获取用户数据,产品数据,行为数据;将所述用户数据,产品数据,行为数据进行数据结构化转换,得到结构化业务数据;将结构化业务数据进行数据结构与数据关系分析,得到对应数据存储规则。
[0014]本方案中,所述将非结构化数据进行语义分词与创建索引,并保存索引得到查询索引表,具体为:获取结构化业务数据中的历史查询数据记录;根据历史查询数据记录进行统计分析,得到数据频率排序查询表;将非结构化数据进行语义分词与创建索引得到初始索引表;根据初始索引表结合数据频率排序查询表,对初始索引表进行索引分类得到关键索引表与普通索引表;将关键索引表与普通索引表进行合并得到查询索引表。
[0015]本专利技术提供了一种结构化数据与非结构化数据的转换查询方法及系统,通过对结构化业务数据进行数据结构分析与存储规则分析,得到对非结构化数据对应的转换规则,通过转换规则,提高了结构化数据与非结构化数据之间的转换效率。另外,本专利技术通过查询条件先检索非结构化数据,并将非结构化数据转换为对应的结构化数据作为查询结果,大大提高了查询结构化数据的效率,实现了结构化数据高效查询的目的。
附图说明
[0016]图1示出了本专利技术一种结构化数据与非结构化数据的转换查询方法的流程图;图2示出了本专利技术获取数据存储规则流程图;图3示出了本专利技术获取非结构化业务数据流程图;图4示出了本专利技术一种结构化数据与非结构化数据的转换查询系统的框图。
具体实施方式
[0017]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0018]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用其他不同于在此描述的其他方式来实施,因此,本专利技术的保护范围并不受下面公开的具体实施例的限制。
[0019]图1示出了本专利技术一种结构化数据与非结构化数据的转换查询方法的流程图。
[0020]如图1所示,本专利技术第一方面提供了一种结构化数据与非结构化数据的转换查询方法,包括:S102,通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则;S104,根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据;S106,将非结构化业务数据进行语义分词与创建索引,并保存索引得到查询索引表本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种结构化数据与非结构化数据的转换查询方法,其特征在于,包括:通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则;根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据;将非结构化业务数据进行语义分词与创建索引,并保存索引得到查询索引表;获取查询条件信息,根据查询条件信息进行数据检索得到结构化结果数据。2.根据权利要求1所述的一种结构化数据与非结构化数据的转换查询方法,其特征在于,所述通过业务系统获取结构化业务数据,根据业务数据获取对应的数据存储规则,具体为:通过业务系统从数据库中获取用户数据,产品数据,行为数据;将所述用户数据,产品数据,行为数据进行数据结构化转换,得到结构化业务数据;将结构化业务数据进行数据结构与数据关系分析,得到对应数据存储规则。3.根据权利要求2所述的一种结构化数据与非结构化数据的转换查询方法,其特征在于,所述根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据,具体为:将结构化业务数据进行特征分析,得到结构数据特征信息;获取非结构数据特征信息,将结构数据特征信息与非结构数据特征信息进行对比分析,得到结构转换规则;根据结构转换规则将结构化业务数据进行非结构化转换得到非结构化业务数据。4.根据权利要求3所述的一种结构化数据与非结构化数据的转换查询方法,其特征在于,所述根据数据存储规则,将结构化业务数据进行非结构化转换,并得到结构转换规则与非结构化业务数据,还包括:获取非结构化业务数据;将非结构化业务数据进行数据类型划分,得到非结构化的用户数据,产品数据,行为数据;将非结构化的用户数据,产品数据,行为数据分别进行结构特征分析与结构转化,得到对应的用户数据转化规则,产品数据转化规则,行为数据转化规则;将所述户数据转化规则,产品数据转化规则,行为数据转化规则进行信息合并整理得到非结构转换规则。5.根据权利要求4所述的一种结构化数据与非结构化数据的转换查询方法,其特征在于,所述将非结构化数据进行语义分词与创建索引,并保存索引得到查询索引表,具体为:获取结构化业务数据中的历史查询数据记录;根据历史查询数据记录进行统计分析,得到数据频率排序查询表;将非结构化数据进行语义分词与创建索引得到初始索引表;根据初始索引表结合数据频率排序查询表,对初始索引表进行索引分类得到关键索引表与普通索引表;将关键索引表与普通索引表进行...
【专利技术属性】
技术研发人员:李守强,解万志,臧言科,王行真,王鑫,
申请(专利权)人:普联软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。