数据查询方法、装置及计算机可读介质制造方法及图纸

技术编号:27250383 阅读:16 留言:0更新日期:2021-02-04 12:26
本发明专利技术提供了数据查询方法、装置及计算机可读介质。预先将每个数据表格拆分成主对象和子对象,并利用数据表格对应的主键对所述主对象和所述子对象进行数据重构;确定要进行数据查询的目标数据表格;确定用户输入的搜索词;根据待参考的分词库对所述搜索词进行分词,其中,所述分词库中包括至少一个标准词汇,每一个所述标准词汇根据用于构成数据表格的主键得到;对分词后的所述搜索词进行相似度计算,从至少一个所述标准词汇中确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇;根据所述目标标准词汇在所述目标数据表格的所述主对象和所述子对象中查找并返回至少一条数据。本发明专利技术的方案能够提高数据查询的效率。率。率。

【技术实现步骤摘要】
数据查询方法、装置及计算机可读介质


[0001]本专利技术涉及查询
,特别涉及数据查询方法、装置及计算机可读介质。

技术介绍

[0002]系统数据库中包含若干个数据表格,其中存在着大量的数据,在需要查看数据表时,需要输入查询条件来进行查询。
[0003]目前,用户在需要查看数据表格中的某条数据时,需要输入查询的准确条件。然而,在记不清要查询数据的准确条件时,由于数据量较大且具有相似性,导致查询效率低且工作量大。
[0004]因此,需要一种效率更高的数据查询方法。

技术实现思路

[0005]本专利技术实施例提供了数据查询方法、装置及计算机可读介质,能够提高数据查询的效率。
[0006]第一方面,本专利技术实施例提供了数据查询方法,包括:预先将每个数据表格拆分成主对象和子对象,并利用数据表格对应的主键对所述主对象和所述子对象进行数据重构;
[0007]还包括;
[0008]确定要进行数据查询的目标数据表格;
[0009]确定用户输入的搜索词;
[0010]根据待参考的分词库对所述搜索词进行分词,其中,所述分词库中包括至少一个标准词汇,每一个所述标准词汇根据用于构成数据表格的主键得到;
[0011]对分词后的所述搜索词进行相似度计算,从至少一个所述标准词汇中确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇;
[0012]根据所述目标标准词汇在所述目标数据表格的所述主对象和所述子对象中查找并返回至少一条数据。
[0013]优选地,
[0014]所述利用数据表格对应的主键对所述主对象和所述子对象进行数据重构,包括:
[0015]将所述数据表格拆分成两个表格,所述两个表格中包括用于存储非重复数据的主对象和用于存储重复数据的子对象;
[0016]对于所述数据表格中的数据,执行:
[0017]对于所述数据表格中相同的至少两条数据,在所述子对象中存储一条该数据并建立该数据与所述相同的至少两条数据的至少两个主键的对应关系;
[0018]对于所述数据表格中与其他数据不相同的数据,在所述主对象中存储该数据并建立该数据与其主键的对应关系。
[0019]优选地,
[0020]确定对分词后的所述搜索词进行相似度计算,从至少一个所述标准词汇中确定与
所述搜索词相似度大于预设阈值的至少一个目标标准词汇,包括:
[0021]对分词后的所述搜索词与每个标准词汇计算第一相似度;
[0022]对分词后的所述搜索词和与每个标准词汇进行字音转换并计算第二相似度;
[0023]对所述分词后的所述搜索词进行同义词扩展,计算所述同义词与每个标准词汇的第三相似度;
[0024]确定所述第一相似度、所述第二相似度和所述第三相似度分别所占的权重;
[0025]根据所述第一相似度、所述第二相似度和所述第三相似度分别的权重进行加权求和得到每个所述标准词汇与所述搜索词的相似度得分;
[0026]确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇。
[0027]优选地,
[0028]所述根据所述目标标准词汇在所述目标数据表格的所述主对象和所述子对象中查找并返回至少一条数据,包括:
[0029]从所述主对象中查找主键包括所述目标标准词汇的至少一条目标非重复数据;
[0030]从所述子对象中查找主键包括所述目标标准词汇的至少一条目标重复数据;
[0031]返回所述至少一条目标非重复数据和至少一条目标所述重复数据。
[0032]第二方面,本专利技术实施例提供了数据查询装置,包括:
[0033]拆分模块、确定模块、分词模块、计算模块和查找模块;
[0034]所述拆分模块,用于预先将每个数据表格拆分成主对象和子对象,并利用数据表格对应的主键对所述主对象和所述子对象进行数据重构;
[0035]所述确定模块,用于确定要进行数据查询的目标数据表格;确定用户输入的搜索词;
[0036]所述分词模块,用于根据待参考的分词库对所述搜索词进行分词,其中,所述分词库中包括至少一个标准词汇,每一个所述标准词汇根据用于构成数据表格的主键得到;
[0037]所述计算模块,用于对分词后的所述搜索词进行相似度计算,从至少一个所述标准词汇中确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇;
[0038]所述查找模块,用于根据所述目标标准词汇在所述目标数据表格的所述主对象和所述子对象中查找并返回至少一条数据。
[0039]优选地,
[0040]所述拆分模块,用于对于所述数据表格中的数据,执行:
[0041]对于所述数据表格中相同的至少两条数据,在所述子对象中存储一条该数据并建立该数据与所述相同的至少两条数据的至少两个主键的对应关系;
[0042]对于所述数据表格中与其他数据不相同的数据,在所述主对象中存储该数据并建立该数据与其主键的对应关系。
[0043]优选地,
[0044]所述计算模块,用于执行:
[0045]对分词后的所述搜索词与每个标准词汇计算第一相似度;
[0046]对分词后的所述搜索词和与每个标准词汇进行字音转换并计算第二相似度;
[0047]对所述分词后的所述搜索词进行同义词扩展,计算所述同义词与每个标准词汇的第三相似度;
[0048]确定所述第一相似度、所述第二相似度和所述第三相似度分别所占的权重;
[0049]根据所述第一相似度、所述第二相似度和所述第三相似度分别的权重进行加权求和得到每个所述标准词汇与所述搜索词的相似度得分;
[0050]确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇。
[0051]优选地,
[0052]所述查找模块,用于执行:
[0053]从所述主对象中查找主键包括所述目标标准词汇的至少一条目标非重复数据;
[0054]从所述子对象中查找主键包括所述目标标准词汇的至少一条目标重复数据;
[0055]返回所述至少一条目标非重复数据和至少一条目标所述重复数据。
[0056]第三方面,本专利技术实施例提供了数据查询装置,包括:至少一个存储器和至少一个处理器;
[0057]所述至少一个存储器,用于存储机器可读程序;
[0058]所述至少一个处理器,用于调用所述机器可读程序,执行上述第一方面中任一提供的方法。
[0059]第四方面,本专利技术实施例提供了计算机可读介质,所述计算机可读介质上存储有计算机指令,所述计算机指令在被处理器执行时,使所述处理器执行上述第一方面中任一提供的方法。
[0060]本专利技术实施例提供了数据查询方法、装置及计算机可读介质。由上述技术方案可知,预先将每个数据表格拆分成主对象和子对象,并利用数据表格对应的主键对所述主对象和所述子对象进行数据重构;确定要进行数据查询的目标数据表格;确定用户输入的搜索词;根据待参考的分词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.数据查询方法,其特征在于,包括:预先将每个数据表格拆分成主对象和子对象,并利用数据表格对应的主键对所述主对象和所述子对象进行数据重构;还包括;确定要进行数据查询的目标数据表格;确定用户输入的搜索词;根据待参考的分词库对所述搜索词进行分词,其中,所述分词库中包括至少一个标准词汇,每一个所述标准词汇根据用于构成数据表格的主键得到;对分词后的所述搜索词进行相似度计算,从至少一个所述标准词汇中确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇;根据所述目标标准词汇在所述目标数据表格的所述主对象和所述子对象中查找并返回至少一条数据。2.根据权利要求1所述的方法,其特征在于,所述利用数据表格对应的主键对所述主对象和所述子对象进行数据重构,包括:将所述数据表格拆分成两个表格,所述两个表格中包括用于存储非重复数据的主对象和用于存储重复数据的子对象;对于所述数据表格中的数据,执行:对于所述数据表格中相同的至少两条数据,在所述子对象中存储一条该数据并建立该数据与所述相同的至少两条数据的至少两个主键的对应关系;对于所述数据表格中与其他数据不相同的数据,在所述主对象中存储该数据并建立该数据与其主键的对应关系。3.根据权利要求1所述的方法,其特征在于,确定对分词后的所述搜索词进行相似度计算,从至少一个所述标准词汇中确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇,包括:对分词后的所述搜索词与每个标准词汇计算第一相似度;对分词后的所述搜索词和与每个标准词汇进行字音转换并计算第二相似度;对所述分词后的所述搜索词进行同义词扩展,计算所述同义词与每个标准词汇的第三相似度;确定所述第一相似度、所述第二相似度和所述第三相似度分别所占的权重;根据所述第一相似度、所述第二相似度和所述第三相似度分别的权重进行加权求和得到每个所述标准词汇与所述搜索词的相似度得分;确定与所述搜索词相似度大于预设阈值的至少一个目标标准词汇。4.根据权利要求1-3中任一所述的方法,其特征在于,所述根据所述目标标准词汇在所述目标数据表格的所述主对象和所述子对象中查找并返回至少一条数据,包括:从所述主对象中查找主键包括所述目标标准词汇的至少一条目标非重复数据;从所述子对象中查找主键包括所述目标标准词汇的至少一条目标重复数据;返回所述至少一条目标非重复数据和至少一条目标所述重复数据。5.数据查询装置,其特征在于,包括:拆分模块、确定模块、分词模块、计算模块和查找模块;...

【专利技术属性】
技术研发人员:张诗文王晨旭陈康龙
申请(专利权)人:山东浪潮通软信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1