【技术实现步骤摘要】
一种数据查询方法、装置、设备及可读存储介质
[0001]本说明书涉及计算机
,尤其涉及一种数据查询方法、装置、设备及可读存储介质。
技术介绍
[0002]随着数据的爆发式增长,数据库领域相关的技术受到了广泛的关注。其中,数据库为了方便数据管理可设置多个表存储数据,而如何快速得基于多个表确定查询结果一直以来都是数据库领域的研究重点。
[0003]为了提高在数据库中基于查询语句得到查询结果的效率,本说明书提供一种数据查询方法。
技术实现思路
[0004]本说明书提供一种数据查询方法、装置、设备及可读存储介质,以部分的解决现有技术存在的上述问题。
[0005]本说明书采用下述技术方案:
[0006]本说明书提供了一种数据查询方法,包括:
[0007]针对目标数据库生成奖励矩阵,所述奖励矩阵中包含表征不同状态下执行不同动作的奖励值,所述状态为已执行的动作的顺序,所述动作为查询所述目标数据库中的一个表;
[0008]确定当前状态,并根据所述当前状态确定至少一个候选动作;
[0009]针对每个候选动作,通过预先训练的神经网络预测在所述当前状态下执行该候选动作的奖励值,其中,根据所述已执行的动作以及所述候选动作查询到的查询结果的基数越少,奖励值越大;
[0010]根据确定出的奖励值更新所述奖励矩阵,并根据更新后的奖励矩阵从各候选动作中选择目标动作,将所述目标动作作为已执行的动作,并重新确定当前状态,根据重新确定的当前状态继续确定候选动作,直至达到预设结束 ...
【技术保护点】
【技术特征摘要】
1.一种数据查询方法,所述方法包括:针对目标数据库生成奖励矩阵,所述奖励矩阵中包含表征不同状态下执行不同动作的奖励值,所述状态为已执行的动作的顺序,所述动作为查询所述目标数据库中的一个表;确定当前状态,并根据所述当前状态确定至少一个候选动作;针对每个候选动作,通过预先训练的神经网络预测在所述当前状态下执行该候选动作的奖励值,其中,根据所述已执行的动作以及所述候选动作查询到的查询结果的基数越少,奖励值越大;根据确定出的奖励值更新所述奖励矩阵,并根据更新后的奖励矩阵从各候选动作中选择目标动作,将所述目标动作作为已执行的动作,并重新确定当前状态,根据重新确定的当前状态继续确定候选动作,直至达到预设结束条件为止,确定得到目标奖励矩阵;响应于目标查询语句,确定所述目标查询语句中包含的若干目标表;根据所述目标奖励矩阵,确定所述目标查询语句查询各目标表的顺序,并执行所述目标查询语句,得到查询结果。2.如权利要求1所述的方法,预先训练神经网络,具体包括:根据所述目标数据库生成查询语句,将所述查询语句中包含的各动作作为训练样本;在所述目标数据库中执行所述查询语句,得到所述训练样本在所述目标数据库中的查询结果的基数,作为所述训练样本的标签;将所述训练样本输入待训练的神经网络,得到所述神经网络输出的所述训练样本的预测基数;以所述预测基数与所述训练样本的标签之间的差异最小化为训练目标,训练所述神经网络。3.如权利要求1所述的方法,通过预先训练的神经网络预测在所述当前状态下执行该候选动作的奖励值,具体包括:当所述当前状态存在上一状态时,则根据所述奖励矩阵,确定在所述上一状态下执行动作所能获得的最大奖励值,并根据所述最大奖励值以及所述神经网络预测在所述当前状态下执行该候选动作的奖励值,确定该候选动作的奖励值;当所述当前状态不存在上一状态时,则通过所述神经网络预测在所述当前状态下执行该候选动作的奖励值。4.如权利要求1所述的方法,根据更新后的奖励矩阵从各候选动作中选择目标动作,具体包括:根据更新后的奖励矩阵中在所述当前状态下分别执行所述各候选动作的奖励值,确定奖励值最大的候选动作为目标动作。5.如权利要求1所述的方法,所述预设结束条件为所述奖励矩阵的更新次数达到预设次数。6.如权利要求1所述的方法,根据所述当前状态确定至少一个候选动作,具体包括:判断所述当前状态是否包含所有动作;若是,将初始状态作为当前状态,并根据所述奖励矩阵和所述当前状态确定至少一个候选动作;其中,所述初始状态为没有已执行的动作;若否,根据所述当前状态,在未执行的动作中确定在所述当前状态下的至少一个候选
动作。7.如权利要求6所述的方法,根据所述奖励矩阵和所述当前状态确定至少一个候选动作,具体包括:根据所述奖励矩阵,确定所述奖励矩阵的各状态的首位动作;判断是否存在未作为首位动作的动作;若是,则根据未作为首位动作的动作,确定候选动作;若否,根据所述奖励矩阵,确定首位动作相同的各状态的奖励更新次数,作为各首位动作的更新次数,按照各首位动作的更新次数从小到大的顺序,确定候选动作。8.如权利要求1所述的方法,根据所述当前状态确定至少一个候选动作,具体包括:获取所述目标数据库的表查询记录,确定各动作的执行频率;根据执行频率高于预设阈值的动作,确定候选动作。9.如权利要求8所述的方法,根据各目标表,根据所述目标奖励矩阵,确定所述目标查询语句查询各目标表的顺序,具体包括:当所述目标查询语句包含的目标表不属于任何候选动作查询的表时,根据所述目标表,确定查询所述目标表的动作,根据确定出的动作更新候选动作;根据更新后的候选动作,更新所述目标奖励矩阵;根据更新后的目标奖励矩阵,确定所述目标查询语句查询各目标表的顺序。10.一种数据查询装置,包括:生成模块,用于针对目标数据库生成奖励矩阵,所述奖励矩阵中包含...
【专利技术属性】
技术研发人员:张济鹏,徐泉清,聂铁铮,王国平,申德荣,杨传辉,
申请(专利权)人:北京奥星贝斯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。