【技术实现步骤摘要】
一种基于多维数据库查询的数据控制系统及方法
[0001]本专利技术涉及数据库
,更具体地说,涉及一种基于多维数据库查询的数据控制系统及方法。
技术介绍
[0002]多维数据库主要应用在商业智能和数据分析中,特别是在处理如数据仓库和OLAP(在线分析处理)系统的场景。多维数据库允许数据按照多个维度进行组织,例如时间、地点、产品类型、客户类型等。这样的组织方式使得用户能够非常灵活和直观地查询和分析数据,例如:“上月在上海销售的所有电视的总销售额是多少?”或“今年到目前为止,所有VIP客户购买最多的商品是什么?”。
[0003]多维数据库面临的一个主要挑战就是数据的稀疏性。这是因为在实际的商业场景中,不是所有可能的维度组合都会有对应的数据。举例来说,假设在全球范围内销售100种产品,有1000个销售地点,跨越5年的时间,如果要为每种可能的产品、地点和时间组合都存储一个数据项,那么将会有至少5000000个数据点。但事实上,可能有许多产品在某些地点从未销售过,或者在某些时间段内没有销售记录。这就导致了多维数据库的稀疏性 ...
【技术保护点】
【技术特征摘要】
1.一种基于多维数据库查询的数据控制方法,其特征在于,包括如下步骤:S1:将用于训练的多维数据库的每个数据点转换为一个特征向量,该特征向量包含表示数据点位置的维度值以及表示数据点度量的度量值,对于缺失的数据点,使用预定义的同一特殊值表示其度量值;S2:应用深度学习模型进行训练,其中将数据点的维度值作为输入,将数据点的度量值作为标签进行训练,使得深度学习模型能够根据维度值预测度量值;S3:将待查询的多维数据库输入训练后的深度学习模型,若预测出的数据点的度量值与S1中设定的预定义的特殊值的差值小于预设的阈值,则将该数据点纳入稀疏区域,并将除此之外的数据点纳入非稀疏区域;所述待查询的多维数据库与所述用于训练的多维数据库具有相同的维度和度量值含义;S4:执行S3中多维数据库的数据查询或计算时,优先查询或计算S3步骤中分割出的非稀疏区域的数据。2.根据权利要求1所述基于多维数据库查询的数据控制方法,其特征在于,所述深度学习模型选为LSTM模型。3.根据权利要求1所述基于多维数据库查询的数据控制方法,其特征在于,用于训练的多维数据库由从待查询的多维数据库中抽取出来的部分数据组成。4.根据权利要求3所述基于多维数据库查询的数据控制方法,其特征在于,用于训练的多维数据库由某一时间段内的待查询的多维数据库中的数据组成。5.一种基于多维数据库查询的数据控制系统,其...
【专利技术属性】
技术研发人员:刘勇,
申请(专利权)人:深圳市秦丝科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。