【技术实现步骤摘要】
数据仓库的构建方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及一种数据仓库的构建方法、装置、设备及存储介质。
技术介绍
数据仓库是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合,由于在企业的实际经营中,会涉及到很多业务线,比如视频业务、文学业务、电脑端业务、移动端业务等等,因此,为了便于对每个业务线进行数据分析,在构建数据仓库时,会分别对每一个业务线中的数据进行处理,然后根据业务线自身关注的指标,形成每个业务线各自对应的数据集市,进而汇总形成以业务线为基础的数据仓库。而企业对众多业务线进行管理时,可能还需要基于某个主题对部分业务线进行分析,比如流量主题、交易主题、用户主题等等,以便于分析出在某个主题下,一些业务线的相应的经营情况。但是,目前构建的数据仓库只能适用于单独对某一个业务线进行数据分析的场景,无法满足在某一主题下对多个业务线进行数据分析的场景。
技术实现思路
为至少在一定程度上克服目前构建的数据仓库只能适用于单独对某一个业务线进行数据分析的场景,无法满足在某一 ...
【技术保护点】
1.一种数据仓库的构建方法,其特征在于,包括:/n获取第i个业务线的业务数据,其中,i=1,2,3……,N,N为正整数;/n从所述业务数据中提取所述第i个业务线的业务明细;/n将第i个业务线的业务明细按照预先确定的第一主题进行划分,得到所述第一主题的业务层表;/n将N个业务线的业务明细按照预先确定的第二主题进行汇总,得到所述第二主题的主题层表;/n基于所述业务层表和所述主题层表构建所述数据仓库。/n
【技术特征摘要】
1.一种数据仓库的构建方法,其特征在于,包括:
获取第i个业务线的业务数据,其中,i=1,2,3……,N,N为正整数;
从所述业务数据中提取所述第i个业务线的业务明细;
将第i个业务线的业务明细按照预先确定的第一主题进行划分,得到所述第一主题的业务层表;
将N个业务线的业务明细按照预先确定的第二主题进行汇总,得到所述第二主题的主题层表;
基于所述业务层表和所述主题层表构建所述数据仓库。
2.根据权利要求1所述的方法,其特征在于,所述第i个业务线的业务数据包括至少一个业务过程被调用时产生的调用数据;
所述从所述业务数据中提取所述第i个业务线的业务明细,包括:
从所述业务数据中提取第j个业务过程被调用时产生的调用数据,得到目标调用数据,其中,j=1,2,3……,M,M为正整数;
将所述目标调用数据进行存储,得到第j个业务过程的业务过程明细;
将M个业务过程与所述第i个业务线进行映射,得到第i个业务线与M个业务过程的映射关系;
将所述映射关系以及M个业务过程的业务过程明细确定为所述第i个业务线的业务明细。
3.根据权利要求2所述的方法,其特征在于,所述确定所述第一主题的过程包括:
将M个业务过程以及每个业务过程的业务过程明细输入到预先训练的业务过程划分模型中,根据业务过程明细对所述M个业务过程进行划分,得到至少一组业务过程;
将每组业务过程归类为一个第一主题。
4.根据权利要求3所述的方法,其特征在于,所述将第i个业务线的业务明细按照预先确定的第一主题进行划分,得到所述第一主题的业务层表,包括:
针对任一所述第一主题,从预设的指标度量层获取与所述第一主题对应的至少一个第一指标,以及从预设的维度层获取与所述第一主题对应的第一数据维度;
将归类为所述第一主题的业务过程确定为第一目标业务过程;
根据所述第一指标从所述第i个业务线的所述第一目标业务过程的业务过程明细中提取调用数据,得到第一目标明细;
按照所述第一数据维度,将所述第一目标明细中的所有调用数据整合为所述第一主题的业务层表。
5.根据权利要求2~4任一项所述的方法,其特征在于,所述确定所述第二主题的过程包括:
根据...
【专利技术属性】
技术研发人员:王建兴,张晓明,王旭,张雪纯,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。