数仓模型的共享维度优化方法、装置、设备及存储介质制造方法及图纸

技术编号:43847487 阅读:21 留言:0更新日期:2024-12-31 18:40
本发明专利技术涉及一种数仓模型的共享维度优化方法,通过收集业务数据表,生成字段的中文描述,采用文本解析方法对中文描述进行拆解和统计,标注词性并生成解析结果。对解析结果进行优化处理,过滤与共享维度无关的词性,筛除时间周期词性和度量词性。对优化后的解析结果进行统计分析,识别出具有共性特征的维度。基于业务逻辑对识别出的共性维度进行加工,生成共享维度。通过生成的共享维度,对数仓模型的结构进行调整,完善维度表和事实表的结构设计,并优化数据查询效率。本发明专利技术减少了人工调研、数据分析的工作量,通过自动化处理提升了维度识别与共享的效率,缩短了数据梳理的周期,降低了人力成本,适应复杂业务场景的数据处理需求。

【技术实现步骤摘要】

本专利技术涉及大数据及金融科技领域,尤其涉及一种数仓模型的共享维度优化方法、装置、设备及存储介质


技术介绍

1、在金融和其他数据密集型行业中,数据维度的梳理与共享是数据分析和业务决策的重要组成部分。共享维度通常包括与业务高度相关的主维度(如产品、客户、机构等)、其他分析维度(如业务类型、支付方式等),以及用于修饰或限定业务特征的标签(如是否自购、是否新能源车等)。这些维度为企业的数据分析提供了基础,支持跨部门的数据共享和决策优化。

2、然而,现有的维度梳理方法在实际应用中面临诸多挑战和不足。传统方法主要依赖于人工发起的业务调研、需求分析流程,或者通过人工逐一分析数据加工逻辑。这些方法存在以下明显的缺陷:

3、跨部门调研难度大:数据维度的共享需要不同部门之间的协作与沟通。然而,跨部门的数据调研通常难以协调,不同部门的数据标准、分析需求存在差异,导致调研过程复杂且低效。

4、调研和梳理周期长:人工调研和分析维度共享性需要耗费大量的时间和精力,特别是当涉及多个业务场景时,人工处理的数据量庞大,导致梳理周期较长,难以及时响应业本文档来自技高网...

【技术保护点】

1.一种数仓模型的共享维度优化方法,其特征在于,包括以下步骤:

2.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,对过滤后的解析结果进行统计分析,识别共性维度,包括:

3.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,对每个识别出的共性维度,结合业务逻辑进行加工,生成共享维度,包括:

4.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,通过文本解析方法对所述中文描述进行拆解和统计,并标注词性,生成解析结果,包括:

5.如权利要求1中所述的数仓模型的共享维度优化方法,其特征在于,优化处理所述解析结果,过滤与共...

【技术特征摘要】

1.一种数仓模型的共享维度优化方法,其特征在于,包括以下步骤:

2.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,对过滤后的解析结果进行统计分析,识别共性维度,包括:

3.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,对每个识别出的共性维度,结合业务逻辑进行加工,生成共享维度,包括:

4.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,通过文本解析方法对所述中文描述进行拆解和统计,并标注词性,生成解析结果,包括:

5.如权利要求1中所述的数仓模型的共享维度优化方法,其特征在于,优化处理所述解析结果,过滤与共享维度无关的词性,所述无关的词性包括时间周期词性和度量词性,包括:

6.如权利要求1所述的数仓模型的共享维度优化方法,其特征在于,基于所述共享维度调整数...

【专利技术属性】
技术研发人员:陈朝亮
申请(专利权)人:中国平安财产保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1