一种数据建模的方法技术

技术编号:15087719 阅读:93 留言:0更新日期:2017-04-07 17:25
本发明专利技术公开了一种通过对业务事件的拆解和处理进行数据建模的方法,本方法从用户描述业务事件开始,自动根据业务事件描述形成初步拆解表单,在确认后进行各种自动处理,最终形成可直接适用于各种数据库的模型定义表格。本方法通过人们熟知的“事件描述”这种类似“记叙文”的写作方式,引导业务人员从熟悉的业务开始,减轻了大部分机械、呆板的建模操作;且根据业务人员已经完成的数据建模案例,“自扩充”业务领域内的“知识”,随着“知识”越来越丰富,将使得业务事件的建模过程越来越“智能化”。本方法可以直接用于完成OLTP的过程数据建模和OLAP的事实数据建模。

【技术实现步骤摘要】

本专利技术涉及数据库及数据仓库领域,并且更具体地,涉及数据建模的方法
技术介绍
长久以来,数据建模都是小众的技术人群拥有的、高深的事情,需要利用各种专业软件,如Erwin,PowerDesigner,EA等,根据业务需求,直接建立模型,如指定数据库表中的符合长度要求的字母型名称、符合长度要求的字段的字母型名称等。在建立模型过程中还需要知道什么是数据库设计的三范式,需要知道数据库的字段类型、主键、外键、索引等一大堆高深的专业术语,使得数据建模的真正受益者—大多数的业务人员无法参与、无法评判数据建模中的业务合理性、扩展性,而一旦根据建立的模型完成应用开发后,再发现数据建模的问题,会花费额外的人力、财力、物力去变更从数据建模到应用开发的全部过程。重要的是,这样的数据建模方式,没有充分发挥最大多数业务人员对于自己应用的软件的设计热情,毕竟技术人员永远都比业务人员少得多,对于业务的精通程度,技术人员也比业务人员差得多。但实际上,业务人员心中的初步设想,大部分都是简单的。只要条件适合,不需要专业建模人员,业务人员自己是可以完成的。精通业务的业务人员虽然不能清晰地、完整地说出自己的设想,但在头脑中,一定隐藏着一条完整的线条,“文章本天成,妙手偶得之”,在条件成熟时,就会源源不断地顺畅地牵引出来,这个条件,就是一个能把自己的思路很快变成现实的具备易操作性的方法。这个方法把时间碎片化,不需要大块的时间来处理、探索数据建模,只需要每次一点点的改进、增加内容,不影响主要业务的工作,让业务人员在时间上能够接受这种方法。利用这个方法,业务人员在自己的业务的数据模型在不断精细化、实用化的进化过程中,对于数据建模的知识和思想也在进步。随着业务人员自己建立的数据模型越来越专业,范围越来越多,业务人员对于数据建模的能力会变得越来越强,一方面自己的驾驭软件的能力越来越强,相应的业务工作能力也因为自己设计的软件工具的应用得到进一步的增强。另一方面,数据建模专业的人员,也可以更集中精力处理复杂的更有价值的数据建模,而不是把精力大量地耗费在初步的、简单的数据建模上,影响自己专业的进步。OLTP中的数据模型,主要分成两类,一类是对象模型,主要是描述一个业务对象的属性,另一类是过程模型,是描述业务发生的过程。对一个业务来说,对象模型是被动的、被过程模型调用的模型,相当于一棵大树的枝叶,过程模型作为贯穿业务操作的红线,是应用的主体,相当于大树的主干。OLAP中的数据模型的基础来源,主要分成三类,一类是维度模型,主要是描述一个事实对象的维度;一类是事实模型,是描述最细粒度的业务事实;另一类是大量的统计汇总模型,主要是统计应用。对OLAP应用来说,事实模型虽然数量少,但作为统计应用的基础核心数据,在其上才能进行各种层次的统计、汇总,当事实模型涉及具体维度时,由维度模型来描述。从这里可以看出,事实模型的数据建模,是建立数据仓库应用的基础,打好了这个基础,数据仓库应用的大厦才可以比较容易地建立起来。
技术实现思路
从业务人员的视角看来,无论是OLTP中的过程模型,还是OLAP中的事实模型,对它们的数据建模,都是对应一个具体的在业务上发生的“事件”,我们称为业务事件,它包括发生的前置条件、一系列有序的动作、和这些动作产生的结果。业务人员很清楚发生在自己专注的业务上的内容,让他用平常的语言,如记叙文的方式,来描述自己精通业务的事件,是很容易的、专业的事情。专利技术目的:克服对于业务人员不熟悉的直接根据数据库技术建立模型的现状,提出一种通过对业务事件的描述、分拆和处理,间接地建立过程模型或事实模型的方法。技术方案:通过对提交的业务事件描述进行分词处理后,与属性转换表格对照,找出对应的属性,形成初始拆解表格,并在拆解表单中呈现;对提交确认的拆解表单进行包括初步处理、层次处理、复用处理、输出处理的处理过程,形成可用于各种数据库的模型定义表格。一种数据建模的方法,包括以下6个步骤。步骤1,绘制包括业务事件名称输入域,和业务事件描述输入域的业务事件表单。步骤2,对提交的业务事件描述,按分词处理结果进行检索转换,建立初始拆解表格。所述的分词处理,有很多种方法,本专利技术不限于某种固定的分词处理。分词条指分词处理结果中一个一个的分词条目。所述的初始拆解表格,包括栏目名称含义为属性名称、引用属性、引用字段的栏目。所述的初始拆解表格是指存在于内存中的一组数据集合。所述的表格,在本说明书和权利要求书中,均是指由多行和多列组成的二维表格,且所述表格分为两部分,表头和记录行。表头在上部,只占一行;每个记录行即是表格中的一行。表格中竖直的一列,称为一个栏目。栏目的第一行,即表头部分,称为栏目名称。所述表格,可以呈现,也可以仅是存在于内存中的一组数据集合。在本说明书和权利要求书中,所述的数据表,是指存在于数据库中的数据表。对每个分词条,按已存在的属性转换表格的属性名称栏目进行检索。若检索到分词条在属性转换表格中存在对应的属性名称,则在所述初始拆解表格中添加记录行,并分别在属性名称、引用属性、引用字段栏目中写入属性转换表格中的对应栏目;若不存在,则在所述初始拆解表格中添加记录行,并在该行的属性名称栏目写入分词条。所述属性转换表格是存储于内存中的一组数据集合,这组数据集合包含了历次数据建模中建立的属性与字段的转换关系。步骤3,根据初始拆解表格绘制拆解表单。所述的拆解表单包括一个拆解表格,所述拆解表格包括栏目名称含义为属性名称、引用属性、引用字段、父属性的栏目。所述拆解表格的每个记录行对应初始拆解表格的每个记录行。所述记录行的内容包括如下四个栏目的内容。(1)属性名称栏目:可接收文字输入的、初始内容为初始拆解表格中同行的属性名称的内容的输入域。(2)引用属性栏目:可接收选择的、选项包括有效的全部模型的全部属性的属性名称的、选项改变时同时改变同行的引用字段栏目内容的、初始内容为初始拆解表格中同行的引用属性的内容的选择域。所述有效的全部模型的全部属性的属性名称,是指在历次建立的有效的每个模型中,全部有效属性的属性名称,这是因为引用时,可能引用任何一个其他有效模型的有效属性。(3)引用字段栏目:引用字段呈现域。(4)父属性栏目:可接收选项的、选项为本拆解表格的全部属性名称、初始内容为空的选择域。对于步骤4中所述的初步处理,包括如下三个特点。(1)建立栏目包括含义为模型名称、属性名称、引用属性、引用字段、父属性的模型处理表格。所述的模型处理表格是存在于内存中的一组数据集合。(2)对于所述模型处理表格的每行的属性名称、引用属性、引用字段、父属性栏目的内容,设置为与确认提交的所述拆解表格的同行的相应栏目内容。(3)模型名称设置为与在步骤1提交的业务事件名称相同的名称。对于步骤5中的复用处理,特点包括,对于属性转换表格中每行的属性名称,在模型处理表格的属性名称中检索是否存在相同的属性名称,若存在,则跳过;若不存在,本文档来自技高网
...

【技术保护点】
一种数据建模的方法,其特征在于,包括以下步骤:步骤1,绘制包括业务事件名称输入域,和业务事件描述输入域的业务事件表单;步骤2,对提交的业务事件描述,按分词处理结果进行检索转换,建立初始拆解表格;步骤3,根据初始拆解表格绘制拆解表单;步骤4,对提交的拆解表单,进行包括初步处理的处理过程,形成模型处理表格;步骤5,对模型处理表格,进行包括复用处理、层次处理的处理过程;步骤6,对加工后的模型处理表格,进行包括输出处理的处理过程,形成包括模型定义表格的处理输出。

【技术特征摘要】
1.一种数据建模的方法,其特征在于,包括以下步骤:
步骤1,绘制包括业务事件名称输入域,和业务事件描述输入域的业务事件表单;
步骤2,对提交的业务事件描述,按分词处理结果进行检索转换,建立初始拆解表格;
步骤3,根据初始拆解表格绘制拆解表单;
步骤4,对提交的拆解表单,进行包括初步处理的处理过程,形成模型处理表格;
步骤5,对模型处理表格,进行包括复用处理、层次处理的处理过程;
步骤6,对加工后的模型处理表格,进行包括输出处理的处理过程,形成包括模型定义表格的处理输出。
2.根据权利要求1,对于步骤2中按分词处理结果进行检索转换,其特征在于:
所述的初始拆解表格,包括栏目名称含义为属性名称、引用属性、引用字段的栏目;
对每个分词条,按已存在的属性转换表格中的属性名称栏目进行检索:若检索到分词条在属性转换表格中存在对应的属性名称,则在所述初始拆解表格中添加记录行,并分别在属性名称、引用属性、引用字段栏目中写入属性转换表格中的对应栏目;若不存在,则在所述初始拆解表格中添加记录行,并在该行的属性名称栏目写入分词条。
3.根据权利要求1,对于步骤3中的根据初始拆解表格绘制拆解表单,其特征在于:
所述的拆解表单包括一个拆解表格,所述拆解表格包括栏目名称含义为属性名称、引用属性、引用字段、父属性的栏目;
所述拆解表格的每个记录行对应初始拆解表格的每个记录行。
4.根据权利要求3,对于所述拆解表格的每个记录行,其特征在于,所述记录行的内容包括:
属性名称栏目:可接收文字输入的、初始内容为初始拆解表格中同行的属性名称的内容的输入域;
引用属性栏目:可接收选择...

【专利技术属性】
技术研发人员:付强
申请(专利权)人:成都复晓科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1