一种数据名称和数据库建表生成方法及系统技术方案

技术编号:37321611 阅读:27 留言:0更新日期:2023-04-21 23:01
本发明专利技术提供一种数据名称和数据库建表生成方法及系统,涉及软件系统技术领域。包括:采集数据标准库和词根库中的原始数据;根据预设模板进行原始数据添加后导入系统;对导入的数据进行解析及属性匹配;对匹配不成功的数据进行分词,根据分词结果与词根库进行匹配,匹配成功后进行信息补充提交;根据匹配结果,获得生成建表语句需要的剩余信息,通过数据治理人员审核修改后添加至数据标准库,根据数据标准库的信息选择数据库类型生成建表语句。本发明专利技术充分利用数据治理模式的数据标准管理体系来进行数据定义,建立自己的数据库表,使数据定义更加规范标准,有助于数据的进一步使用、内部共享、挖掘,让普通开发人员建立数据库表时更加快速、便捷。便捷。便捷。

【技术实现步骤摘要】
一种数据名称和数据库建表生成方法及系统


[0001]本专利技术涉及软件系统
,尤其涉及一种数据名称和数据库建表生成方法及系统。

技术介绍

[0002]互联网和大数据的飞速发展,无论是对企业还是个人都产生了巨大的影响,信息化甚至是数字化转型势在必行,充分利用基础技术和信息能快速创造价值包括但不仅限于打造企业竞争力、降本增效等等。当然这是从宏观描述,从微观或底层来讲就是对于信息化或数字化积累的大量数据的使用分析、挖掘就会显得尤为重要,如果希望快速方便高效分析的使用数据,就必须规范的定义数据极其结构,对于系统开发人员或大数据开发人员而言就需要高标准建立数据定义和数据库表,现有技术基本都是由开发人员自己直接进行定义。
[0003]现有技术进行数据库建表基本都是通过业务确定以后,根据业务定义的中文字段直接通过自己或从网络上搜索英文单词的方式建库建表,具有以下缺点:
[0004]1.缺乏标准,数据结构定义较随意,或者不合理,容易造成后期经常修改。
[0005]2.开发人员英文水平参差不齐,如果英文水平相对较差需要挨个搜索、如果表和字段多,极其费时费力。
[0006]3.相关字词业务性如果很强,不一定能轻易的搜索,甚至有时候采用拼音和首字母组合定义,不明晰,违反数据库开发的规范性。
[0007]4.因为业务不同,现在市面几乎没有这样的一种工具方法能帮助开发人员建库建表。

技术实现思路

[0008]本专利技术提供了一种数据名称和数据库建表生成方法及系统,分考虑到开发人员在建表和字段或者对数据描述和使用上面面临的一些困难,包括不明晰,不规范,不标准,不合理,通过专业的数据治理管理人员的介入,建立一套相对完整的数据标准。
[0009]为解决上述专利技术目的,本专利技术提供的技术方案如下:一种数据名称和数据库建表生成方法,其特征在于,步骤包括:
[0010]S1:采集数据标准库和词根库中的原始数据;
[0011]S2:预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据;
[0012]S3:对所述导入数据进行解析以及属性匹配;若匹配成功,则执行步骤S5;若匹配不成功,则执行步骤S4,进行分词;
[0013]S4:对匹配不成功的所述导入数据进行分词;用户自选分词方式,根据分词结果与所述词根库进行匹配,匹配成功后进行信息补充提交,执行步骤S5;
[0014]S5:根据匹配结果,获得生成建表语句需要的剩余信息,通过数据治理人员审核修
改后添加至数据标准库;根据所述数据标准库的信息选择数据库类型生成建表语句,完成数据名称和数据库建表生成。
[0015]优选地,步骤S1中,所述数据标准库根据各企业的数据标准指定。
[0016]优选地,步骤S2中,预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据,包括:
[0017]对模板的输入规格进行设定;其中,模板的输入规格要求仅允许输入中文汉字、英文字母和数字,且长度不能超过40个字符,并在模板中选择类型是表名或字段名,表名只允许有一个,字段名数量不做限制;
[0018]将符合模板要求的原始数据添加到模板后导入系统;若不符合模板的输入规格,则跳出修改提示,根据提示进行修改后进行导入系统,直至导入成功。
[0019]优选地,步骤S3中,对所述导入数据进行解析以及属性匹配,包括:
[0020]对所述导入数据进行解析,解析成功后获得解析数据;
[0021]根据数据标准库中的中文名称,对所述解析数据进行匹配,匹配内容为:解析数据的中文名称对应的英文名称及技术属性;其中,技术属性包括:数据类型和数据长度、默认值。
[0022]优选地,步骤S4中,分词方法包括:
[0023]基于Ansj分词器,结合精准分词 ToAnalysis、nlp分词 NlpAnalysis以及面向索引的分词 IndexAnalysis三种分词方式进行分词;如果用户对分词结果不满意,则根据用户实际的用词需求进行自定义分词。
[0024]优选地,步骤S4中,匹配成功后进行信息补充提交,包括:
[0025]匹配成功后,获得补充信息,将补充信息提交至数据标准库,所述补充信息包括:数据类型、数据长度、字段业务含义;
[0026]若未匹配成功,则提交缺乏的中文到词根库,待数据治理人员审核修改通过后添加至词根库,再进行匹配。
[0027]优选地,步骤S5中,剩余信息包括:字段类型、字段长度、默认值。
[0028]一种数据名称和数据库建表生成系统,所述数据名称和数据库建表生成系统用于上述数据名称和数据库建表生成方法,所述系统包括:
[0029]数据采集模块,用于采集数据标准库和词根库中的原始数据;
[0030]数据导入模块,用于预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据;
[0031]数据匹配模块,用于对导入数据进行解析以及属性匹配;若匹配成功,则执行步骤S5;若匹配不成功,则执行分词模块,进行分词;
[0032]分词模块,用于对匹配不成功的所述导入数据进行分词;用户自选分词方式,根据分词结果与所述词根库进行匹配,匹配成功后进行信息补充提交,执行数据库生成模块;
[0033]数据库生成模块,用于根据匹配结果,获得生成建表语句需要的剩余信息,通过数据治理人员审核修改后添加至数据标准库;根据所述数据标准库的信息选择数据库类型生成建表语句,完成数据名称和数据库建表生成。
[0034]优选地,数据标准库根据各企业的数据标准指定。
[0035]优选地,数据导入模块,进一步用于:对模板的输入规格进行设定;其中,模板的输
入规格要求仅允许输入中文汉字、英文字母和数字,且长度不能超过40个字符,并在模板中选择类型是表名或字段名,表名只允许有一个,字段名数量不做限制;
[0036]将符合模板要求的原始数据添加到模板后导入系统;若不符合模板的输入规格,则跳出修改提示,根据提示进行修改后进行导入系统,直至导入成功。
[0037]一方面,提供了一种电子设备,所述电子设备包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述数据名称和数据库建表生成的方法。
[0038]一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现上述数据名称和数据库建表生成的方法。
[0039]上述技术方案,与现有技术相比至少具有如下有益效果:
[0040]上述方案,本专利技术充分利用数据治理模式的数据标准管理体系来进行数据定义进而建立自己的数据库表,使得数据定义更加规范、标准,并能有助于数据的进一步使用、内部共享、挖掘,也让普通开发人员建立数据库表的时候更加快速、便捷。同时也会使得企本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据名称和数据库建表生成方法,其特征在于,步骤包括:S1:采集数据标准库和词根库中的原始数据;S2:预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据;S3:对所述导入数据进行解析以及属性匹配;若匹配成功,则执行步骤S5;若匹配不成功,则执行步骤S4,进行分词;S4:对匹配不成功的导入数据进行分词;用户自选分词方式,根据分词结果与所述词根库进行匹配,匹配成功后进行信息补充提交,执行步骤S5;S5:根据匹配结果,获得生成建表语句需要的剩余信息,通过数据治理人员审核修改后添加至数据标准库;根据所述数据标准库的信息选择数据库类型生成建表语句,完成数据名称和数据库建表生成。2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,所述数据标准库根据各企业的数据标准指定。3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据,包括:对模板的输入规格进行设定;其中,模板的输入规格要求仅允许输入中文汉字、英文字母和数字,且长度不能超过40个字符,并在模板中选择类型是表名或字段名,表名只允许有一个,字段名数量不做限制;将符合模板要求的原始数据添加到模板后导入系统;若不符合模板的输入规格,则跳出修改提示,根据提示进行修改后进行导入系统,直至导入成功。4.根据权利要求1所述的方法,其特征在于,所述步骤S3中,对所述导入数据进行解析以及属性匹配,包括:对所述导入数据进行解析,解析成功后获得解析数据;根据数据标准库中的中文名称,对所述解析数据进行匹配,匹配内容为:解析数据的中文名称对应的英文名称及技术属性;其中,技术属性包括:数据类型和数据长度、默认值。5.根据权利要求2所述的方法,其特征在于,所述步骤S4中,分词方法包括:基于Ansj分词器,结合精准分词 ToAnalysis、nlp分词 NlpAnalysis以及面向索引的分词 IndexAnalysis三...

【专利技术属性】
技术研发人员:李应许王长龙王文文王家照
申请(专利权)人:鲁班北京电子商务科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1