一种数据名称和数据库建表生成方法及系统技术方案

技术编号:37321611 阅读:29 留言:0更新日期:2023-04-21 23:01
本发明专利技术提供一种数据名称和数据库建表生成方法及系统,涉及软件系统技术领域。包括:采集数据标准库和词根库中的原始数据;根据预设模板进行原始数据添加后导入系统;对导入的数据进行解析及属性匹配;对匹配不成功的数据进行分词,根据分词结果与词根库进行匹配,匹配成功后进行信息补充提交;根据匹配结果,获得生成建表语句需要的剩余信息,通过数据治理人员审核修改后添加至数据标准库,根据数据标准库的信息选择数据库类型生成建表语句。本发明专利技术充分利用数据治理模式的数据标准管理体系来进行数据定义,建立自己的数据库表,使数据定义更加规范标准,有助于数据的进一步使用、内部共享、挖掘,让普通开发人员建立数据库表时更加快速、便捷。便捷。便捷。

【技术实现步骤摘要】
一种数据名称和数据库建表生成方法及系统


[0001]本专利技术涉及软件系统
,尤其涉及一种数据名称和数据库建表生成方法及系统。

技术介绍

[0002]互联网和大数据的飞速发展,无论是对企业还是个人都产生了巨大的影响,信息化甚至是数字化转型势在必行,充分利用基础技术和信息能快速创造价值包括但不仅限于打造企业竞争力、降本增效等等。当然这是从宏观描述,从微观或底层来讲就是对于信息化或数字化积累的大量数据的使用分析、挖掘就会显得尤为重要,如果希望快速方便高效分析的使用数据,就必须规范的定义数据极其结构,对于系统开发人员或大数据开发人员而言就需要高标准建立数据定义和数据库表,现有技术基本都是由开发人员自己直接进行定义。
[0003]现有技术进行数据库建表基本都是通过业务确定以后,根据业务定义的中文字段直接通过自己或从网络上搜索英文单词的方式建库建表,具有以下缺点:
[0004]1.缺乏标准,数据结构定义较随意,或者不合理,容易造成后期经常修改。
[0005]2.开发人员英文水平参差不齐,如果英文水平相对较差需要挨个搜索、如果本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据名称和数据库建表生成方法,其特征在于,步骤包括:S1:采集数据标准库和词根库中的原始数据;S2:预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据;S3:对所述导入数据进行解析以及属性匹配;若匹配成功,则执行步骤S5;若匹配不成功,则执行步骤S4,进行分词;S4:对匹配不成功的导入数据进行分词;用户自选分词方式,根据分词结果与所述词根库进行匹配,匹配成功后进行信息补充提交,执行步骤S5;S5:根据匹配结果,获得生成建表语句需要的剩余信息,通过数据治理人员审核修改后添加至数据标准库;根据所述数据标准库的信息选择数据库类型生成建表语句,完成数据名称和数据库建表生成。2.根据权利要求1所述的方法,其特征在于,所述步骤S1中,所述数据标准库根据各企业的数据标准指定。3.根据权利要求1所述的方法,其特征在于,所述步骤S2中,预设模板,根据所述模板进行原始数据添加,将符合模板要求的原始数据添加到模板后导入系统,获得导入数据,包括:对模板的输入规格进行设定;其中,模板的输入规格要求仅允许输入中文汉字、英文字母和数字,且长度不能超过40个字符,并在模板中选择类型是表名或字段名,表名只允许有一个,字段名数量不做限制;将符合模板要求的原始数据添加到模板后导入系统;若不符合模板的输入规格,则跳出修改提示,根据提示进行修改后进行导入系统,直至导入成功。4.根据权利要求1所述的方法,其特征在于,所述步骤S3中,对所述导入数据进行解析以及属性匹配,包括:对所述导入数据进行解析,解析成功后获得解析数据;根据数据标准库中的中文名称,对所述解析数据进行匹配,匹配内容为:解析数据的中文名称对应的英文名称及技术属性;其中,技术属性包括:数据类型和数据长度、默认值。5.根据权利要求2所述的方法,其特征在于,所述步骤S4中,分词方法包括:基于Ansj分词器,结合精准分词 ToAnalysis、nlp分词 NlpAnalysis以及面向索引的分词 IndexAnalysis三...

【专利技术属性】
技术研发人员:李应许王长龙王文文王家照
申请(专利权)人:鲁班北京电子商务科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1