数据表创建方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26065462 阅读:20 留言:0更新日期:2020-10-28 16:38
本公开揭示了一种数据表创建方法、装置、计算机设备及存储介质,属于数据处理技术领域。该方法包括:通过获取用户输入的字段注释,根据用户输入的字段注释查询注释‑字段对应关系,获得与用户输入的字段注释相对应的目标字段名称,最后根据目标字段名称,创建目标数据表。通过同一逻辑过程,根据用户输入的注释信息自动获取对应的字段名称,由于字段名称与注释信息的对应关系是唯一的,从而解决了创建数据表时对字段名称的主观性命名导致同一注释信息对应的数据表创建不统一的问题,从而提高了创建的数据表的质量。

【技术实现步骤摘要】
数据表创建方法、装置、计算机设备及存储介质
本公开涉及数据处理
,特别是涉及一种数据表创建方法、装置、计算机设备及存储介质。
技术介绍
目前,在构建数据库的过程中,需要根据各个数据库对应的业务需求进行数据表的创建。不同业务下创建的数据表是各不相同的。在相关技术中,为了在不同的业务下创建数据表,需要根据需求为字段进行命名,字段名称可以是开发者直接进行编辑命名的,也可以是开发者根据预先存储的字段命名模板,查询字段命名模板中对应的字段名称进行命名。然而,相关技术中的方案,在实际运用的过程中,直接进行编辑命名以及通过预先存储的字段命名模板进行对应的字段名称命名,均可能出现同一注释信息对应的字段名称各不相同,这就导致了创建数据表时对字段名称的命名主观性较强,不具有普遍性,从而影响创建的数据表质量。
技术实现思路
本公开提供一种数据表创建方法、装置、计算机设备及存储介质。所述技术方案如下:一方面,提供了一种数据表创建方法,其特征在于,所述方法包括:获取用户输入的字段注释,所述字段注释包含对应的字段名称的自然语言表述;根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称;所述注释-字段对应关系是基于已创建的数据表中的字段名称,以及所述已创建的数据表的字段注释生成的;所述注释-字段对应关系中包含字段名称与字段注释之间的对应关系;根据所述目标字段名称,创建目标数据表。在一种可能的实现方式中,所述根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称之前,还包括:对所述已创建的数据表中的字段名称以及所述已创建的数据表中的字段注释进行切分处理,获得字段名称切分结果以及字段注释切分结果;将所述字段注释切分结果进行翻译处理,获取对应的切分注释翻译结果;将所述切分注释翻译结果与所述字段名称切分结果进行循环匹配;响应于所述循环匹配成功,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合,加入所述注释-字段对应关系。在一种可能的实现方式中,所述将所述字段注释切分结果进行翻译处理,获取对应的切分注释翻译结果之前,还包括:对所述字段注释切分结果做预处理,所述预处理包括关键词提取以及无意义词过滤中的至少一种。在一种可能的实现方式中,所述响应于所述循环匹配成功,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合,加入所述注释-字段对应关系,包括:检测所述字段注释切分结果与所述字段名称切分结果在所述注释-字段对应关系中的存在情况;响应于所述注释-字段对应关系中不存在包含所述字段注释切分结果与所述字段名称切分结果的所述注释-字段组合,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合加入所述注释-字段对应关系。在一种可能的实现方式中,所述方法还包括:响应于所述循环匹配不成功,将所述字段注释切分结果的翻译结果中的短字符串作为新建字段名称,将所述字段注释切分结果与所述新建字段名称组成的注释-字段组合加入所述注释-字段对应关系。在一种可能的实现方式中,所述根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称,包括:对所述用户输入的字段注释进行切分处理,获得目标字段注释切分结果;将所述目标字段注释切分结果与所述注释-字段对应关系中的字段注释切分结果进行匹配;响应于匹配成功,将所述字段注释切分结果对应的字段名称切分结果获取为所述目标字段名称。在一种可能的实现方式中,所述将所述切分结果与所述注释-字段对应关系中的字段注释切分结果进行匹配之前,还包括:对所述目标字段注释切分结果做预处理,所述预处理包括关键词提取以及无意义词过滤中的至少一种。在一种可能的实现方式中,所述方法还包括:响应于匹配不成功,将所述目标字段注释切分结果的翻译结果中的短字符串作为对应的所述目标字段名称。在一种可能的实现方式中,所述根据所述目标字段名称,创建目标数据表,包括:基于所述用户输入的字段注释确定所述目标字段名称的字段类型;根据所述目标字段名称,以及所述字段类型创建所述目标数据表。在一种可能的实现方式中,所述基于所述用户输入的字段注释确定所述目标字段名称的字段类型,包括:根据所述用户输入的字段注释以及分类模型确定所述目标字段名称的字段类型,所述分类模型是根据所述已创建的数据表中的字段类型作为样本标签,所述已创建的数据表的字段注释切分结果作为特征向量进行训练得到的一种机器学习模型。一方面,提供了一种数据表创建装置,其特征在于,所述装置包括:注释获取模块,用于获取用户输入的字段注释,所述字段注释包含对应的字段名称的自然语言表述;目标获取模块,用于根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称;所述注释-字段对应关系是基于已创建的数据表中的字段名称,以及所述已创建的数据表的字段注释生成的;所述注释-字段对应关系中包含字段名称与字段注释之间的对应关系;表创建模块,用于根据所述目标字段名称,创建目标数据表。在一种可能的实现方式中,所述装置还包括:切分处理模块,用于对所述已创建的数据表中的字段名称以及所述已创建的数据表中的字段注释进行切分处理,获得字段名称切分结果以及字段注释切分结果;翻译模块,用于将所述字段注释切分结果进行翻译处理,获取对应的切分注释翻译结果;匹配模块,用于将所述切分注释翻译结果与所述字段名称切分结果进行循环匹配;第一关系生成模块,用于响应于所述循环匹配成功,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合,加入所述注释-字段对应关系。在一种可能的实现方式中,所述装置还包括:预处理模块,用于将所述字段注释切分结果进行翻译处理,获取对应的切分注释翻译结果之前,对所述字段注释切分结果做预处理,所述预处理包括关键词提取以及无意义词过滤中的至少一种。在一种可能的实现方式中,所述关系生成模块,包括:存在检测子模块,用于检测所述字段注释切分结果与所述字段名称切分结果在所述注释-字段对应关系中的存在情况;关系加入子模块,用于响应于所述注释-字段对应关系中不存在包含所述字段注释切分结果与所述字段名称切分结果的所述注释-字段组合,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合加入所述注释-字段对应关系。在一种可能的实现方式中,所述装置还包括:第二关系生成模块,用于响应于所述循环匹配不成功,将所述字段注释切分结果的翻译结果中的短字符串作为新建字段名称,将所述字段注释切分结果与所述新建字段名称组成的注释-字段组合加入所述注释-字段对应关系。在一种可能的实现方式中,所述目标获取模块,包括本文档来自技高网...

【技术保护点】
1.一种数据表创建方法,其特征在于,所述方法包括:/n获取用户输入的字段注释,所述字段注释包含对应的字段名称的自然语言表述;/n根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称;所述注释-字段对应关系是基于已创建的数据表中的字段名称,以及所述已创建的数据表的字段注释生成的;所述注释-字段对应关系中包含字段名称与字段注释之间的对应关系;/n根据所述目标字段名称,创建目标数据表。/n

【技术特征摘要】
1.一种数据表创建方法,其特征在于,所述方法包括:
获取用户输入的字段注释,所述字段注释包含对应的字段名称的自然语言表述;
根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称;所述注释-字段对应关系是基于已创建的数据表中的字段名称,以及所述已创建的数据表的字段注释生成的;所述注释-字段对应关系中包含字段名称与字段注释之间的对应关系;
根据所述目标字段名称,创建目标数据表。


2.根据权利要求1所述的方法,其特征在于,所述根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称之前,还包括:
对所述已创建的数据表中的字段名称以及所述已创建的数据表中的字段注释进行切分处理,获得字段名称切分结果以及字段注释切分结果;
将所述字段注释切分结果进行翻译处理,获取对应的切分注释翻译结果;
将所述切分注释翻译结果与所述字段名称切分结果进行循环匹配;
响应于所述循环匹配成功,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合,加入所述注释-字段对应关系。


3.根据权利要求2所述的方法,其特征在于,所述将所述字段注释切分结果进行翻译处理,获取对应的切分注释翻译结果之前,还包括:
对所述字段注释切分结果做预处理,所述预处理包括关键词提取以及无意义词过滤中的至少一种。


4.根据权利要求2所述的方法,其特征在于,所述响应于所述循环匹配成功,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合,加入所述注释-字段对应关系,包括:
检测所述字段注释切分结果与所述字段名称切分结果在所述注释-字段对应关系中的存在情况;
响应于所述注释-字段对应关系中不存在包含所述字段注释切分结果与所述字段名称切分结果的所述注释-字段组合,将所述字段注释切分结果与所述字段名称切分结果组成的注释-字段组合加入所述注释-字段对应关系。


5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
响应于所述循环匹配不成功,将所述字段注释切分结果的翻译结果中的短字符串作为新建字段名称,将所述字段注释切分结果与所述新建字段名称组成的注释-字段组合加入所述注释-字段对应关系。


6.根据权利要求1所述的方法,其特征在于,所述根据所述用户输入的字段注释查询注释-字段对应关系,获得与所述用户输入的字段注释相对应的目标字段名称,包括:
对所述用户输入的字段注释进行切分处理,获得目标字段注释切分结果;
将所...

【专利技术属性】
技术研发人员:白亮张同启苑仕文
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1