【技术实现步骤摘要】
一种数据表分类方法和装置
[0001]本专利技术涉及计算机
,特别涉及人工智能
,尤其涉及一种数据表分类方法和装置。
技术介绍
[0002]在各行各业的信息化发展的进程中,越来越多的数据以结构化表的形式存在于数据库中。由于行业内发展速度快,业务来源广泛,业务线复杂,导致数据库中的众多数据表存储混乱。相关技术中,数据管理人员手动将数据库中的数据表进行归类,人工归类的方式依赖于数据管理人员的主观经验,数据管理人员只能通过表名或数据表的业务意义对数据表类型进行粗略判断,准确率较低;而且随着数据表数量不断增加,人工判断的方式会损耗大量人力资源,分类效率较低。
技术实现思路
[0003]本专利技术的一个目的在于提供一种数据表分类方法,能够节约人力资源,提高数据表分类的准确性和效率。本专利技术的另一个目的在于提供一种数据表分类装置。本专利技术的再一个目的在于提供一种计算机可读介质。本专利技术的还一个目的在于提供一种计算机设备。
[0004]为了达到以上目的,本专利技术一方面公开了一种数据表分类方法,包 ...
【技术保护点】
【技术特征摘要】
1.一种数据表分类方法,其特征在于,所述方法包括:根据构建的样本数据表,对双向编码器进行训练,构建基于表名的第一分类模型和基于表内数据的第二分类模型;通过所述第一分类模型和第二分类模型,对待分类数据表进行分类判别,得到分类结果。2.根据权利要求1所述的数据表分类方法,其特征在于,在所述根据构建的样本数据表,对双向编码器进行训练,构建基于表名的第一分类模型和基于表内数据的第二分类模型之前,还包括:按照预设的标记类别对获取的库内数据表进行标记,构建样本数据表。3.根据权利要求1所述的数据表分类方法,其特征在于,所述样本数据表包括样本表名和样本表内数据;所述根据构建的样本数据表,对双向编码器进行训练,构建基于表名的第一分类模型和基于表内数据的第二分类模型,包括:根据所述样本表名,对所述双向编码器进行训练,构建基于表名的第一分类模型;根据所述样本表内数据,对所述双向编码器进行训练,构建基于表内数据的第二分类模型。4.根据权利要求3所述的数据表分类方法,其特征在于,所述根据所述样本表名,对所述双向编码器进行训练,构建基于表名的第一分类模型,包括:对所述样本表名进行编码预处理,得到表名编码;将设置的全连接层添加至所述双向编码器,得到第一更新编码器;按照预先设置的第一超参数,根据所述表名编码,对所述第一更新编码器进行训练,得到所述第一分类模型。5.根据权利要求3所述的数据表分类方法,其特征在于,所述根据所述样本表内数据,对所述双向编码器进行训练,构建基于表内数据的第二分类模型,包括:对所述样本表内数据进行数据预处理,得到数据编码;将设置的全连接层组添加至所述双向编码器,得到第二更新编码器,所述全连接层组包括多个全连接层;按照预先设置的第二超参数,根据所述数据编码,对所述第二更新编码器进行训练,得到所述第二分类模型。6.根据权利要求5所述的数据表分类方法,其特征在于,所述对所述样本表内数据进行数据预处理,得到数据编码,包括:从所述样本表内数据中筛选出字段...
【专利技术属性】
技术研发人员:韩奇城,孙少杰,杜敏,贾小茹,
申请(专利权)人:中国工商银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。