处理字段名的方法、装置、计算机存储介质及终端制造方法及图纸

技术编号:21200072 阅读:28 留言:0更新日期:2019-05-25 01:18
一种处理字段名的方法、装置、计算机存储介质及终端,包括:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。本发明专利技术实施例基于训练数据实现缩写字段名的解析,提升了用户对数据库表中包含的缩写字段名的可读性。

Method, device, computer storage medium and terminal for processing field names

A method, device, computer storage medium and terminal for processing field names includes: generating training data by pre-collected abbreviated segment names and corresponding Chinese field names of abbreviated segment names; computing the generated training data with digital vectors; inputting the calculation results of the word vector calculation into the preset neural network, and analyzing the database tables through the neural network. Get the Chinese field names corresponding to the abbreviated segment names in the current database table. The embodiment of the invention realizes the parsing of abbreviated paragraph names based on training data, and improves the readability of abbreviated paragraph names contained in database tables.

【技术实现步骤摘要】
处理字段名的方法、装置、计算机存储介质及终端
本文涉及但不限于数据库应用技术,尤指一种处理字段名的方法、装置、计算机存储介质及终端。
技术介绍
目前,在数据库表设计过程中,设计人员一般只能使用美国信息交换标准代码(ASCII,AmericanStandardCodeforInformationInterchange)字符来命名字段名。在中文环境下,设计人员主要使用中文或英文的字母缩写来设计缩写字段名;当需要给外部用户展示数据库信息时,这种字母缩写的缩写字段名的可读性很弱,用户很难确定缩写字段名所表达的含义,例如:“XM”;此外,相同的缩写字段名在不同环境下可能表示不同的中文字段名,容易造成误解;不同的缩写字段名在不同环境下可能表示相同的中文字段名,容易影响用户理解数据表设计的内容。综上,采用字母缩写的缩写字段名可读性很弱,影响用户对数据库表设计的理解。
技术实现思路
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。本专利技术实施例提供一种处理字段名的方法、装置、计算机存储介质及终端,能够增强字段名的可读性,为用户理解数据库表的设计提供信息支持。本专利技术实施例提供了一种处理字段名的方法,包括:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。可选的,所述神经网络包括:双向长短期记忆网络LSTM模型。可选的,所述方法还包括:按照预设周期,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。可选的,所述方法还包括:根据接收到的外部指令,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。另一方面,本专利技术实施例还提供一种处理字段名的装置,包括:生成单元、计算单元和确定单元,其中,生成单元用于:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;计算单元用于:对生成的训练数据进行字向量计算;确定单元用于:将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。可选的,所述神经网络包括:双向长短期记忆网络LSTM模型。可选的,所述装置还包括第一编辑单元,用于:按照预设周期,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。可选的,所述装置还包括第二编辑单元,用于:根据接收到的外部指令,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。再一方面,本专利技术实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机可执行指令,所述计算机可执行指令用于执行上述处理字段名的方法。还一方面,本专利技术实施例还提供一种终端,包括:存储器和处理器;其中,处理器被配置为执行存储器中的程序指令;程序指令在处理器读取执行以下操作:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。与相关技术相比,本申请技术方案包括:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。本专利技术实施例基于训练数据实现缩写字段名的解析,提升了用户对数据库表中包含的缩写字段名的可读性。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。附图说明附图用来提供对本专利技术技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本专利技术的技术方案,并不构成对本专利技术技术方案的限制。图1为本专利技术实施例处理字段名的方法的流程图;图2为本专利技术实施例处理字段名的装置的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,下文中将结合附图对本专利技术的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1为本专利技术实施例处理字段名的方法的流程图,如图1所示,包括:步骤101、通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;步骤102、对生成的训练数据进行字向量计算;需要说明的是,字向量计算为本领域技术人员公知的计算方法,对训练数据进行字向量计算,获得的计算结果为本领域技术人员的公知常识,在此不做赘述。步骤103、将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。需要说明的是,本专利技术实施例预先采集的缩写字段名和对应于缩写字段名的中文字段名包括本领域技术人员在项目执行过程中分析整理的字段名;不同的项目、不同的研发人员,缩写字段名和对应于缩写字段名的中文字段名可能存在差异,针对不同的项目和不同的技术人员,本专利技术实施例可以生成相应的训练数据。字向量的计算结果输入到神经网络后,如何进行训练为本领域技术人员公知,在此不做赘述。可选的,本专利技术实施例神经网络包括:双向长短期记忆网络LSTM模型。需要说明的是,双向长短期记忆网络模型只是本专利技术实施例可选的一种神经网络,其他可以适用于本专利技术实施例的神经网络也可以应用于本专利技术实施例。可选的,本专利技术实施例方法还包括:按照预设周期,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。需要说明的是,这里预设周期可以根据数据库表的项目研发周期、调整周期等分析确定,编辑训练数据一般为一个较为系统全面的编辑过程,可以对训练数据进行系统全面的整理。可选的,本专利技术实施例方法还包括:根据接收到的外部指令,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。需要说明的是,这里外部指令一般在本领域技术人员通过分析确定:通过神经网络分析获得的当前数据库表中各缩写字段名对应的中文字段名存在错误时,即时的对训练数据进行编辑的操作;其处理和周期性处理在时限上存在差异,可以具有针对性的对部分信息进行编辑。与相关技术相比,本申请技术方案包括:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行本文档来自技高网...

【技术保护点】
1.一种处理字段名的方法,其特征在于,包括:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。

【技术特征摘要】
1.一种处理字段名的方法,其特征在于,包括:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;对生成的训练数据进行字向量计算;将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析,获得当前数据库表中各缩写字段名对应的中文字段名。2.根据权利要求1所述的方法,其特征在于,所述神经网络包括:双向长短期记忆网络LSTM模型。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:按照预设周期,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。4.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:根据接收到的外部指令,对所述训练数据中包含的缩写字段名和/或中文字段名进行编辑;其中,所述编辑包括以下部分或全部操作:修改、添加、删除。5.一种处理字段名的装置,其特征在于,包括:生成单元、计算单元和确定单元,其中,生成单元用于:通过预先采集的缩写字段名和对应于缩写字段名的中文字段名,生成训练数据;计算单元用于:对生成的训练数据进行字向量计算;确定单元用于:将字向量计算的计算结果输入预设的神经网络后,通过神经网络对数据库表进行分析...

【专利技术属性】
技术研发人员:牟小峰
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1