一种基于BERT与Transformer的低代码平台组件生成方法及工具技术

技术编号:38415354 阅读:6 留言:0更新日期:2023-08-07 11:18
本发明专利技术公开一种基于BERT与Transformer的低代码平台组件生成方法,涉及低代码平台技术领域,包括:制定将要生成组件的自然语言描述规范;基于规范,用户提供将要生成组件的自然语言描述语句;对用户提供的语句进行分词,得到分词数组,对分词数组中的分词进行标记,得到标记数组,使用word2vec方法将分词数组和标记数组转换为可输入给BERT模型的向量;BERT模型对输入向量进行编码,随后输出到Transformer的多层Decoder中进行解码,解码后的信息即为组件的JSON schema;低代码平台将组件的JSON schema渲染到画布中供用户使用。本发明专利技术还公开一种低代码平台组件生成工具,其用于试下前述方法,可以将用户复杂的需求有效地转换为组件,减轻用户二次开发的负担,有利于用户更灵活地调整自己的组件需求。于用户更灵活地调整自己的组件需求。于用户更灵活地调整自己的组件需求。

【技术实现步骤摘要】
一种基于BERT与Transformer的低代码平台组件生成方法及工具


[0001]本专利技术涉及低代码平台
,具体的说是一种基于BERT与Transformer的低代码平台组件生成方法及工具。

技术介绍

[0002]低代码(Low

Code)是一种快速设计和开发软件应用程序并且手动编码最少的方法。低代码平台减轻了非技术开发人员的压力,帮其免去了代码编写工作,同时也为专业开发人员提供了支持,帮助他们提取应用开发过程中的繁琐底层架构与基础设施任务。
[0003]随着低代码平台技术的不断提高,非开发人员对低代码平台的需求也在不断增长。低代码平台拥有许多供用户使用的组件,而组件在低代码平台中的描述语言主要为JSON语言,通过一个JSON格式的对象描述出组件的名称、属性以及事件,此对象被称为组件的JSON schema,通过低代码平台的渲染器将组件的JSON schema渲染到画布上。
[0004]自低代码开发平台诞生以来,在各行各业生产的表单、网页等都需要用户去自己设计,若平台中的组件不满足用户需求,还需要开发者进行二次开发,在二次开发中还有诸多地限制,大大降低了平台的可配置性,对用户来说非常不便。
[0005]目前,各行业开发的低代码平台数量繁多,但当下的低代码平台主要有以下缺点:
[0006]一、面对较为复杂的用户需求,低代码平台的灵活性不足,需要用户进行二次开发。
[0007]二、大部分低代码平台不能将用户的需求完整地呈现为用户所需的表单,需要用户自己在低代码平台进行设计,一步步实现需求,不够简便。
[0008]三、低代码平台内置的组件看似种类丰富,实则应用场景非常窄,仅能支持少部分业务需求。
[0009]而一个完善的低代码平台,不仅要满足用户将复杂的业务构建成表单的需求,也要使用户能够更灵活地配置低代码组件,使用户能更简便地使用低代码平台。OpenAI研发的GPT模型以及基于GPT3所研发的ChatGPT在自然语言理解与生成方面体现出了巨大的优势,而它们都是基于Transformer的Encoder或Decoder所搭建。因此,设计研发一种基于BERT与Transformer的低代码平台组件生成方法及工具。

技术实现思路

[0010]本专利技术针对低代码平台的灵活性与可配置性不能满足用户日益增长的需求,提供一种基于BERT与Transformer的低代码平台组件生成方法及工具,来节省低代码开发平台的研发者开发低代码组件的时间和精力,以能够更多地产出各行各业所需要的低代码组件。
[0011]首先,本专利技术的一种基于BERT与Transformer的低代码平台组件生成方法,解决上述技术问题采用的技术方案如下:
[0012]一种基于BERT与Transformer的低代码平台组件生成方法,该方法利用BERT模型的语义分析能力将用户对其需要的组件描述进行语义分析,利用Transformer的Decoder将上述对语义分析的结果转化为组件的JSON schema,并将其通过低代码平台的渲染器呈现在低代码平台的画布中。
[0013]具体的,所涉及方法的具体实现流程如下:
[0014]S1、制定将要生成组件的自然语言描述规范;
[0015]S2、基于规范,用户提供将要生成组件的自然语言描述语句;
[0016]S3、对用户提供的语句进行分词,得到分词数组,对分词数组中的分词进行标记,得到标记数组,使用word2vec方法将分词数组和标记数组转换为可输入给BERT模型的向量;
[0017]S4、BERT模型对输入向量进行编码,随后输出到Transformer的多层Decoder中进行解码,解码后的信息即为组件的JSON schema;
[0018]S5、低代码平台将组件的JSON schema渲染到画布中供用户使用。
[0019]可选的,执行步骤S3,将用户提供的语句切分为若干中文单词,放入一个数组中,数组中的每个元素为一个中文单词,此数组称为分词数组;
[0020]随后,根据规范,对分词数组中的分词进行标记,将标记结果同样放入一个数组中,此数组称为标记数组,标记数组中的标记用来帮助BERT模型理解用户的自然语言描述与组件JSON schema格式中具体要填入的属性之间的关系。
[0021]进一步可选的,执行步骤S3,使用word2vec方法将分词数组转换为可输入给BERT模型的三个向量:分词数组词向量、文本向量、位置向量,其中分词数组词向量为词的向量表示,其中的元素为词语被映射到实数的向量,文本向量用于区分两个句子的编码向量,位置向量用于对不同位置的字/词分别附加一个不同的向量以作区分;
[0022]使用word2vec方法将标记数组转换为可输入给BERT模型的标记数组词向量,若标记数组词向量的长度比分词数组词向量的长度短,通过对标记数组词向量短于分词数据词向量的位置进行补0,即可对齐两个向量的维度,对齐维度之后,将分词数组词向量与标记数组词向量的值按元素相加得到结果向量,该结果向量融合了两个词向量中的信息,将此结果向量作为输入BERT模型的词向量即可。
[0023]进一步可选的,将结果向量、文本向量、位置向量输入BERT模型,BERT模型对输入向量进行编码。
[0024]其次,本专利技术的一种基于BERT与Transformer的低代码平台组件生成工具,解决上述技术问题采用的技术方案如下:
[0025]一种基于BERT与Transformer的低代码平台组件生成工具,其包括:
[0026]制定模块,用于制定将要生成组件的自然语言描述规范,用户基于规范提供将要生成组件的自然语言描述语句;
[0027]语句处理模块,用于对用户提供的语句进行分词,得到分词数组,用于对分词数组中的分词进行标记,得到标记数组,还用于使用word2vec方法将分词数组和标记数组转换为可输入给BERT模型的向量;
[0028]向量处理模块,用于利用BERT模型对输入向量进行编码,利用Transformer的多层Decoder进行解码,解码后的信息即为组件的JSON schema,低代码平台的渲染器将组件的
JSON schema渲染到画布中供用户使用。
[0029]可选的,所涉及语句处理模块将用户提供的语句切分为若干中文单词,放入一个数组中,数组中的每个元素为一个中文单词,此数组称为分词数组;
[0030]语句处理模块根据规范,对分词数组中的分词进行标记,将标记结果同样放入一个数组中,此数组称为标记数组,标记数组中的标记用来帮助BERT模型理解用户的自然语言描述与组件JSON schema格式中具体要填入的属性之间的关系。
[0031]进一步可选的,所涉及语句处理模块使用word2vec方法将分词数组转换为可输入给BERT模型的三个向量:分词数组词向量、文本向量、位置向量,其中分词数组词向量为词的向量表示,其中的元素为词语被映射到实数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于BERT与Transformer的低代码平台组件生成方法,其特征在于,该方法利用BERT模型的语义分析能力将用户对其需要的组件描述进行语义分析,利用Transformer的Decoder将上述对语义分析的结果转化为组件的JSON schema,并将其通过低代码平台的渲染器呈现在低代码平台的画布中。2.根据权利要求1所述的一种基于BERT与Transformer的低代码平台组件生成方法,其特征在于,所述方法的具体实现流程如下:S1、制定将要生成组件的自然语言描述规范;S2、基于规范,用户提供将要生成组件的自然语言描述语句;S3、对用户提供的语句进行分词,得到分词数组,对分词数组中的分词进行标记,得到标记数组,使用word2vec方法将分词数组和标记数组转换为可输入给BERT模型的向量;S4、BERT模型对输入向量进行编码,随后输出到Transformer的多层Decoder中进行解码,解码后的信息即为组件的JSON schema;S5、低代码平台将组件的JSON schema渲染到画布中供用户使用。3.根据权利要求2所述的一种基于BERT与Transformer的低代码平台组件生成方法,其特征在于,执行步骤S3,将用户提供的语句切分为若干中文单词,放入一个数组中,数组中的每个元素为一个中文单词,此数组称为分词数组;随后,根据规范,对分词数组中的分词进行标记,将标记结果同样放入一个数组中,此数组称为标记数组,标记数组中的标记用来帮助BERT模型理解用户的自然语言描述与组件JSON schema格式中具体要填入的属性之间的关系。4.根据权利要求3所述的一种基于BERT与Transformer的低代码平台组件生成方法,其特征在于,执行步骤S3,使用word2vec方法将分词数组转换为可输入给BERT模型的三个向量:分词数组词向量、文本向量、位置向量,其中分词数组词向量为词的向量表示,其中的元素为词语被映射到实数的向量,文本向量用于区分两个句子的编码向量,位置向量用于对不同位置的字/词分别附加一个不同的向量以作区分;使用word2vec方法将标记数组转换为可输入给BERT模型的标记数组词向量,若标记数组词向量的长度比分词数组词向量的长度短,通过对标记数组词向量短于分词数据词向量的位置进行补0,即可对齐两个向量的维度,对齐维度之后,将分词数组词向量与标记数组词向量的值按元素相加得到结果向量,该结果向量融合了两个词向量中的信息,将此结果向量作为输入BERT模型的词向量即可。5.根据权利要求4所述的一种基于BERT与Transformer的低代码平台组件生成方法,其特征在于,将结果向量、...

【专利技术属性】
技术研发人员:李博张连超陈晏鹏许金源姜波
申请(专利权)人:浪潮软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1