【技术实现步骤摘要】
模型构建系统、方法、电子设备及存储介质
[0001]本专利技术涉及模型数据处理
,特别是涉及一种模型构建系统、一种模型构建方法、一种电子设备以及一种计算机可读存储介质。
技术介绍
[0002]在现有技术中,开发人员往往根据实际需求基于单个模型更新为新模型,或者将原模型与其他模型组装成新模型以实现模型的构建,在具体的构建过程中,主要依赖于开发人员事先书写SQL(Structured Query Languag,结构化查询语言)语句查询各个模型的字段信息,然后采用文本编辑器书写用于生成新模型的SQL语句,由于模型信息结果页签和字段信息页签处于不同界面,当从原模型中提取新模型的字段信息时,开发人员不仅需要反复切换模型信息结果页签和字段信息页签,使得模型构建的时间较长、工作效率低下,而且人工提取字段的方式容易出现字段提取错误的风险,导致模型构建不准确。
技术实现思路
[0003]本专利技术实施例是提供一种模型构建系统、方法、电子设备以及计算机可读存储介质,以解决或部分解决在现有的构建模型的过程中,依赖于开发人员 ...
【技术保护点】
【技术特征摘要】
1.一种模型构建系统,其特征在于,所述模型构建系统至少包括模型数据库、与所述模型数据库通信连接的模型分组单元、与所述模型分组单元通信连接的特征分组单元以及模型构建单元,所述模型数据库中包括若干个不同的模型;其中,所述模型分组单元,用于响应于针对所述模型数据库的模型选择指令,获取与所述模型选择指令的主模型以及若干个与所述主模型对应的备选模型,将所述主模型分别与各个所述备选模型进行组合,获得至少两组模型分组;所述特征分组单元,用于获取各组所述模型分组中所述主模型的第一模型属性和第一模型特征,以及所述备选模型的第二模型属性和第二模型特征,并根据所述第一模型属性与所述第二模型属性对所述第一模型特征和所述第二模型特征进行特征分组,获得对应的特征集合,所述特征集合包括第一特征集合和第二特征集合;所述模型构建单元,用于根据各个所述模型分组对应的第一特征集合和第二特征集合进行模型融合,获得与所述各个模型分组对应的融合模型。2.根据权利要求1所述的系统,其特征在于,所述第一模型属性包括第一字段类型,所述第二模型属性包括第二字段类型;所述特征分组单元,用于获取各组所述模型分组中所述主模型的第一字段类型和第一模型特征,以及所述备选模型的第二字段类型和第二模型特征;根据所述第一字段类型与所述第二字段类型对所述第一模型特征和所述第二模型特征进行特征分组,获得对应的特征集合。3.根据权利要求2所述的系统,其特征在于,所述第一模型特征包括主模型字段信息,所述第二模型特征包括备选字段信息,所述第一特征集合包括非数字型特征相同集合和非数字型特征相异集合;所述特征分组单元,用于若所述第一字段类型和所述第二字段类型为非数字型,且所述主模型字段信息与所述备选模型字段信息相等,则对所述第一模型特征和所述第二模型特征进行特征分组,获得对应的非数字型特征相同集合或非数字型特征相异集合;和/或,若所述第一字段类型和所述第二字段类型为所述非数字型,且所述主模型字段信息与所述备选模型字段信息不相等,则对所述第一模型特征和所述第二模型特征进行特征分组,获得对应的非数字型特征相同集合或非数字型特征相异集合。4.根据权利要求3所述的系统,其特征在于,所述主模型字段信息包括主模型字段key,所述备选字段信息包括备选模型字段key;所述特征分组单元,用于若所述第一字段类型和所述第二字段类型为非数字型,且所述主模型字段key与所述备选模型字段key相等,则采用哈希算法分别计算所述模型分组中所述第一模型特征对应的第一哈希值,所述第二模型特征对应的第二哈希值;采用Jaccard系数公式分别计算所述第一哈希值与所述第二哈希值之间的第一相关系数,并将各个所述第一相关系数与对应的预设相关权重进行加权平均计算,获得第一相似度分值;将所述第一相似度分值大于第一预设阈值的第一模型特征和第二模型特征分组至所述非数字型特征相同集合,或将所述第一相似度分值小于或等于所述第一预设阈值的第一模型特征和第二模型特征分组至所述非数字型特征相异集合;其中,所述Jaccard系数公式为:
所述Jaccard系数公式中的X为所述第一哈希值,Y为所述第二哈希值;其中,所述第一模型特征包括主模型名称、主模型维度以及主模型字段注释,所述第二模型特征包括备选模型名称、备选模型维度以及备选模型字段注释。5.根据权利要求4所述的系统,其特征在于,所述特征分组单元,用于若所述第一字段类型和所述第二字段类型为非数字型,且所述主模型字段key与所述备选模型字段key不相等,则采用word2vec算法分别计算所述模型分组中所述第一模型特征对应的第一词向量,所述第二模型特征对应的第二词向量;采用余弦相关度公式分别计算所述第一词向量与所述第二词向量之间的第二相关系数,并将各个所述第二相关系数与对应的预设相关权重进行加权平均计算,获得第二相似度分值;将所述第二相似度分值大于第二预设阈值的第一模型特征和第二模型特征分组至所述非数字型特征相同集合,或将所述第二相似度分值小于或等于所述第二预设阈值的第一模型特征和第二模型特征分组至所述非数字型特征相异集...
【专利技术属性】
技术研发人员:朱红亮,张宝玉,窦康,陈利明,尚德重,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。