【技术实现步骤摘要】
一种数据表联接方法、系统、终端及存储介质
[0001]本专利技术属于企业数据管理服务
,具体涉及一种数据表联接方法、系统、终端及存储介质。
技术介绍
[0002]企业统计报表是企业掌握级业务部门收集数据的重要来源之一,通过各级业务部门的具体数据汇总、分析的而成。企业统计报表是为企业经营决策管理提供统计信息,而针对不同层级的决策者所需的统计信息和报表格式也是不一样的。例如有的部门展示“月销售量”,而在整个企业中需要展示“季度销售量”,在企业进行汇总统计时,则需要手动添加新的字段“季度销售量”,将“月销售量”的字段值进行计算得到“季度销售量”的字段值。目前市面上出现了专门服务于企业的数据管理的系统,仍是延续企业常用的表格管理的形式。针对上述问题,若要各部门重新提供统一格式的统计报表,或者将各部门各式格式的统计报表进行手动汇总,均会增加了工作量,而且在此过程中会造成数据管理权限的乱用。因此需要一种根据字段的实际情况进行数据表联接的方法。
技术实现思路
[0003]针对现有技术的上述不足,本专利技术提供一种数据 ...
【技术保护点】
【技术特征摘要】
1.一种数据表联接方法,其特征在于,包括:通过分析表题要素,确定所有数据表与第一数据表的的关联度;根据关联度和数据量确定所有数据表的联接优先级;根据联接优先级确定第一数据表要联接的第二数据表;通过分析字段要素,确定第二数据表中以字段为单位的计算式模板;接收用户调用计算式模板并填入字段的操作,得到完整的自定义计算式;根据自定义计算式调整第二数据表的字段和第一数据表相同,将调整后的第二数据表的字段值合并到第一数据表形成联接后的第三数据表。2.根据权利要求1所述的数据表联接方法,其特征在于,所述通过分析表题要素,确定所有数据表与第一数据表的的关联度,包括:通过机器学习方式训练得到的神经网络模型作为要素识别模型,识别当前两个数据表的表题要素,所述表题要素包括一个核心要素和至少一个一般要素;划分各个表题要素的关联度分值占比,需要保证核心要素的关联度分值占比大于一般要素之和;通过某一项表题要素的余弦相似度和该表题要素的关联度分值占比确定该表题要素的关联度分值;将各个表题要素的关联度分值之和作为两个数据表的关联度。3.根据权利要求1所述的数据表联接方法,其特征在于,所述根据关联度和数据量确定所有数据表的联接优先级,包括:查询所有数据表的数据量;确定用户选定的第一数据表,将与第一数据表的关联度在预设的关联度阈值范围内的数据表作为第一目标范围,在第一目标范围内确定数据量最小的数据表为第一目标数据表;所述预设的关联度阈值范围为,历史操作中用户手动关联的两个数据表之间的关联度的最大值和最小值组成范围;将与第一目标数据表的关联度在预设的关联度阈值范围内的数据表作为第二目标范围,在第二目标范围内确定数据量最小的数据表为第二目标数据表,直到得到所有数据表的联接顺序;在预设的关联度阈值范围内存在数据量最小值相等的至少两个数据表时,优先选择关联度高的数据表作为要联接的下一数据表;在关联度和数据量均相等时随机确定优先级。4.根据权利要求1所述的数据表联接方法,其特征在于,所述通过分析字段要素,确定第二数据表中以字段为单位的计算式模板,包括:识别第一数据表和第二数据表的行列分布结构,确定的计算式模板为透视表行列转换;分析第一数据表的第一字段名和第二数据表的第二字段名,筛选出具备语义关系的第一字段名和第二字段名,语义关系包括:等同关系、上位关系;确定的计算式模板为多字段求和函数和字段拆解函数;分析第一数据表的第一字段值和第二数据表的第二字段值,筛选出具有计...
【专利技术属性】
技术研发人员:李春博,高志,张磊,刘杰,
申请(专利权)人:青岛庚泽信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。