用于web开发系统中自定义表单获取数据的高效存储方法技术方案

技术编号:37045233 阅读:20 留言:0更新日期:2023-03-29 19:24
本发明专利技术涉及数据压缩技术领域,具体涉及一种用于web开发系统中自定义表单获取数据的高效存储方法,该方法包括:获取web开发系统中的数据并进行编码得到待更新数据;获取待更新数据的整体波动区间,得到至少两个压缩周期;获取当前压缩周期内的不同类型数据,并获取每个长度的字符串的收益值,以得到对应类型数据的稳定长度;基于每个类型数据的稳定长度得到毗邻压缩周期中的待更新字符串,获取每个待更新字符串的奖励系数和惩罚系数,进而根据奖励系数和惩罚系数得到更新系数;基于更新系数获取更新字符串,对所有压缩周期中的更新字符串进行更新得到待更新数据对应的压缩数据,保证了压缩效果的同时提高了压缩效率。压缩效果的同时提高了压缩效率。压缩效果的同时提高了压缩效率。

【技术实现步骤摘要】
用于web开发系统中自定义表单获取数据的高效存储方法


[0001]本专利技术涉及数据压缩
,具体涉及一种用于web开发系统中自定义表单获取数据的高效存储方法。

技术介绍

[0002]在基于Web项目的开发中,常常利用自定义表单对数据进行采集,通俗来讲是一种可以由用户输入并提交给服务器端的一个图像界面数据采集的环节,其所收集的信息基本为英文与数字等文本形式的用户信息;而对于一个热门的网站来说,其表单需要收集不同来源的许多用户的信息数据,大量的信息数据在进行存储时十分的占用存储资源。
[0003]对web开发系统中的自定义表单所收集到的用户信息在服务器端进行存储时,现有存储方式一般是对获取到的数据进行压缩然后再进行存储,以节省存储资源,常用的压缩算法有很多,例如LZW压缩算法,该算法是一种基于字典匹配的压缩算法,在对文本类型的数据进行压缩时的压缩率较大,能够提供较好的压缩效果;但是利用LZW算法进行压缩时,常常因为字典的冗余导致压缩的效率较低,现有为了提高压缩效率的解决方法是直接对字典进行清除,虽然节省了压缩时间,但是同样也会导致压缩本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于web开发系统中自定义表单获取数据的高效存储方法,其特征在于,该方法包括以下步骤:获取web开发系统中的数据并进行编码得到待更新数据;获取待更新数据的整体波动区间,根据所述整体波动区间将待更新数据划分为至少两个压缩周期;获取当前压缩周期内的不同类型数据,根据任意类型数据中每个长度的字符串的出现次数获取字符串对应的收益值,基于所述收益值得到对应类型数据的稳定长度;将当前压缩周期的下一压缩周期记为毗邻压缩周期,并基于每个类型数据的稳定长度得到所述毗邻压缩周期中的待更新字符串,根据所述毗邻压缩周期中每个待更新字符串的长度以及出现次数获取对应待更新字符串的奖励系数和惩罚系数;根据所述惩罚系数以及所述奖励系数得到对应待更新字符串的更新系数;基于所述更新系数获取更新字符串,对所有压缩周期中的更新字符串进行更新得到待更新数据对应的压缩数据,对所述压缩数据进行存储。2.根据权利要求1所述的一种用于web开发系统中自定义表单获取数据的高效存储方法,其特征在于,所述获取待更新数据的整体波动区间的步骤,包括:获取待更新数据中所有数据的平均值;将待更新数据中大于所述平均值的数据记为第一数据,待更新数据中小于所述平均值的数据记为第二数据;获取待更新数据中所有第一数据与所述平均值之间的差值绝对值的平均值并向上取整作为上基准参数;获取待更新数据中所有第二数据与所述平均值之间的差值绝对值的平均值并向上取整作为下基准参数;根据所述上基准参数和所述下基准参数分别作为区间上限和区间下限得到整体波动区间;若所述上基准参数与所述下基准参数相等,设定预设变量,将所述上基准参数与所述预设变量相加得到区间上限,将所述下基准系数与所述预设变量相减得到区间下限,以构建整体波动区间。3.根据权利要求2所述的一种用于web开发系统中自定义表单获取数据的高效存储方法,其特征在于,所述根据所述整体波动区间将待更新数据划分为至少两个压缩周期的步骤,包括:选取待更新数据中预设数量的数据作为第一局部数据,获取所述第一局部数据的局部波动区间,判断所述局部波动区间与所述整体波动区间是否相同,若相同,第一局部数据构成第一压缩周期;若不相同,将待更新数据中所述第一局部数据后的数据补充入所述第一局部数据,直至数据补充后的第一局部数据的局部波动区间与整体波动区间相同得到第一压缩周期;以待更新数据中第一压缩周期后的数据再次构建预设数量的数据的第二局部数据,根据局部波动区间与整体波动区间相同时的第二局部数据得到第二压缩周期,以此类推,将待压缩周期中的数据划分完毕得到至少两个压缩周期。4.根据权利要求1所述的一种用于web开发系统中自定义表单获取数据的高效存储方法,其特征在于,所述根据任意类型数据中每个长度的字符串的出现次数获取字符串对应的收益值的步骤,包括:
获取当前压缩周期之前的每个压缩周期,将当前压缩周期及其之前的每个压缩周期记为历史压缩周期;所述收益值的计算为:其中,表示当前压缩周期中第g个类型数据的长度为s
g
的字符串的收益值;m

表示历史压缩周期的数量,m

∈[2,M];s
g
表示字符串的长度;q
m
表示第g个类型数据的长度为s
g
的字符串在第m个历史压缩周期中的出现次数,m∈[1,m

];M表示待更新数据中所有压缩周期的数量;I表示待更新数据中所有数据的数量;表示第m

个压缩周期中第g个类型数据的长度为s
g
的字符串在所有历史压缩周期中出现次数的方差;exp表示以自然常数e为底的指数函数。5.根据权利要求1所述的一种用于web开发系统中自定义表单获取数据的高效存储方法,其特征在于,所述基于所述收益值得到对应类型数据的稳定长度的步骤,包括:获取每个类型数据中收益值最大时的字符串的长度,以收益值最大时的字符串的长度作为对应类型数据的稳定长度。6.根据权利要求1所述的一种用于web开发系统中自定义表单获取数据的高效存储方法,其特征在于,所述基于每个类型数据的稳定长度得到所述毗邻压缩周期中的待更新字符串的步骤,包括:获取所述毗邻压缩周期中不同的类型数据,选取每个类型数据中长度大于对应的稳定长度的字符串为待更新字符串。7.根据权利要求1所述的一种用于web开发系统中自定义表单获取数据的高效存储方法...

【专利技术属性】
技术研发人员:文星陈侦
申请(专利权)人:广东道一信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1