一种基于数据编码的大数据智慧仓储管理系统技术方案

技术编号:38762106 阅读:9 留言:0更新日期:2023-09-10 10:35
本申请涉及数据处理领域,具体提供一种基于数据编码的大数据智慧仓储管理系统,该管理系统包括:数据采集模块,用于获取待处理数据,待处理数据包括多条数据信息序列,每一数据信息序列对应每一商品的管理参数;编码模块,用于对待处理数据中每一条数据信息序列进行编码,进而得到每一条数据信息序列对应的实际编码结果;代表字符确定模块,用于基于实际编码结果与理想编码结果的差异性确定每一条数据信息序列的代表字符;聚类模块,用于基于每一条数据信息序列的代表字符对待处理数据进行聚类,进而得到聚类结果。该方法通过代表数据信息序列的代表字符进行聚类,可以减小计算量,提高算法效率,使得聚类结果的稳定性和准确性较高。确性较高。确性较高。

【技术实现步骤摘要】
一种基于数据编码的大数据智慧仓储管理系统


[0001]本申请涉及数据处理领域,特别是涉及一种基于数据编码的大数据智慧仓储管理系统。

技术介绍

[0002]在大数据处理中,对于数据聚类的操作通常需要将数据进行标准化、归一化等处理,以便于各个数据维度之间的比较和统计。
[0003]然而,在直接对标准化后的数据进行聚类时,由于数据量巨大,可能出现同质性较弱、聚类效果不稳定等情况,同时,有些数据的特征不够明显或者难以区分,导致直接聚类难以得到良好的结果,因此往往需要通过数据编码的方法对数据进行聚类,一方面减少数据维度,另一方面提取关键信息和特征,便于后续操作。
[0004]对于智慧仓储管理系统而言,仓储系统中的每个商品都有其各种信息。包括货物的来源、目的地、运输方式、运输时间、车辆调度等信息,通过对这些信息进行聚类分析,可以优化仓库物流布局和调度,减少物流时间和成本,而现有的数据编码往往采用频繁项集编码方法对数据进行编码,当数据维度较高时,频繁项集算法需要计算大量候选项集和子集的支持度,计算复杂度会随之增加,导致算法效率降低。

技术实现思路

[0005]本专利技术提供一种基于数据编码的大数据智慧仓储管理系统,能够解决对智慧仓储管理系统中各种信息进行聚类分析时,采用现有的数据编码计算复杂度高、算法效率低的问题。
[0006]为解决上述技术问题,本申请采用的第一个技术方案是:提供一种基于数据编码的大数据智慧仓储管理系统,包括:数据采集模块,用于获取待处理数据,所述待处理数据包括多条数据信息序列,每一数据信息序列对应每一商品的管理参数;编码模块,用于对所述待处理数据中每一条数据信息序列进行编码,进而得到每一条数据信息序列对应的实际编码结果;代表字符确定模块,用于基于所述实际编码结果与理想编码结果的差异性确定每一条数据信息序列的代表字符;聚类模块,用于基于每一条数据信息序列的代表字符对所述待处理数据进行聚类,进而得到聚类结果。
[0007]在一可选实施例中,所述编码模块用于:利用所述待处理数据中每一条数据信息序列的字符排列方式对数据信息序列进行编码,进而得到每一条数据信息序列对应的实际编码结果;利用所述待处理数据中每一条数据信息序列的字符字典顺序对数据信息序列进行编码,进而得到每一条数据信息序列对应的理想编码结果。
[0008]在一可选实施例中,所述编码模块包括:第一编码模块,用于利用全排列算法确定每一条数据信息序列中所有字符的排列方式组合,所述排列方式组合包括多个字符序列,每一字符序列表示一种字符排列方式,基于所述排列方式组合中的多个字符序列利用BWT编码方式对数据信息序列进行编码,以得到多个第一编码结果,多个第一编码结果组成所述实际编码结果;第二编码模块,用于确定所述待处理数据中每一条数据信息序列的字符字典顺序,基于字典字符序列利用BWT编码方式对数据信息序列进行编码,以得到多个第二编码结果,多个第二编码结果组成所述理想编码结果;其中,所述字符字典顺序包括多个字典顺序,所述第一编码结果与第二编码结果一一对应。
[0009]在一可选实施例中,所述代表字符确定模块包括:差异性计算模块,用于基于每一条数据信息序列的实际编码结果与理想编码结果的差异确定每一条数据信息序列中每一字符的差异性;字符确定模块,用于基于每一字符的差异性确定所述数据信息序列的代表字符。
[0010]在一可选实施例中,所述差异性计算模块用于:基于每一条数据信息序列的实际编码结果与理想编码结果的差异确定每一条数据信息序列中每一字符的综合差异性;基于每一字符的综合差异性和字符在数据信息序列中出现的频率计算得到数据信息序列中每一字符的差异性。
[0011]在一可选实施例中,所述差异性计算模块用于:计算所述实际编码结果中每一所述第一编码结果的每一字符的编码距离,和理想编码结果中与所述第一编码结果对应的第二编码结果的每一字符的字典距离的之间的差值,将计算得到的差值的绝对值,与较大值的比值作为距离差异性,对计算的所有距离差异性求均值,将计算的均值作为每一条数据信息序列中每一字符的综合差异性;所述较大值为所述实际编码结果中每一所述第一编码结果的每一字符的编码距离,和理想编码结果中与所述第一编码结果对应的第二编码结果的每一字符的字典距离中的较大值。
[0012]在一可选实施例中,所述差异性计算模块用于:基于第二编码结果对应的字典字符距离序列计算所述第二编码结果的每一字符的字典距离;其中,字典字符距离序列中每一元素为两种字符之间的字典距离。
[0013]在一可选实施例中,所述差异性计算模块用于:计算第一编码结果中当前字符与所有参考字符之间的平均距离之和,基于计算的和与当前字符在所述第一编码结果中出现的次数计算当前字符与参考字符之间的距离,进而得到第一编码结果的编码字符距离序列,所述编码字符距离序列中每一元素为两种字符之间的编码距离;基于所述第一编码结果对应的编码字符距离序列计算第一编码结果的每一字符的编码距离。
[0014]在一可选实施例中,所述字符确定模块用于:对每一字符的差异性进行归一化处理;将归一化处理后的差异性小于预设值的字符作为候选字符;基于候选字符的频率和归一化处理后的差异性确定所述数据信息序列的代表字
符。
[0015]在一可选实施例中,所述字符确定模块还用于:计算每一候选字符的频率和归一化处理后的差异性的比值;将比值大于1的候选字符作为所述数据信息序列的代表字符。
[0016]本申请的有益效果,区别于现有技术,本申请的基于数据编码的大数据智慧仓储管理系统,包括:数据采集模块,用于获取待处理数据,所述待处理数据包括多条数据信息序列,每一数据信息序列对应每一商品的管理参数;编码模块,用于对所述待处理数据中每一条数据信息序列进行编码,进而得到每一条数据信息序列对应的实际编码结果;代表字符确定模块,用于基于所述实际编码结果与理想编码结果的差异性确定每一条数据信息序列的代表字符;聚类模块,用于基于每一条数据信息序列的代表字符对所述待处理数据进行聚类,进而得到聚类结果。该方法通过代表数据信息序列的代表字符对不同的数据信息序列进行聚类,可以减小计算量,提高算法效率,使得聚类结果的稳定性和准确性较高。
附图说明
[0017]图1为本专利技术基于数据编码的大数据智慧仓储管理系统的一实施例的结构示意图;图2为图1中编码模块的一实施例的结构示意图;图3为图1中代表字符确定模块的一实施例的结构示意图。
具体实施方式
[0018]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0019]下面结合附图和实施例对本申请进行详细的说明。
[0020]参见图1,图1为本专利技术基于数据编码的大数据智慧仓储管理系统的一实施例的结构示意图。
[0021]具本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据编码的大数据智慧仓储管理系统,其特征在于,包括:数据采集模块,用于获取待处理数据,所述待处理数据包括多条数据信息序列,每一数据信息序列对应每一商品的管理参数;编码模块,用于对所述待处理数据中每一条数据信息序列进行编码,进而得到每一条数据信息序列对应的实际编码结果;代表字符确定模块,用于基于所述实际编码结果与理想编码结果的差异性确定每一条数据信息序列的代表字符;聚类模块,用于基于每一条数据信息序列的代表字符对所述待处理数据进行聚类,进而得到聚类结果。2.根据权利要求1所述的一种基于数据编码的大数据智慧仓储管理系统,其特征在于,所述编码模块用于:利用所述待处理数据中每一条数据信息序列的字符排列方式对数据信息序列进行编码,进而得到每一条数据信息序列对应的实际编码结果;利用所述待处理数据中每一条数据信息序列的字符字典顺序对数据信息序列进行编码,进而得到每一条数据信息序列对应的理想编码结果。3.根据权利要求2所述的一种基于数据编码的大数据智慧仓储管理系统,其特征在于,所述编码模块包括:第一编码模块,用于利用全排列算法确定每一条数据信息序列中所有字符的排列方式组合,所述排列方式组合包括多个字符序列,每一字符序列表示一种字符排列方式,基于所述排列方式组合中的多个字符序列利用BWT编码方式对数据信息序列进行编码,以得到多个第一编码结果,多个第一编码结果组成所述实际编码结果;第二编码模块,用于确定所述待处理数据中每一条数据信息序列的字符字典顺序,基于字典字符序列利用BWT编码方式对数据信息序列进行编码,以得到多个第二编码结果,多个第二编码结果组成所述理想编码结果;其中,所述字符字典顺序包括多个字典顺序,所述第一编码结果与第二编码结果一一对应。4.根据权利要求3所述的一种基于数据编码的大数据智慧仓储管理系统,其特征在于,所述代表字符确定模块包括:差异性计算模块,用于基于每一条数据信息序列的实际编码结果与理想编码结果的差异确定每一条数据信息序列中每一字符的差异性;字符确定模块,用于基于每一字符的差异性确定所述数据信息序列的代表字符。5.根据权利要求4所述的一种基于数据编码的大数据智慧仓储管理系统,其特征在于,所述差异性计算模块用于:基于每一条数据信息序列的实...

【专利技术属性】
技术研发人员:王阳王国超王浩王亮曹磊
申请(专利权)人:合肥恒艺德机械有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1