基于大数据的电商平台用户分类方法技术

技术编号:36537965 阅读:13 留言:0更新日期:2023-02-01 16:27
本发明专利技术涉及加密解密算法技术领域,具体涉及一种基于大数据的电商平台用户分类方法,该方法包括:获取用户信息对应的序列化数据,根据初始序列化数据构建加密字典;将用户信息序列化数据分割为多个明文块,根据明文块获取加密校验码,根据加密校验码查找加密字典中的加密数据,获取加密数据的改变方式,根据改变方式对各明文块进行改变得到密文数据;将密文数据分割为多个密文块,获取解密校验码,根据解密校验码查找加密字典中的加密数据,进而对各密文块进行解密得到解密数据;根据解密数据获取用户信息,根据用户信息对用户进行分类。本发明专利技术可抵抗统计分析攻击,提高了数据传输过程中的机密性。中的机密性。中的机密性。

【技术实现步骤摘要】
基于大数据的电商平台用户分类方法


[0001]本专利技术涉及加密解密算法
,具体涉及一种基于大数据的电商平台用户分类方法。

技术介绍

[0002]随着信息技术的快速发展,用户线上消费的比重越来越高。电商平台为了保持客户粘度,往往需要对不同的用户群体进行分类,以便给用户更好的推送服务。为准确的分类,需要基于用户的基本信息、消费习惯、行为特征等进行大数据分析。用户的基本信息、消费习惯、行为特征(统称用户信息)由不同的用户信息收集服务器进行收集,在进行用户分类时,需传输至用户分类服务器进行分析。
[0003]在用户信息传输过程中,要对用户信息进行加密防止用户隐私泄露,同时防止攻击者截获用户信息泄露给电商平台竞争对手,竞争对手利用用户信息针对性吸引客流导致电商平台用户流失。现有的加密方法,如AES将相同的明文块加密成相同的密文块,难以抵抗统计分析攻击,且时间效率较低。

技术实现思路

[0004]为了解决上述技术问题,本专利技术的目的在于提供一种基于大数据的电商平台用户分类方法,所采用的技术方案具体如下:
[0005]获取用户信息并将其转换为二进制的序列化数据,记为用户信息序列化数据;对于一定长度的初始序列化数据,通过改变初始序列化数据中不同比特位的值得到加密数据,构成加密字典;
[0006]将用户信息序列化数据均匀分割为多个明文块,将每个明文块的第一个比特位的值构成加密校验码;根据加密校验码在加密字典中查找各明文块对应的加密数据,获取各明文块对应的加密数据的改变方式;根据改变方式对各明文块中的数据进行改变得到密文数据;并且用户信息收集服务器将密文数据传输至用户分类服务器;
[0007]获取用户分类服务器中的密文数据,将密文数据分割为多个密文块,获取每个密文块第一个比特位的值组成解密校验码;根据解密校验码在加密字典中查找各密文块对应的加密数据,获取各密文块加密数据的改变方式;根据改变方式对各密文块中的数据进行改变得到解密数据;
[0008]对解密数据进行反序列化得到用户信息,根据所述用户信息对用户进行分类。
[0009]优选地,所述加密字典的获取方法具体为:
[0010]获取数据长度为k的初始序列化数据,通过改变该数据中0个或一个或多个比特位的值得到加密数据,改变方式共有2
k
种,根据加密数据和其对应的改变方式构建加密字典。
[0011]优选地,所述根据加密校验码在加密字典中查找各明文块对应的加密数据具体为:
[0012]将每个明文块的第一个比特位记为校验位,获取各明文块中除校验位外剩余数据
长度;
[0013]根据各明文块在用户信息序列化数据中的位置顺序,获取加密校验码中从对应顺序的比特位开始与所述剩余数据长度相同的序列,根据该序列在加密字典中查找得到明文块对应的加密数据。
[0014]优选地,所述密文数据的获取方法具体为:
[0015]获取各明文块中除第一个比特位外的剩余数据,根据所述改变方式对各明文块的剩余数据进行改变得到密文数据。
[0016]优选地,所述根据解密校验码在加密字典中查找各密文块对应的加密数据具体为:
[0017]根据各密文块在密文数据中的位置顺序,获取解密校验码中从对应顺序的比特位开始与除第一个比特位外剩余数据长度相同的序列,根据该序列在加密字典中查找得到密文块对应的加密数据。
[0018]优选地,所述解密数据的获取方法具体为:
[0019]获取各密文块中除第一个比特位外的剩余数据,根据密文块加密数据对应的改变方式对各密文块对应的所述剩余数据进行改变得到解密数据。
[0020]优选地,所述根据所述用户信息对用户进行分类具体为:利用FC神经网络根据用户信息对用户进行分类。
[0021]本专利技术实施例至少具有如下有益效果:
[0022]本专利技术通过随机设置改变方式获取相应的加密方法,对不同的明文块进行不同方式的改变,可实现将相同的明文块加密成不同的密文块或者将不同的明文块加密成相同的密文块,增加了密文的复杂性,可抵抗统计分析攻击。同时,不同明文块加密可并行进行,加密效率高。本专利技术提高了加密结果的复杂性以及加密的效率,确保了用户信息传输过程中用户信息的机密性。
附图说明
[0023]为了更清楚地说明本专利技术实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
[0024]图1是本专利技术的一种基于大数据的电商平台用户分类方法的方法流程图。
具体实施方式
[0025]为了更进一步阐述本专利技术为达成预定专利技术目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本专利技术提出的一种基于大数据的电商平台用户分类方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
[0026]除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。
[0027]下面结合附图具体的说明本专利技术所提供的一种基于大数据的电商平台用户分类方法的具体方案。
[0028]本专利技术的主要目的是:为保持客户粘度,基于大数据对不同的用户群体进行分类,在用户信息传输过程中,对信息进行加密,确保信息的机密性。
[0029]本专利技术所针对的具体场景为:为保持电商平台用户粘度,需基于大数据对用户进行分类,以便为用户提供更好的推荐服务。在大数据收集传输过程中,需对数据进行加密确保传输过程中数据的机密性。
[0030]实施例:
[0031]请参阅图1,其示出了本专利技术一个实施例提供的一种基于大数据的电商平台用户分类方法的方法流程图,该方法包括以下步骤:
[0032]步骤一,获取用户信息并将其转换为二进制的序列化数据,记为用户信息序列化数据;对于一定长度的初始序列化数据,通过改变初始序列化数据中不同比特位的值得到加密数据,构成加密字典。
[0033]具体地,由多个用户信息收集服务器采集不同用户的基本信息,例如用户注册时填写的性别和年龄等。同时,采集用户的消费习惯信息,例如用户消费商品的类别和金额等。采集用户的行为特征信息,例如退货率、浏览偏好和商品平均成交时长等。将采集到的各种类别的信息构成用户信息,并对采集到的用户信息进行序列化,将其转换为二进制的序列化数据,记为用户信息序列化数据。其中,序列化为公知技术,在此不再过多赘述。所述序列化数据为数据可通信传输可存储的二进制串,便于后续加密传输。同时,需要采集的用户信息实施者可根据实际情况进行选择。
[0034]需要说明的是,用户信息传输过程中需要加密防止用户隐私泄露,同时防止攻击者截获用户信息泄露给电商本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的电商平台用户分类方法,其特征在于,该方法包括以下步骤:获取用户信息并将其转换为二进制的序列化数据,记为用户信息序列化数据;对于一定长度的初始序列化数据,通过改变初始序列化数据中不同比特位的值得到加密数据,构成加密字典;将用户信息序列化数据均匀分割为多个明文块,将每个明文块的第一个比特位的值构成加密校验码;根据加密校验码在加密字典中查找各明文块对应的加密数据,获取各明文块对应的加密数据的改变方式;根据改变方式对各明文块中的数据进行改变得到密文数据;并且用户信息收集服务器将密文数据传输至用户分类服务器;获取用户分类服务器中的密文数据,将密文数据分割为多个密文块,获取每个密文块第一个比特位的值组成解密校验码;根据解密校验码在加密字典中查找各密文块对应的加密数据,获取各密文块加密数据的改变方式;根据改变方式对各密文块中的数据进行改变得到解密数据;对解密数据进行反序列化得到用户信息,根据所述用户信息对用户进行分类。2.根据权利要求1所述的一种基于大数据的电商平台用户分类方法,其特征在于,所述加密字典的获取方法具体为:获取数据长度为k的初始序列化数据,通过改变该数据中0个或一个或多个比特位的值得到加密数据,改变方式共有2
k
种,根据加密数据和其对应的改变方式构建加密字典。3.根据权利要求1所述的一种基于大数据的电商平台用户分类方法,其特征在于,所述根据加...

【专利技术属性】
技术研发人员:董晏余丁振坤
申请(专利权)人:郑州利贞信息技术有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1