当前位置: 首页 > 专利查询>王四春专利>正文

一种跨境电商商务大数据中隐私数据的发现与分类方法技术

技术编号:18576328 阅读:34 留言:0更新日期:2018-08-01 11:22
本发明专利技术公开了一种跨境电商商务大数据中隐私数据的发现与分类方法,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据。

A method of discovering and classifying privacy data in cross-border e-commerce business data

The invention discloses a method for the discovery and classification of privacy data in the large business data of cross-border e-commerce, including the establishment of a characteristic database, the feature database includes the format files of the address and contact mode used by the e-commerce platform, the establishment of an address database, and the address database, which includes several geographical names, and each place name pair A unique number; the establishment of a database of privacy data storage; the comparison of the large data of the e-commerce platform to the format files of the addresses and contacts stored in the characteristic database; the data in the single data of the large data of the e-commerce platform is identified as implicit in the data matching the grid file with the address and contact mode in the large data of the e-commerce platform. Private data; if there is no matching data, the data is deleted; the single data identified as privacy data is processed one by one.

【技术实现步骤摘要】
一种跨境电商商务大数据中隐私数据的发现与分类方法
本专利技术涉及电子商务
,具体为一种跨境电商商务大数据中隐私数据的发现与分类方法。
技术介绍
2013年被称为跨境电商元年,全国跨境电子商务交易额达到3.1万亿元人民币;2014年,政策支持力度加强,多地建了跨境电商园区与平台。面对海淘一族的迅速兴起,以及其背后所蕴含的巨大商机,跨境贸易电子商务已成为我国对外贸易新增长点,同时,也倒逼出口企业对物流、仓储等配套的改革。近两年,跨境电商发展非常迅速,政策的支持更让跨境电商如虎添翼。随着跨境电商的发展,在未来市场上必定会涌现越来越多的跨境电商物流供应商,但在跨境电商发展的过程中隐私安全也逐步突显,成为跨境电商发展的过程急需解决的问题。
技术实现思路
本专利技术的目的在于提供一种跨境电商商务大数据中隐私数据的发现与分类方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种跨境电商商务大数据中隐私数据的发现与分类方法,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名后的小地名),接着除去联系方式中的文字,仅保留其中的号码,形成客户名称+地址编号+联系号码的数据;如单条数据中无地址数据或联系方式数据,则其地址编号和联系号码均用特定的编号代替;将形成的客户名称+地址编号+联系号码的数据中地址编号+联系号码部分经过加密算法运算形成新的字符串;将新的字符串与客户名称合并,形成新的数据;接着将新的数据存储到隐私数据储存数据库;如需查看隐私数据,其查看方法如下:首先将隐私数据储存数据库中的单条数据中除客户名称以外的字符串经与加密算法对应的解密算法运算,得出原始的地址编号+联系号码,然后依据地址编号查询地址数据库得到对应的地址,最后合并客户名称、地址和联系号码。优选的,所述地址数据库的建立方法如下,以大区域地名作为一个集合,大区域地名集合下包括该区域内的所有次级区域地名,依照此方法依次向下细化,详细到县级区域地名。优选的,所述代替地址编号和联系号码的特定的编号为两种编号,且该特定的编号不与地址数据库中的地名编号重合。与现有技术相比,本专利技术的有益效果是:本专利技术提出的一种跨境电商商务大数据中隐私数据的发现与分类方法针对电商平台上的客户信息,可快速分辨出有关于客户的隐私数据;并且对隐私数据进行加工,使隐私数据成为编号串,单独的编号串无法直接分析出隐私信息,有利于对客户隐私的保护;分开建立地址数据库和隐私数据储存数据库,提高了数据保护的性能。具体实施方式下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术提供一种技术方案:一种跨境电商商务大数据中隐私数据的发现与分类方法,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;所述地址数据库的建立方法如下,以大区域地名作为一个集合,大区域地名集合下包括该区域内的所有次级区域地名,依照此方法依次向下细化,详细到县级区域地名。建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名后的小地名),接着除去联系方式中的文字,仅保留其中的号码,形成客户名称+地址编号+联系号码的数据;如单条数据中无地址数据或联系方式数据,则其地址编号和联系号码均用特定的编号代替;所述代替地址编号和联系号码的特定的编号为两种编号,且该特定的编号不与地址数据库中的地名编号重合。将形成的客户名称+地址编号+联系号码的数据中地址编号+联系号码部分经过加密算法运算形成新的字符串;将新的字符串与客户名称合并,形成新的数据;接着将新的数据存储到隐私数据储存数据库;如需查看隐私数据,其查看方法如下:首先将隐私数据储存数据库中的单条数据中除客户名称以外的字符串经与加密算法对应的解密算法运算,得出原始的地址编号+联系号码,然后依据地址编号查询地址数据库得到对应的地址,最后合并客户名称、地址和联系号码。本专利技术提出的一种跨境电商商务大数据中隐私数据的发现与分类方法针对电商平台上的客户信息,可快速分辨出有关于客户的隐私数据;并且对隐私数据进行加工,使隐私数据成为编号串,单独的编号串无法直接分析出隐私信息,有利于对客户隐私的保护;分开建立地址数据库和隐私数据储存数据库,提高了数据保护的性能。尽管已经示出和描述了本专利技术的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本专利技术的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本专利技术的范围由所附权利要求及其等同物限定。本文档来自技高网...

【技术保护点】
1.一种跨境电商商务大数据中隐私数据的发现与分类方法,其特征在于,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名后的小地名),接着除去联系方式中的文字,仅保留其中的号码,形成客户名称+地址编号+联系号码的数据;如单条数据中无地址数据或联系方式数据,则其地址编号和联系号码均用特定的编号代替;将形成的客户名称+地址编号+联系号码的数据中地址编号+联系号码部分经过加密算法运算形成新的字符串;将新的字符串与客户名称合并,形成新的数据;接着将新的数据存储到隐私数据储存数据库;如需查看隐私数据,其查看方法如下:首先将隐私数据储存数据库中的单条数据中除客户名称以外的字符串经与加密算法对应的解密算法运算,得出原始的地址编号+联系号码,然后依据地址编号查询地址数据库得到对应的地址,最后合并客户名称、地址和联系号码。...

【技术特征摘要】
1.一种跨境电商商务大数据中隐私数据的发现与分类方法,其特征在于,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名后的小地名),接着除去联系方式中的文字,仅保留其中的号码,形成客户名称+地址编号+联系号码的数据;如单条数据中无地址数据或联系方式数据,则其地址编号和联系号码均用特定的编号代替;将形成的客户名称+地址编号+联系...

【专利技术属性】
技术研发人员:王四春王旖旎夏飞
申请(专利权)人:王四春
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1