The invention discloses a method for the discovery and classification of privacy data in the large business data of cross-border e-commerce, including the establishment of a characteristic database, the feature database includes the format files of the address and contact mode used by the e-commerce platform, the establishment of an address database, and the address database, which includes several geographical names, and each place name pair A unique number; the establishment of a database of privacy data storage; the comparison of the large data of the e-commerce platform to the format files of the addresses and contacts stored in the characteristic database; the data in the single data of the large data of the e-commerce platform is identified as implicit in the data matching the grid file with the address and contact mode in the large data of the e-commerce platform. Private data; if there is no matching data, the data is deleted; the single data identified as privacy data is processed one by one.
【技术实现步骤摘要】
一种跨境电商商务大数据中隐私数据的发现与分类方法
本专利技术涉及电子商务
,具体为一种跨境电商商务大数据中隐私数据的发现与分类方法。
技术介绍
2013年被称为跨境电商元年,全国跨境电子商务交易额达到3.1万亿元人民币;2014年,政策支持力度加强,多地建了跨境电商园区与平台。面对海淘一族的迅速兴起,以及其背后所蕴含的巨大商机,跨境贸易电子商务已成为我国对外贸易新增长点,同时,也倒逼出口企业对物流、仓储等配套的改革。近两年,跨境电商发展非常迅速,政策的支持更让跨境电商如虎添翼。随着跨境电商的发展,在未来市场上必定会涌现越来越多的跨境电商物流供应商,但在跨境电商发展的过程中隐私安全也逐步突显,成为跨境电商发展的过程急需解决的问题。
技术实现思路
本专利技术的目的在于提供一种跨境电商商务大数据中隐私数据的发现与分类方法,以解决上述
技术介绍
中提出的问题。为实现上述目的,本专利技术提供如下技术方案:一种跨境电商商务大数据中隐私数据的发现与分类方法,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名 ...
【技术保护点】
1.一种跨境电商商务大数据中隐私数据的发现与分类方法,其特征在于,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名后的小地名),接着除去联系方式中的文字,仅保留其中的号码,形成客户名称+地址编号+联系号码的数据;如单条数据中无地址数据或联系方式数据,则其地址编号和联系号码均用特定的编号代替;将形成的客户名称+地址编号+联系号码的数据中地址编号+联系号码部分经过加密算法运算形成新的字符串;将新的字符串与客户名称合并,形成新的数据;接着将新的数据存储到隐私数据储存数据库;如需查看隐私数据,其查看方法如下:首先将隐私数据储存 ...
【技术特征摘要】
1.一种跨境电商商务大数据中隐私数据的发现与分类方法,其特征在于,包括:建立特征数据库,特征数据库包括电商平台所使用的地址和联系方式的格式文件;建立地址数据库,地址数据库包括若干个区域地名,且每个地名对应一个唯一的编号;建立隐私数据储存数据库;将电商平台的大数据逐条与特征数据库中存储的地址和联系方式的格式文件对比;若电商平台的大数据中的单条数据中存在与地址和联系方式的格式文件相匹配的数据则认定为隐私数据;若不存在相匹配的数据则删除该条数据;逐条处理认定为隐私数据的单条数据,依据地址数据库内的数据将单条数据内的地址替换为编号形式,然后去除单条数据里的符号和地址数据部分尾部(县级区域地名后的小地名),接着除去联系方式中的文字,仅保留其中的号码,形成客户名称+地址编号+联系号码的数据;如单条数据中无地址数据或联系方式数据,则其地址编号和联系号码均用特定的编号代替;将形成的客户名称+地址编号+联系...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。