一种基于机器学习的脱敏方法、装置及脱敏设备制造方法及图纸

技术编号：21300140 阅读：54 留言：0更新日期：2019-06-12 08:04

本发明专利技术实施例涉及数据处理技术领域，例如涉及一种基于机器学习的脱敏方法、装置、脱敏设备及存储介质。方法包括：获取数据源，基于数据源提取特征向量，使用预设的基于神经网络的人工智能模型对特征向量进行分析，获得分析结果，最后根据分析结果对数据源进行脱敏，获得脱敏后的数据，由此能够深度挖掘出隐藏的敏感数据。

A Desensitization Method, Device and Equipment Based on Machine Learning

The embodiment of the present invention relates to the technical field of data processing, such as a desensitization method, device, desensitization device and storage medium based on machine learning. The methods include: acquiring data sources, extracting feature vectors based on data sources, analyzing feature vectors using presupposed artificial intelligence model based on neural network, obtaining analysis results, and finally desensitizing the data sources according to the analysis results, obtaining desensitized data, thus deep mining of hidden sensitive data.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的脱敏方法、装置及脱敏设备
本专利技术涉及数据处理
，尤其是涉及一种基于机器学习的脱敏方法、装置、脱敏设备及存储介质。
技术介绍
随着大数据时代的发展，数据安全问题日益突出。在科学研究、产品开发、数据公开的过程中，算法需要收集、使用用户数据，在这过程中数据就不可避免的暴露在外。现如今很多数据安全厂商推出了数据脱敏产品，在对传统的脱敏产品研究中发现，传统的敏感数据发现功能大都基于规则匹配，无法精确深度的挖掘出隐藏的敏感数据。
技术实现思路
本专利技术的主要目的在于提供一种基于机器学习的脱敏方法、装置、脱敏设备及存储介质，能够深度挖掘敏感数据。第一方面，本专利技术实施例提供了一种基于机器学习的脱敏方法，包括以下步骤：获取数据源，并基于所述数据源提取特征向量；使用预设的基于神经网络的人工智能模型对所述特征向量进行分析，获得分析结果；根据所述分析结果对所述数据源进行脱敏，获得脱敏后的数据。在一些实施例中，所述方法还包括：获取基于神经网络的人工智能模型；所述获取基于神经网络的人工智能模型，包括：获取样本数据及对应的标签，并局域所述样本数据提取样本特征向量；将所述样本特征向量及对应的标签基于BiLSTM神经网络模型进行迭代训练，获取所述基于BiLSTM神经网络模型的各个参数；基于所述基于BiLSTM神经网络模型提取特征信息；将所述特征信息导入条件随机场得到基于神经网络的人工智能模型。在一些实施例中，所述方法还包括：使用预设的基于决策树人工智能模型对所述脱敏后的数据进行分析；根据分析结果对所述脱敏后的数据进行再次脱敏。在一些实施例中，所述方法还包括：获...

【技术保护点】
1.一种基于机器学习的脱敏方法，其特征在于，包括以下步骤：获取数据源，并基于所述数据源提取特征向量；使用预设的基于神经网络的人工智能模型对所述特征向量进行分析，获得分析结果；根据所述分析结果对所述数据源进行脱敏，获得脱敏后的数据。

【技术特征摘要】
1.一种基于机器学习的脱敏方法，其特征在于，包括以下步骤：获取数据源，并基于所述数据源提取特征向量；使用预设的基于神经网络的人工智能模型对所述特征向量进行分析，获得分析结果；根据所述分析结果对所述数据源进行脱敏，获得脱敏后的数据。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取基于神经网络的人工智能模型；所述获取基于神经网络的人工智能模型，包括：获取样本数据及对应的标签，并基于所述样本数据提取样本特征向量；将所述样本特征向量及对应的标签基于BiLSTM神经网络模型进行迭代训练，获取所述基于BiLSTM神经网络模型的各个参数；基于所述基于BiLSTM神经网络模型提取特征信息；将所述特征信息导入条件随机场得到基于神经网络的人工智能模型。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：使用预设的基于决策树的人工智能模型对所述脱敏后的数据进行分析；根据分析结果对所述脱敏后的数据进行再次脱敏。4.根据权利要求3所述的方法，其特征在于，所述方法还包括：获取基于决策树的人工智能模型；所述基于决策树的人工智能模型，包括：获取训练数据及对应的标签，并基于所述训练数据提取训练特征向量；将所述训练特征向量及对应的标签基于决策树的人工智能模型进行迭代训练，获取所述基于决策树的人工智能模型的各个参数。5.根据权利要求2所述的方法，其特征在于，所述基于所述数据源提取特征向量，包括:使用word2vec将所述数据源转换为数学向量；所述基于所述样本数据提取样本特征向量，包括：使用word2vec将所述样本数据转换为数学向量。6.根...

【专利技术属性】
技术研发人员：王祎鑫，刘华春，
申请(专利权)人：深圳昂楷科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人