一种数据分类方法及系统技术方案

技术编号:20944740 阅读:39 留言:0更新日期:2019-04-24 02:29
本申请实施例提供了一种数据分类方法及系统,所述数据分类方法应用于第一电子设备中,包括:获得待分类数据;处理所述待分类数据;对处理结果进行加密,以使所述待分类数据由第一显示形态变为第二显示形态,至少所述第二显示形态能够被远端分类器识别;发送加密后的待分类数据至所述远端分类器进行数据分类。本申请实施例数据分类方法用于解决数据经远端分类器进行分类时造成的数据易泄露的技术问题,提高数据分类过程中的数据安全性。

A Data Classification Method and System

The embodiment of this application provides a data classification method and system, which is applied to the first electronic device, including: obtaining the data to be classified; processing the data to be classified; encrypting the processing results so that the data to be classified can be changed from the first display form to the second display form, and at least the second display form can be recognized by the remote classifier. The encrypted data to be classified is sent to the remote classifier for data classification. The data classification method in the embodiment of this application is used to solve the technical problem of data leaking when data is classified by a remote classifier, and to improve the data security in the process of data classification.

【技术实现步骤摘要】
一种数据分类方法及系统
本申请实施例涉及数据分类领域,特别涉及一种数据分类方法及系统。
技术介绍
远端计算的兴起(比如云服务),给使用者带来了极大的便利,随需而用。由于文本数据的大量存在,文本数据的分析挖掘成为了充分利用文本数据价值的有效途经,而文本分类则又是文本分析中一个常用的并且非常基础的文本数据分析功能;同时对于文本安全而言,如果能将文本数据依据安全属性进行分类,则文本的安全防护效果则能得到较大提升。云服务厂商提供了数据分类功能,可以方便使用者调用,在使用分类服务时,需要把文档以明文方式上传到云服务上进行计算,经过计算后,返回数据的分类信息。文本数据需要以明文方式提交给各种分类器进行算法训练和优化,导致重要的数据存在被泄露的风险。另外,在进行文本分类时,同样是对明文进行处理,同样存在数据安全风险。申请内容本申请实施例提供了一种用于解决数据经远端分类器进行分类时造成的数据易泄露的数据分类方法及系统。为了解决上述技术问题,本申请实施例提供了一种数据分类方法,应用于第一电子设备中,所述方法包括:获得待分类数据;处理所述待分类数据;对处理结果进行加密,以使所述待分类数据由第一显示形态变本文档来自技高网...

【技术保护点】
1.一种数据分类方法,其特征在于,应用于第一电子设备中,所述方法包括:获得待分类数据;处理所述待分类数据;对处理结果进行加密,以使所述待分类数据由第一显示形态变为第二显示形态,至少所述第二显示形态能够被远端分类器识别;发送加密后的待分类数据至所述远端分类器进行数据分类。

【技术特征摘要】
1.一种数据分类方法,其特征在于,应用于第一电子设备中,所述方法包括:获得待分类数据;处理所述待分类数据;对处理结果进行加密,以使所述待分类数据由第一显示形态变为第二显示形态,至少所述第二显示形态能够被远端分类器识别;发送加密后的待分类数据至所述远端分类器进行数据分类。2.根据权利要求1所述的方法,其特征在于,所述待分类数据为文本数据,所述处理所述待分类数据包括:对所述待分类数据进行词法分析;基于分析结果确定实际所需分类数据。3.根据权利要求2所述的方法,其特征在于,所述基于分析结果确定实际所需分类数据包括:获得经所述词法分析得到的词条集合;剔除所述词条集合中的干扰词条而得到所述所需分类数据。4.根据权利要求1所述的方法,其特征在于,所述对处理结果进行加密,以使所述待分类数据由第一显示形态变为第二显示形态包括:对所述处理结果通过对称加密算法进行加密计算,以使所述待分类数据由第一显示形态变为第二显示形态。5.一种数据分类方法,其特征在于,包括:远端分类器基于获得的加密后的待分类数据进行数据分类;将加密形式的分类结果发送至第一电子设备。6.根据权利要求5所述的方法,其特征在于,所述在数据分...

【专利技术属性】
技术研发人员:宋鹏举郭丹阳王圣光张倩瑜
申请(专利权)人:北京天融信网络安全技术有限公司北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1