【技术实现步骤摘要】
本专利技术提供一种辨识机密数据的方法及电子装置,特别是关于一种辨识档案中的特殊格式是否为机密数据的方法及电子装置。
技术介绍
辨识机密数据的技术是使用于数据保护的相关议题。通过辨识机密数据的机制,将可进一步辨识潜在高机密程度的机密数据。现有的机密数据辨识技术仅针对个人数据或机密字符串进行分析辨识,且机密等级大多和找到的类型和笔数成正比。对于笔数不多,却包含大量机密描述的数据(如履历、病历等)无法提供正确的机密等级。此外,现有的机密数据辨识技术为对大量已知数据的整个内容进行学习以取得已知数据的特征后,再将上述特征与待辨识数据进行特征比对来判断待辨识数据是否为机密数据。故现有的机密数据辨识技术只能找出和已知数据相同或相似的机密数据,并无法找出和已知数据使用同样模板或格式的机密数据。因此,若能提供笔数不多但却包含大量机密描述的数据正确的机密程度,且可辨识出具有特殊模板或格式的机密数据,将可避免数据外泄。
技术实现思路
本专利技术实施方式提供一种辨识机密数据的方法,适用于一电子装置。电子装置存储有多个辨识群组。每一辨识群组对应到一特殊格式。以及每一辨识群组具有代表特殊格式的一格式特征与具有代表特殊格式为机密数据的多个机密因子。上述辨识机密数据的方法的步骤如下。撷取多个数据中的一个,并将其定义为一撷取数据。撷取多个格式特征中的一个,并将其定义为一撷取特征。在电子装置根据撷取特征判断撷取数 ...
【技术保护点】
一种辨识机密数据的方法,适用于一电子装置,所述电子装置存储有多个辨识群组,每一所述辨识群组对应到一特殊格式,每一所述辨识群组具有代表所述特殊格式的一格式特征与具有代表所述特殊格式为所述机密数据的多个机密因子,其特征在于,所述辨识机密数据的方法包含:撷取多个数据中的一个,并将其定义为一撷取数据;撷取所述格式特征中的一个,并将其定义为一撷取特征;在所述电子装置根据所述撷取特征判断所述撷取数据是否具有对应的所述特殊格式,若所述电子装置判断所述撷取数据具有对应的所述特殊格式,判断所述特殊格式所对应的所述机密因子在所述撷取数据中的一出现频率是否大于等于一机密阈值,其中若所述电子装置判断所述出现频率大于等于一机密阈值,代表所述撷取数据中的所述特殊格式为所述机密数据,且若所述电子装置判断所述出现频率小于所述机密阈值,代表所述撷取数据中的所述特殊格式不为所述机密数据;及在所述电子装置判断所述格式特征中是否有未撷取的所述格式特征,若所述电子装置判断所述格式特征中有未撷取的所述格式特征,撷取未撷取的所述格式特征,并改以定义未撷取的所述格式特征为所述撷取特征,以重新根据所述撷取特征判断所述撷取数据是否具有对 ...
【技术特征摘要】
2014.10.01 TW 1031342311.一种辨识机密数据的方法,适用于一电子装置,所述电子装置存储
有多个辨识群组,每一所述辨识群组对应到一特殊格式,每一所述
辨识群组具有代表所述特殊格式的一格式特征与具有代表所述特殊
格式为所述机密数据的多个机密因子,其特征在于,所述辨识机密
数据的方法包含:
撷取多个数据中的一个,并将其定义为一撷取数据;
撷取所述格式特征中的一个,并将其定义为一撷取特征;
在所述电子装置根据所述撷取特征判断所述撷取数据是否具
有对应的所述特殊格式,若所述电子装置判断所述撷取数据具有对
应的所述特殊格式,判断所述特殊格式所对应的所述机密因子在所
述撷取数据中的一出现频率是否大于等于一机密阈值,其中若所述
电子装置判断所述出现频率大于等于一机密阈值,代表所述撷取数
据中的所述特殊格式为所述机密数据,且若所述电子装置判断所述
出现频率小于所述机密阈值,代表所述撷取数据中的所述特殊格式
不为所述机密数据;及
在所述电子装置判断所述格式特征中是否有未撷取的所述格
式特征,若所述电子装置判断所述格式特征中有未撷取的所述格式
特征,撷取未撷取的所述格式特征,并改以定义未撷取的所述格式
特征为所述撷取特征,以重新根据所述撷取特征判断所述撷取数据
是否具有对应的所述特殊格式,且若所述电子装置判断所述格式特
征中没有未撷取的所述格式特征,撷取所述数据的下一数据,并改
以定义所述下一数据为所述撷取数据,以重新判断所述撷取数据是
否具有对应的所述特殊格式。
2.根据权利要求1所述的辨识机密数据的方法,其中,若所述电子装
置判断所述撷取数据不具有对应的所述特殊格式,判断所述格式特
征中是否有未撷取的所述格式特征。
3.根据权利要求1所述的辨识机密数据的方法,其中,在所述电子装
置判断所述格式特征中没有未撷取的所述格式特征后,还包含步骤:
所述电子装置根据所述机密因子与所述机密因子出现在所述数据中
的次数对所述撷取数据进行分类。
4.根据权利要求1所述的辨识机密数据的方法,其中,在根据所述撷
取特征判断所述撷取数据是否具有对应的所述特殊格式的步骤中,
所述撷取特征包含同一行具有二个行结束处,且若所述电子装置判
断所述特殊格式中同一行具有二个行结束处的数量大于等于一格式
阈值,所述电子装置判断所述撷取数据具有所述特殊格式。
5.根据权利要求1所述的辨识机密数据的方法,其中,在根据所述撷
取特征判断所述撷取数据是否具有对应的所述特殊格式的步骤中,
所述格式特征包含一特定键所发出的一消息,且若所述特殊格式中
具有所述消息的数量大于等于一格式阈值,判断所述撷取数据具有
所述特殊格式。
6.根据权利要求1所述的辨识机密数据的方法,其中,在根据所述撷
取特征判断所述撷取数据是否具有对应的所述特殊格式的步骤中,
所述格式特征包含一自定义特征,且若所述特殊格式中具有所述自
定义特征的数量大于一格式阈值,判断所述撷取数据具有所述特殊
格式。
7.根据权利要求1所述的辨识机密数据的方法,其中,每一所述辨识
群组的所述机密因子包含至少一字符、至少一字符串、至少一符号、
至少一数字、至少一执行指令与至少一格式中的一个或其组合。
8.根据权利要求1所述的辨识机密数据的方法,其中,每一所述格式
特征包含至少一字符、至少一字符串、至少一符号、至少一数字、
至少一执行指令与至少一格式中的一个或其组合。
9.一种辨识机密数据的电子装置,其特征在于,包含:
一存储单元,用以存储多个辨识群组,每一所述辨识群组对应
到一特殊格式,且每一所述辨识群组具有代表所述特殊格式的一格
式特征与具有代表所述特殊格式为所述机密数据的多个机密因子;
一撷取单元,电连接所述...
【专利技术属性】
技术研发人员:叶信延,刘建宗,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。