辨识机密数据的方法及电子装置制造方法及图纸

技术编号:14799844 阅读:89 留言:0更新日期:2017-03-14 21:53
本发明专利技术提供一种辨识机密数据的方法及电子装置。电子装置利用代表特殊格式的格式特征来判断数据中是否有特殊格式。接着,电子装置再利用代表特殊格式为机密数据的多个机密因子进一步判断数据中的特殊格式是否为机密数据。据此,本发明专利技术实施方式所提供的辨识机密数据的方法及电子装置可以提供笔数不多但却包含大量机密描述的数据正确的机密等级,且可辨识出具有特殊格式的机密数据,进而避免数据外泄。

【技术实现步骤摘要】

本专利技术提供一种辨识机密数据的方法及电子装置,特别是关于一种辨识档案中的特殊格式是否为机密数据的方法及电子装置。
技术介绍
辨识机密数据的技术是使用于数据保护的相关议题。通过辨识机密数据的机制,将可进一步辨识潜在高机密程度的机密数据。现有的机密数据辨识技术仅针对个人数据或机密字符串进行分析辨识,且机密等级大多和找到的类型和笔数成正比。对于笔数不多,却包含大量机密描述的数据(如履历、病历等)无法提供正确的机密等级。此外,现有的机密数据辨识技术为对大量已知数据的整个内容进行学习以取得已知数据的特征后,再将上述特征与待辨识数据进行特征比对来判断待辨识数据是否为机密数据。故现有的机密数据辨识技术只能找出和已知数据相同或相似的机密数据,并无法找出和已知数据使用同样模板或格式的机密数据。因此,若能提供笔数不多但却包含大量机密描述的数据正确的机密程度,且可辨识出具有特殊模板或格式的机密数据,将可避免数据外泄。
技术实现思路
本专利技术实施方式提供一种辨识机密数据的方法,适用于一电子装置。电子装置存储有多个辨识群组。每一辨识群组对应到一特殊格式。以及每一辨识群组具有代表特殊格式的一格式特征与具有代表特殊格式为机密数据的多个机密因子。上述辨识机密数据的方法的步骤如下。撷取多个数据中的一个,并将其定义为一撷取数据。撷取多个格式特征中的一个,并将其定义为一撷取特征。在电子装置根据撷取特征判断撷取数据是否具有对应的特殊格式。若电子装置判断撷取数据具有对应的特殊格式,电子装置判断特殊格式所对应的多个机密因子在撷取数据中的出现频率是否大于等于一机密阈值。其中,若电子装置判断出现频率大于等于一机密阈值,代表撷取数据中的特殊格式为机密数据;若电子装置判断出现频率小于机密阈值,代表撷取数据中的特殊格式不为机密数据。在电子装置判断多个格式特征中是否有未撷取的格式特征。若电子装置判断多个格式特征中有未撷取的格式特征,则撷取尚未撷取的格式特征,并改以定义未撷取的格式特征为撷取特征,以重新根据撷取特征判断撷取数据是否具有对应的特殊格式。而若电子装置判断多个格式特征中没有尚未撷取的格式特征,则撷取多个数据的下一数据,并改以定义下一数据为撷取数据,以重新判断撷取数据是否具有对应的特殊格式。本专利技术实施方式提供一种辨识机密数据的电子装置。电子装置包含一存储单元、一撷取单元与一辨识单元。存储单元用以存储多个辨识群组。每一辨识群组对应到一特殊格式。以及每一辨识群组具有代表特殊格式的一格式特征与具有代表特殊格式为机密数据的多个机密因子。撷取单元电连接存储单元,以撷取多个数据与多个辨识群组。而辨识单元为电连接撷取单元,并用以执行下列步骤。通过撷取单元撷取多个数据中的一个,并将其定义为一撷取数据。通过撷取单元撷取多个格式特征中的一个,并将其定义为一撷取特征。根据撷取特征判断撷取数据是否具有对应的特殊格式。若辨识单元判断撷取数据具有对应的特殊格式,辨识单元判断特殊格式所对应的多个机密因子在撷取数据中的一出现频率是否大于等于一机密阈值。其中,若辨识单元判断出现频率大于等于一机密阈值,代表撷取数据中的特殊格式为机密数据。若辨识单元判断出现频率小于机密阈值,代表撷取数据中的特殊格式不为机密数据。接着判断多个格式特征中是否有尚未撷取的格式特征。若辨识单元判断多个格式特征中有尚未撷取的格式特征,则通过该撷取单元撷取未撷取的格式特征,并改以定义未撷取的格式特征为撷取特征,以重新根据撷取特征判断撷取数据是否具有对应的特殊格式。而若辨识单元判断多个格式特征中没有尚未撷取的格式特征,则通过该撷取单元撷取多个数据的下一数据,并改以定义下一数据为撷取数据,以重新判断撷取数据是否具有对应的特殊格式。此外,本专利技术实施方式还提供一种计算机可读记录介质记录一组计算机可执行程序,当计算机可读记录介质被处理器读取时,处理器可执行上述辨识机密数据的方法中的步骤。综合以上所述,本专利技术实施方式所提供的辨识机密数据的方法、电子装置及计算机可读记录介质可以判断具有特殊格式的数据,其特殊格式是否为机密数据。据此,本专利技术实施方式所提供的辨识机密数据的方法、电子装置及计算机可读记录介质可以提供笔数不多但却包含大量机密描述的数据正确的机密等级,且可辨识出具有特殊格式的机密数据,进而避免数据外泄。为使能更进一步了解本专利技术的特征及
技术实现思路
,请参阅以下有关本发明的详细说明与附图,但是此等说明与所附附图仅系用来说明本专利技术,而非对本专利技术的权利范围作任何的限制。附图说明图1是本专利技术一实施方式的辨识机密数据的电子装置的示意图。图2A至图2B是本专利技术一实施方式的辨识机密数据的方法的流程图。图3A至图3B是本专利技术一实施方式的电子装置判断撷取数据具有表格的示意图。图4A至图4B是本专利技术另一实施方式的电子装置判断撷取数据具有列表的示意图。图5A至图5B是本专利技术另一实施方式的电子装置判断撷取数据具有样式的示意图。图6是本专利技术另一实施方式的电子装置判断接收到的数据中的特殊格式,其内容是否为机密数据的示意图。具体实施方式在下文中,将通过附图说明本专利技术的各种例示实施方式来详细描述本专利技术。然而,本专利技术概念可能以许多不同形式来体现,且不应解释为限于本文中所阐述的例示性实施方式。此外,在附图中相同参考数字可用以表示类似的组件。本专利技术实施方式提供一种辨识机密数据的电子装置,其利用代表特殊格式的格式特征来判断数据中是否有特殊格式,接着电子装置再利用代表特殊格式为机密数据的多个机密因子进一步判断数据中的特殊格式是否为机密数据。另外,本专利技术实施方式还提供对应执行于电子装置中的一种辨识机密数据的方法,其中辨识机密数据的方法可以使用韧体、软件或硬件电路的方式实现于电子装置中。首先,请参考图1,图1是本专利技术一实施方式的辨识机密数据的电子装置的示意图。如图1所示,辨识机密数据的电子装置100是用来辨识电子装置100所接收到的数据,其数据中的特殊格式的内容是否为机密数据,以避免数据外泄。在本实施方式中,电子装置100可为智能型手机、桌面计算机、笔记本电脑、或是其他可接收数据的电子装置。而电子装置100可设置在用户计算机与远程服务器之间(未绘于附图中),以辨识用户计算机与远程服务器之间所传输的数据中的特殊格式是否为机密数据。又或者电子装置100可电连接在用户计算机上(未绘于附图中),使得电子装本文档来自技高网
...

【技术保护点】
一种辨识机密数据的方法,适用于一电子装置,所述电子装置存储有多个辨识群组,每一所述辨识群组对应到一特殊格式,每一所述辨识群组具有代表所述特殊格式的一格式特征与具有代表所述特殊格式为所述机密数据的多个机密因子,其特征在于,所述辨识机密数据的方法包含:撷取多个数据中的一个,并将其定义为一撷取数据;撷取所述格式特征中的一个,并将其定义为一撷取特征;在所述电子装置根据所述撷取特征判断所述撷取数据是否具有对应的所述特殊格式,若所述电子装置判断所述撷取数据具有对应的所述特殊格式,判断所述特殊格式所对应的所述机密因子在所述撷取数据中的一出现频率是否大于等于一机密阈值,其中若所述电子装置判断所述出现频率大于等于一机密阈值,代表所述撷取数据中的所述特殊格式为所述机密数据,且若所述电子装置判断所述出现频率小于所述机密阈值,代表所述撷取数据中的所述特殊格式不为所述机密数据;及在所述电子装置判断所述格式特征中是否有未撷取的所述格式特征,若所述电子装置判断所述格式特征中有未撷取的所述格式特征,撷取未撷取的所述格式特征,并改以定义未撷取的所述格式特征为所述撷取特征,以重新根据所述撷取特征判断所述撷取数据是否具有对应的所述特殊格式,且若所述电子装置判断所述格式特征中没有未撷取的所述格式特征,撷取所述数据的下一数据,并改以定义所述下一数据为所述撷取数据,以重新判断所述撷取数据是否具有对应的所述特殊格式。...

【技术特征摘要】
2014.10.01 TW 1031342311.一种辨识机密数据的方法,适用于一电子装置,所述电子装置存储
有多个辨识群组,每一所述辨识群组对应到一特殊格式,每一所述
辨识群组具有代表所述特殊格式的一格式特征与具有代表所述特殊
格式为所述机密数据的多个机密因子,其特征在于,所述辨识机密
数据的方法包含:
撷取多个数据中的一个,并将其定义为一撷取数据;
撷取所述格式特征中的一个,并将其定义为一撷取特征;
在所述电子装置根据所述撷取特征判断所述撷取数据是否具
有对应的所述特殊格式,若所述电子装置判断所述撷取数据具有对
应的所述特殊格式,判断所述特殊格式所对应的所述机密因子在所
述撷取数据中的一出现频率是否大于等于一机密阈值,其中若所述
电子装置判断所述出现频率大于等于一机密阈值,代表所述撷取数
据中的所述特殊格式为所述机密数据,且若所述电子装置判断所述
出现频率小于所述机密阈值,代表所述撷取数据中的所述特殊格式
不为所述机密数据;及
在所述电子装置判断所述格式特征中是否有未撷取的所述格
式特征,若所述电子装置判断所述格式特征中有未撷取的所述格式
特征,撷取未撷取的所述格式特征,并改以定义未撷取的所述格式
特征为所述撷取特征,以重新根据所述撷取特征判断所述撷取数据
是否具有对应的所述特殊格式,且若所述电子装置判断所述格式特
征中没有未撷取的所述格式特征,撷取所述数据的下一数据,并改
以定义所述下一数据为所述撷取数据,以重新判断所述撷取数据是
否具有对应的所述特殊格式。
2.根据权利要求1所述的辨识机密数据的方法,其中,若所述电子装
置判断所述撷取数据不具有对应的所述特殊格式,判断所述格式特
征中是否有未撷取的所述格式特征。
3.根据权利要求1所述的辨识机密数据的方法,其中,在所述电子装
置判断所述格式特征中没有未撷取的所述格式特征后,还包含步骤:
所述电子装置根据所述机密因子与所述机密因子出现在所述数据中
的次数对所述撷取数据进行分类。
4.根据权利要求1所述的辨识机密数据的方法,其中,在根据所述撷
取特征判断所述撷取数据是否具有对应的所述特殊格式的步骤中,
所述撷取特征包含同一行具有二个行结束处,且若所述电子装置判
断所述特殊格式中同一行具有二个行结束处的数量大于等于一格式
阈值,所述电子装置判断所述撷取数据具有所述特殊格式。
5.根据权利要求1所述的辨识机密数据的方法,其中,在根据所述撷
取特征判断所述撷取数据是否具有对应的所述特殊格式的步骤中,
所述格式特征包含一特定键所发出的一消息,且若所述特殊格式中
具有所述消息的数量大于等于一格式阈值,判断所述撷取数据具有
所述特殊格式。
6.根据权利要求1所述的辨识机密数据的方法,其中,在根据所述撷
取特征判断所述撷取数据是否具有对应的所述特殊格式的步骤中,
所述格式特征包含一自定义特征,且若所述特殊格式中具有所述自
定义特征的数量大于一格式阈值,判断所述撷取数据具有所述特殊
格式。
7.根据权利要求1所述的辨识机密数据的方法,其中,每一所述辨识
群组的所述机密因子包含至少一字符、至少一字符串、至少一符号、
至少一数字、至少一执行指令与至少一格式中的一个或其组合。
8.根据权利要求1所述的辨识机密数据的方法,其中,每一所述格式
特征包含至少一字符、至少一字符串、至少一符号、至少一数字、
至少一执行指令与至少一格式中的一个或其组合。
9.一种辨识机密数据的电子装置,其特征在于,包含:
一存储单元,用以存储多个辨识群组,每一所述辨识群组对应
到一特殊格式,且每一所述辨识群组具有代表所述特殊格式的一格
式特征与具有代表所述特殊格式为所述机密数据的多个机密因子;
一撷取单元,电连接所述...

【专利技术属性】
技术研发人员:叶信延刘建宗
申请(专利权)人:财团法人资讯工业策进会
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1