【技术实现步骤摘要】
量化式数据分析方法以及量化式数据分析装置
本专利技术是有关于一种量化式数据分析方法,且特别是有关于一种与信息安全相关的数据分析方法。
技术介绍
近年来,一些研究机构指出,全球企业因资料外泄所造成的损失,达1兆美元以上,一些研究报告也指出,2011年的资料外泄个案是2010年的五倍多,而企业安全的十大威胁中,“员工不经意中而泄漏重要信息”和“资料被内部成员窃取”等威胁分别位于第二和第五名,由内部成员外泄机密的事件逐年增加,已与外部入侵窃取机密的比例相当。为了保护企业内部的重要数据,许多企业均采用信息安全(informationsecurity)管理系统来监控企业内部的各种信息,避免重要数据外流而造成企业的重大损失。一般而言,这些企业的信息安全政策会对计算机的文档写出权限、光盘烧录权限、文档打印权限、软/硬件使用权限、网页浏览权限、网络传输权限及记录查询...等做出设定与纪录,以对企业内部的计算机信息进行控管。然而,目前企业内部所采用的信息安全控管方法,大多无法十分准确有效地找出需要保密的文件,极有可能将一般员工的私人文件也当成机敏文件处理,造成员工的困扰;或是需要庞大的资源来对企业内部的文件进行管控,消耗了庞大的人力与物力成本。
技术实现思路
因此,本专利技术的一方面是在提供一种量化式数据分析方法,能够有效且准确地对企业内部的文件或是应用程序进行管控,降低人力与物力成本。依据本专利技术一实施例,量化式数据分析方法应用于一计算机系统当中,以判断一待测文件是否具敏感性,此量化式数据分析方法是取得计算机系统当中的一样本数据;对样本数据的内容进行分段,以取得至少一原始数 ...
【技术保护点】
一种量化式数据分析方法,其特征在于,应用于一计算机系统当中,以判断一待测文件是否具敏感性,该量化式数据分析方法包含:取得该计算机系统当中的一样本数据;对该样本数据的内容进行分段,以取得至少一原始数据段落;对该原始数据段落进行划分,以取得多个原始文句;自该些原始文句当中撷取出多个原始文句属性;以及依据该些原始文句属性,建立多个训练特征向量,其中,该些训练特征向量是用以判断该待测文件是否具敏感性。
【技术特征摘要】
1.一种量化式数据分析方法,其特征在于,应用于一计算机系统当中,以判断一待测文件是否具敏感性,该量化式数据分析方法包含:取得该计算机系统当中的一样本数据;对该样本数据的内容进行分段,以取得至少一原始数据段落;对该原始数据段落进行划分,以取得多个原始文句;自该些原始文句当中撷取出多个原始文句属性;依据该些原始文句属性,建立多个训练特征向量;修改该样本数据;对修改后的该样本数据的内容进行分段,以取得至少一修改数据段落;对该修改数据段落进行划分,以取得多个修改文句;自该些修改文句当中撷取出多个修改文句属性;依据该些修改文句属性,建立多个修改特征向量;以及依据该些训练特征向量以及该些修改特征向量之间的差异大小,决定一差异临界值,其中当对需要检验的一待测文件进行分析时,还包含:取得该待测文件的一待测数据;对该待测数据的内容进行分段,以取得至少一待测数据段落;对该待测数据段落进行划分,以取得多个待测文句;自该些待测文句当中撷取出多个待测文句属性;依据该些待测文句属性,建立多个待测特征向量;自该些待测特征向量当中择一,作为一现行待测特征向量;依据该现行待测特征向量,筛选出一训练特征向量子集合;计算该现行待测特征向量与该训练特征向量子集合的各元素的差异;依据与各元素的差异,判断该现行待测特征向量是否具有相似性;当该现行待测特征向量具相似性,参考一邻近边界值,检查该现行待测特征向量先前的多个待测向量是否具相似性;以及当该些待测向量具相似性,判定该待测文件具敏感性,其中,该些训练特征向量是用以判断该待测文件是否具敏感性。2.根据权利要求1所述的量化式数据分析方法,其特征在于,还包含:将该些训练特征向量储存至该计算机系统的一数据库当中,以在该数据库当中累积该些训练特征向量。3.根据权利要求1所述的量化式数据分析方法,其特征在于,该些待测文句属性包含字数、空白数目、逗号数目、引号数目、冒号数目、分号数目,以及英文与数字数目。4.根据权利要求1所述的量化式数据分析方法,其特征在于,是依据该现行待测特征向量以及一参数矩阵,筛选出与该现行待测特征向量数值相似的该训练特征向量子集合。5.根据权利要求1所述的量化式数据分析方法,其特征在于,当判断出该待测文件具敏感性时,回报一肯定值。6.根据权利要求1所述的量化式数据分析方法,其特征在于,当判断出该待测文件不具敏感性时,回报一否定值。7.一种量化式数据分析装置,其特征在于,内建于一电子装置当中,以判断一待测文件或...
【专利技术属性】
技术研发人员:游国正,刘建宗,蔡奕安,
申请(专利权)人:财团法人资讯工业策进会,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。