一种移动应用安全数据挖掘方法技术

技术编号:21115744 阅读:25 留言:0更新日期:2019-05-16 08:59
本发明专利技术公开了一种移动应用安全数据挖掘方法,步骤为:对数据库进行扩展;利用有限元分析方法对关键字进行计算;将(yt)作为模拟结果,然后对所有数据库变量及其滞后进行回归,针对每个单位根变量的原始水平进行计算,并对每个数据系列进行差分,直到可以消除“虚假值”。本发明专利技术方法提高样本关键字提取的精准度,随着数据重要性“虚假值”的消除使得在数据挖掘过程中威胁分布区间性明确。

A Data Mining Method for Mobile Application Security

【技术实现步骤摘要】
一种移动应用安全数据挖掘方法
本专利技术涉及数据处理领域,尤其是一种数据挖掘方法。
技术介绍
数据挖掘是一种从各种来源收集数据并将其处理成有用信息进行分析的技术,尤其是用于提高公司,机构或组织的运营效率。随着网络和其他与计算机相关的犯罪案件日益增多,计算机网络和移动应用安全已成为大家较为关注的问题。使用数据挖掘类的软件或系统完成数据分析,能够协助使用者从多个维度对当前数据进行分析,并通过数据汇总、数据分类等方法进行推算,将推算结果整理成数据集之间的关系。数据挖掘还可以被定义为确定数据模式与许多数据库之间的关系之间的关系的过程。在商业组织中,获得的信息可用于降低运营成本,最大化收入并提高服务效率。但是在移动应用安全方面,数据挖掘往往存在孤岛化,现有的数据挖掘方式无法满足对组织或机构原有系统基础架构的完整性和可用性,无法将多点的数据进行整个分许,数据挖掘缺乏阀值、数据源,关键字依赖于人工经验,无法利用当前的手段进行数据精度确认以及数据价值确认。
技术实现思路
本专利技术目的在于提供一种移动应用安全数据挖掘方法,用以解决上述技术问题。为实现上述目的,采用了以下技术方案:本专利技术所述方法包括以下步骤:S1,对数据库进行扩展;因为数据库在数据挖掘过程中既可作为“无倾向性实验台”又是一个“实际的”数据来源,能够体现出变量与宏观数据中可能出现的规模和复杂性之间的许多潜在关系;S2,利用有限元分析方法对关键字进行计算,假设P1是一个一维问题:其中,f是已知函数是y关于x的未知函数,y″是y对x的二阶导数。通过有限元分析即可完成对关键性参数y的求导。S3,将(yt)作为模拟结果,它是具有参数向量β的其它数据库变量的子集的观测值(xi,t,i=1,...,k)的线性函数加上一组随机数然后对所有数据库变量及其滞后进行回归:为了确保“真实”的回归量,针对每个单位根变量的原始水平进行计算,并对每个数据系列进行差分,直到可以消除“虚假值”。进一步的,所述数据挖掘任务可以分为以下不同的类别:1)分类:指对已知结构进行概括并将其应用于新数据的任务;2)不规则性检测:此任务表示识别不熟悉的数据记录,这些记录暗示数据集中的异常行为;3)聚类:讨论在不使用数据集中的已知结构的情况下,发现数据中呈现相似性的组和结构的任务;4)概述:此任务的目的是提供数据集的更紧凑的表示,包括可视化和报告生成,以及以下格式的警报:{alert_id:“id”,.:“Subject”,.:“._level”,backing_.:[“.”};集群对于自动查找在特定时间段内出现的新类型的安全威胁至关重要;如下所示的方法:将引用特定主题的文档分组到集群中,并提供每个集群中最频繁出现的术语的列表;其中,J是目标函数,k:是簇的数目,n:是案例的数目,c:簇j的质心。进一步的,集群算法的一般设置如下:1)将数据聚类成k组,其中k是预定义的;2)随机选择k个点作为集群中心;3)根据欧几里得距离函数将对象分配到它们最近的集群中心;4)计算每个集群中所有对象的质心或平均值;5)重复步骤2、3和4,直到在连续几轮中向每个集群分配相同的点。进一步的,设置配置和规范是对安全威胁进行分类;涉及定义一组与每类威胁相关联的搜索术语,即关键词;每个定义的关键词都必须附加一个重要级别,即权重,表示该关键词的出现对每个文档得分的贡献。进一步的,所述关键词列表必须遵循以下格式:1)ThreatClass1:keywords:{[keyword1,weight],[keyword2,weight]...[keywordN,weight]}2)ThreatClass2:keywords{[keyword1,weight],[keyword2,weight]...[keywordN,weight]}..3)ThreatClassN:keywords:{[keyword1,weight],[keyword2,weight]...[keywordN,weight]}。工作过程大致如下:所述方法是在典型的数据挖掘架构基础上,采用有限元分析法对常见安全威胁分类后的关键字进行模拟,通过不同的边界影响因子进行模拟边界圈定,进而提升数据挖掘关键字的精准性;并在已有的数据挖掘方法中进行改进,增添关键字权重参数,使得在不需要考虑整个定义域组的复杂性条件下,消除在数据挖掘过程中的样本可靠性回归量的“虚假值”。与现有技术相比,本专利技术方法具有如下优点:1、本方法基于犯罪模式分析对所提出的关键字进行了仿真。犯罪模式分析可以被定义为提供关于犯罪模式的相关信息的分析技术。仿真过程通过数据挖掘实现,利用快速数据工具对犯罪数据集进行“虚假值”消除。仿真分步骤进行,首先,获得数据集。2、根据需求对所获得的数据集进行过滤,然后根据要进行的分析创建具有这些属性的新数据集。附图说明图1是本专利技术方法的威胁程度分布图。具体实施方式下面结合附图对本专利技术做进一步说明:本专利技术所述方法包括以下步骤:S1,对数据库进行扩展;因为数据库在数据挖掘过程中既可作为“无倾向性实验台”又是一个“实际的”数据来源,能够体现出变量与宏观数据中可能出现的规模和复杂性之间的许多潜在关系;S2,利用有限元分析方法对关键字进行计算,假设P1是一个一维问题:其中,f是已知函数是y关于x的未知函数,y″是y对x的二阶导数。通过有限元分析即可完成对关键性参数y的求导。S3,将(yt)作为模拟结果,它是具有参数向量β的其它数据库变量的子集的观测值(xi,t,i=1,...,k)的线性函数加上一组随机数然后对所有数据库变量及其滞后进行回归:为了确保“真实”的回归量,针对每个单位根变量的原始水平进行计算,并对每个数据系列进行差分,直到可以消除“虚假值”。其中,所述数据挖掘任务可以分为以下不同的类别:1)分类:指对已知结构进行概括并将其应用于新数据的任务;2)不规则性检测:此任务表示识别不熟悉的数据记录,这些记录暗示数据集中的异常行为;3)聚类:讨论在不使用数据集中的已知结构的情况下,发现数据中呈现相似性的组和结构的任务;4)概述:此任务的目的是提供数据集的更紧凑的表示,包括可视化和报告生成,以及以下格式的警报:{alert_id:“id”,.:“Subject”,.:“._level”,backing_.:[“.”};集群对于自动查找在特定时间段内出现的新类型的安全威胁至关重要;如下所示的方法:将引用特定主题的文档分组到集群中,并提供每个集群中最频繁出现的术语的列表;其中,J是目标函数,k:是簇的数目,n:是案例的数目,c:簇j的质心。集群算法的一般设置如下:1)将数据聚类成k组,其中k是预定义的;2)随机选择k个点作为集群中心;3)根据欧几里得距离函数将对象分配到它们最近的集群中心;4)计算每个集群中所有对象的质心或平均值;5)重复步骤2、3和4,直到在连续几轮中向每个集群分配相同的点。设置配置和规范是对安全威胁进行分类;涉及定义一组与每类威胁相关联的搜索术语,即关键词;每个定义的关键词都必须附加一个重要级别,即权重,表示该关键词的出现对每个文档得分的贡献。所述关键词列表必须遵循以下格式:1)ThreatClass1:keywords:{[keyword1,weight],[keywor本文档来自技高网...

【技术保护点】
1.一种移动应用安全数据挖掘方法,其特征在于,所述方法包括以下步骤:S1,对数据库进行扩展;S2,利用有限元分析方法对关键字进行计算,假设P1是一个一维问题:P1:

【技术特征摘要】
1.一种移动应用安全数据挖掘方法,其特征在于,所述方法包括以下步骤:S1,对数据库进行扩展;S2,利用有限元分析方法对关键字进行计算,假设P1是一个一维问题:P1:其中,f是已知函数是y关于x的未知函数,y″是y对x的二阶导数。通过有限元分析即可完成对关键性参数y的求导。S3,将(yt)作为模拟结果,yt是具有参数向量β的其它数据库变量的子集的观测值(xi,t,i=1,...,k)的线性函数加上一组随机数然后对所有数据库变量及其滞后进行回归:为了确保“真实”的回归量,针对每个单位根变量的原始水平进行计算,并对每个数据系列进行差分,直到可以消除“虚假值”。2.根据权利要求1所述的一种移动应用安全数据挖掘方法,其特征在于,所述数据挖掘任务可以分为以下不同的类别:1)分类:指对已知结构进行概括并将其应用于新数据的任务;2)不规则性检测:此任务表示识别不熟悉的数据记录,这些记录暗示数据集中的异常行为;3)聚类:讨论在不使用数据集中的已知结构的情况下,发现数据中呈现相似性的组和结构的任务;4)概述:此任务的目的是提供数据集的更紧凑的表示,包括可视化和报告生成,以及以下格式的警报:{alert_id:“id”,.:“Subject”,.:“._level”,backing_.:[“.”};集群对于自动查找在特定时间段内出现的新类型的安全威胁至关重要;如下所示的方法:将引用特定主题的文档分组到集群中,并提供每个集群中最频繁出现的...

【专利技术属性】
技术研发人员:李楠芳王旭钟应寿赵蕾李宗容景延嵘李胜春马学智尚西元
申请(专利权)人:国网青海省电力公司电力科学研究院四维创智北京科技发展有限公司
类型:发明
国别省市:青海,63

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1