基于人工智能的软件数据安全自动检测方法技术

技术编号：41595690 阅读：16 留言：0更新日期：2024-06-07 00:06

本发明专利技术涉及电数字数据处理技术领域，具体涉及基于人工智能的软件数据安全自动检测方法。该方法获取预设时间段内的软件数据和软件数据的响应数量，根据相同数据类型的软件数据分布，软件数据的响应数量变化，获取软件数据的异常得分值，对软件数据进行聚类，获得初始聚类簇；根据初始聚类簇之间的差异，初始聚类簇与预设时间段之间异常得分值的特征差异，获取分位判断值，对初始聚类簇进行聚类，获取第二聚类簇。本发明专利技术通过获取软件数据的异常得分值，进行聚类，进而将软件数据进行准确的划分，准确确定箱线图算法中每个分位线的位置，准确对软件数据进而异常检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及电数字数据处理，具体涉及基于人工智能的软件数据安全自动检测方法。

技术介绍

1、软件在各个领域扮演着重要的角色，其中，软件系统中存在各种潜在的安全隐患问题，例如软件数据自身发生异常、恶意代码注入等问题，容易导致信息资源受损和错误，给用户造成损失。因此，需要对软件数据的安全进行检测，获取软件数据中的异常软件数据，确保传输信息的准确性。

2、现有方法中，比较常用的是通过箱线图算法对软件数据进行异常检测，箱线图算法提供了有关软件数据集中位置、分散度和异常值的关键信息，可以确定软件数据的分布以及异常情况。但在实际情况中，软件数据的数据类型和频率不同，不同数据类型的软件数据分布可能比较分散，同时，不同异常原因导致软件数据异常的情况不同，因此，在对软件数据进行异常检测时，容易出现因对软件数据划分不合理而导致的无法对软件数据进行准确的异常检测，从而无法确保传输信息的准确性。

技术实现思路

1、为了解决软件数据划分不合理而导致的无法对软件数据进行准确的异常检测的技术问题，本专利技术的目的在于提供一种基于人工智能的软件数据安全自动检测方法，所采用的技术方案具体如下：

2、本专利技术提出了一种基于人工智能的软件数据安全自动检测方法，该方法包括以下步骤：

3、获取预设时间段内标记数据类型的每个软件数据；

4、将连续相邻的相同数据类型的软件数据划分为一个数据序列，根据每个软件数据所在数据序列的时长和软件数据数量，每个软件数据和相邻下一软件数据之

5、根据每个软件数据的异常可能值，所述预设时间段内每个软件数据与相同数据类型的其他各软件数据之间的距离和存在的数据序列数量，以及每个软件数据与预设邻域内每个邻域软件数据之间的响应数量差异，获取每个软件数据的异常得分值；

6、根据所述异常得分值对软件数据进行聚类，获得至少两个初始聚类簇；根据每个初始聚类簇与预设时间段所包含的软件数据的异常得分值的特征差异，以及每个初始聚类簇与其他初始聚类簇的异常得分值差异，获取每个初始聚类簇的分位判断值；

7、根据所述分位判断值对初始聚类簇进行聚类，获取预设数量个第二聚类簇。

8、进一步地，所述异常可能值的获取方法为：

9、对于任一软件数据，将该软件数据所在的数据序列作为目标数据序列；

10、将目标数据序列中第一个软件数据对应的时刻作为第一目标时刻；

11、将目标数据序列中最后一个软件数据对应的时刻作为第二目标时刻；

12、获取第二目标时刻与第一目标时刻之间的差异，作为目标数据序列的时长；

13、获取预设时间段内所有软件数据的数量与目标数据序列中软件数据数量的比值，作为目标数据序列的特征放大值；

14、将该软件数据与相邻下一软件数据之间对应时刻的时间间隔，作为第一时间间隔；

15、根据该软件数据的响应数量与第一时间间隔的比值，目标数据序列的时长和特征放大值，获取该软件数据的异常可能值。

16、进一步地，所述异常可能值的计算公式为：

17、

18、式中，qi为第i个软件数据的异常可能值；ti,d为第二目标时刻；ti,0为第一目标时刻；n为预设时间段内所有软件数据的数量；ni为第i个软件数据所在的目标数据序列中软件数据数量；mi为第i个软件数据的响应数量；ti为第i个软件数据对应的时刻；ti+1为第(i+1)个软件数据对应的时刻；α为第一预设常数，大于0；norm为归一化函数；(ti,d-ti,0)为第i个软件数据所在的目标数据序列的时长；ti+1-ti为第一时间间隔；为第i个软件数据所在的目标数据序列的特征放大值。

19、进一步地，所述异常得分值的获取方法为：

20、对于任一软件数据，将该软件数据与所述预设时间段内相同数据类型的其他各软件数据之间的欧式距离，作为第一距离；

21、将该软件数据与所述预设时间段内相同数据类型的其他各软件数据之间存在的数据序列数量，作为第一数量；

22、根据第一距离和第一数量，获取该软件数据与相同数据类型的其他各软件数据之间的第二特征值；其中，第一距离和第一数量均与第二特征值为正相关关系；

23、构建该软件数据的预设邻域，获取该软件数据与对应的每个邻域软件数据之间的响应数量差异，作为第一响应差异；

24、根据所述第一响应差异，所述第一数量和所述第二特征值，以及该软件数据的异常可能值，获取该软件数据的异常得分值。

25、进一步地，所述异常得分值的计算公式为：

26、

27、式中，γi为第i个软件数据的异常得分值；k为第i个软件数据的预设邻域内邻域软件数据的总数量；mi为第i个软件数据的响应数量；mi+k为第(i+k)个软件数据的响应数量；qi为第i个软件数据的异常可能值；j为所述预设时间段内与第i个软件数据相同数据类型的软件数据的总数量；di,j为第i个软件数据与所述预设时间段内相同数据类型的第j个软件数据之间的第一距离；xi,j为第i个软件数据与所述预设时间段内相同数据类型的第j个软件数据之间的第一数量；β为第二预设常数，大于0；si为第一数量的方差；||为绝对值函数；norm为归一化函数。

28、进一步地，所述分位判断值的获取方法为：

29、根据每个初始聚类簇与预设时间段所包含的软件数据的异常得分值的中位数差异，以及每个初始聚类簇与其他初始聚类簇的异常得分值的均值差异，获取每个初始聚类簇的分位判断值。

30、进一步地，所述分位判断值的计算公式为：

31、

32、式中，gl为第l个初始聚类簇的分位判断值；γl,z为第l个初始聚类簇内异常得分值的中位数；γz为预设时间段所包含的异常得分值的中位数；a为初始聚类簇的总数量；为第l个初始聚类簇内异常得分值的均值；为第a个初始聚类簇内异常得分值的均值；exp为以自然常数e为底数的指数函数；||为绝对值函数。

33、进一步地，所述根据所述分位判断值对初始聚类簇进行聚类，获取预设数量个第二聚类簇的方法为：

34、根据每个初始聚类簇的分位判断值，通过k-means聚类算法，对初始聚类簇进行聚类，获得预设数量个第二聚类簇。

35、进一步地，所述根据所述异常得分值对软件数据进行聚类，获得至少两个初始聚类簇的方法为：

36、根据每个软件数据的异常得分值，通过层次聚类算法，对每个软件数据进行聚类，获得至少两个初始聚类簇。

37、进一步地，所述将连续相邻的相同数据类型的软件数据划分为一个数据序列的方法为：

38、将预设时间段内的软件数据按照时间顺序进行排序，获得完整序列；

39、将完整序列中连续相邻的相同数据类型的软件数据划分为一个数据序列；其中，当完整序列中某个软件数据与前后本文档来自技高网...

【技术保护点】

1.一种基于人工智能的软件数据安全自动检测方法，其特征在于，该方法包括以下步骤：

2.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常可能值的获取方法为：

3.如权利要求2所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常可能值的计算公式为：

4.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常得分值的获取方法为：

5.如权利要求4所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常得分值的计算公式为：

6.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述分位判断值的获取方法为：

7.如权利要求6所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述分位判断值的计算公式为：

8.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述根据所述分位判断值对初始聚类簇进行聚类，获取预设数量个第二聚类簇的方法为：

9.如权利要求1所述一种

10.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述将连续相邻的相同数据类型的软件数据划分为一个数据序列的方法为：

...

【技术特征摘要】

1.一种基于人工智能的软件数据安全自动检测方法，其特征在于，该方法包括以下步骤：

2.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常可能值的获取方法为：

3.如权利要求2所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常可能值的计算公式为：

4.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常得分值的获取方法为：

5.如权利要求4所述一种基于人工智能的软件数据安全自动检测方法，其特征在于，所述异常得分值的计算公式为：

6.如权利要求1所述一种基于人工智能的软件数据安全自动检测方法，其特征在于...

【专利技术属性】
技术研发人员：魏军刚，李可非，葛建新，党一鸣，吴嘉宁，王艳敏，陈青玉，
申请(专利权)人：准检河北检测技术服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人