一种辐射场异常监测数据自动识别方法技术

技术编号:33199719 阅读:18 留言:0更新日期:2022-04-24 00:34
本发明专利技术涉及一种辐射场异常监测数据自动识别方法,所述方法使用辐射场多点位的测量数据作为数据集,根据辐射场数据在空间和时间尺度上的潜在规律,识别辐射场数据流的异常节点,可以应用于存在多种工况的辐射场,基于孤立森林技术,对辐射场监测数据集进行训练,对辐射场数据流进行实时评分检测,并将新数据加入训练集进行迭代计算分析。由于采用非监督智能算法,不需要对训练集进行评价。采用本发明专利技术所述的辐射场异常监测数据自动识别方法,可利用过往的监测数据进行大数据分析,自动识别异常数据,提高运维人员工作效率,更好的满足核设施现场使用要求、提升辐射防护管理水平,并且异常数据识别效率高、使用范围广、对工作人员专业度要求低。员专业度要求低。员专业度要求低。

【技术实现步骤摘要】
一种辐射场异常监测数据自动识别方法


[0001]本专利技术属于辐射监测领域,具体涉及一种辐射场异常监测数据自动识别方法。

技术介绍

[0002]对核设施中场所辐射剂量率的监测是核设施运行状态下安全监控的重要环节。当前核设施内场所辐射剂量率测量设备种类较多,能够满足测量需求,测量点位覆盖场所关键区域。
[0003]但目前测量数据处理水平较低,仅通过判断是否超阈值方式进行报警,为保证该方式不会漏报警,通常将阈值设置偏低,这样会导致大量的无效报警,影响运维人员的工作效率。因此,需开发一种辐射场异常监测数据自动识别方法,使其准确高效地自动识别异常数据,从而更好的满足核设施现场的使用要求、提高辐射防护管理水平。

技术实现思路

[0004]针对现有技术中存在的缺陷,本专利技术的目的在于提供一种辐射场异常监测数据自动识别方法,该方法使用辐射场多点位的测量数据作为数据集,根据辐射场数据在空间和时间尺度上的潜在规律,识别辐射场数据流的异常节点,可以应用于存在多种工况的辐射场。
[0005]为达到以上目的,本专利技术采用的技术方案是:一种辐射场异常监测数据自动识别方法,所述方法包括以下步骤:
[0006]S1、将核设施内辐射场中的辐射剂量率数据进行预处理并分类,形成对应数据集;
[0007]S2、对每类数据抽取训练集,构建孤立树,所有孤立树的合集构成孤立森林;
[0008]S3、通过所述孤立森林对所述数据集进行异常评分,并据此判断所述辐射场中的辐射剂量率数据有无异常。
[0009]进一步,所述方法还包括将最新获取的辐射剂量率数据加入步骤S1中所述数据集后进行迭代。
[0010]进一步,步骤S1包括根据不同测量场景对所述辐射剂量率数据进行分类,并分别存储作为不同数据集。
[0011]进一步,步骤S2包括以下子步骤:
[0012]S201、在每个数据集中随机抽取N个元素组成训练集,若数据集中元素小于N则全部抽取,存储于孤立树根节点,在所述根节点数据的最大值及最小值之间以平均分布随机生成分割值,将根节点数据中小于分割值及大于等于分割值的两部分,分别存储于左右子节点;
[0013]S202、从所述左右子节点在各自节点数据的最大值及最小值之间以平均分布随机生成分割值,将训练集中小于分割值及大于等于分割值的两部分,分别存储于所述左子节点以及所述右子节点的左右子节点;
[0014]S203、重复步骤S202,直至满足预设条件时将分割次数记为步长h;
[0015]S204、重复步骤S201

S203,直至所述孤立树的数量达到设定值,此时所有孤立树的合集构成孤立森林。
[0016]进一步,为保证充分覆盖数据集中所有元素,需构建多个孤立树构成孤立森林。
[0017]进一步,步骤S203中所述预设条件包括子节点中只有1个元素、子节点中只有相同元素、分割次数达到限定值、子节点是否达到预设高度中任一条件。
[0018]进一步,所述分割次数限定值H=log2(N)。
[0019]进一步,步骤S3中所述的训练集的异常评分方法如下:
[0020]S301、遍历所述孤立森林中的各孤立树,得到孤立树中的路径长度平均值,所述路径长度平均值为步长h的期望值c(ψ);
[0021]所述步长h的期望值c(ψ)通过以下公式进行计算
[0022][0023]式中ψ为孤立树中的元素个数;H(i)为调和数,其值为ln(i)+0.5772156649;
[0024]S302、计算所述孤立树中每个元素的异常评分s,设置异常分数阈值k,若所述异常评分s大于该异常分数阈值k,则判定为该元素为数据异常,若所述异常评分s小于该异常分数阈值k,则判定为该元素为数据正常。
[0025]进一步,所述异常分数阈值k根据训练集所在场景,用户需求进行设置。
[0026]进一步,第i个元素的异常评分s为
[0027][0028]式中E(h(i))为点i在孤立树中分割次数的期望值,该值为遍历孤立森林中的各孤立树,点i在孤立树中的分割次数平均值。
[0029]本专利技术的效果在于:采用本专利技术所公开的一种辐射场异常监测数据自动识别方法,使用辐射场多点位的测量数据作为数据集,根据辐射场数据在空间和时间尺度上的潜在规律,识别辐射场数据流的异常节点,可以应用于存在多种工况的辐射场,基于孤立森林技术,对辐射场监测数据集进行训练,对辐射场数据流进行实时评分检测,并将新数据加入训练集进行迭代计算分析。由于采用非监督智能算法,不需要对训练集进行评价。可利用过往的监测数据进行大数据分析,自动识别异常数据,提高运维人员工作效率,更好的满足核设施现场使用要求、提升辐射防护管理水平,并且异常数据识别效率高、使用范围广、对工作人员专业度要求低。
附图说明
[0030]图1为本专利技术所述的一种辐射场异常监测数据自动识别方法的方法流程图;
[0031]图2为本专利技术所述的一种辐射场异常监测数据自动识别方法中分割次数的期望值E(h(x))与异常评分s的函数关系曲线示意图;
[0032]图3为本专利技术所述的一种辐射场异常监测数据自动识别方法中的异常数据异常评
分分布图;
[0033]图4为为本专利技术所述的一种辐射场异常监测数据自动识别方法中对实测数据进行数据分析后得到的异常数据和正常数据分布图。
具体实施方式
[0034]下面结合附图和具体实施方式对本专利技术作进一步描述。
[0035]实施例一
[0036]如图1所示,一种辐射场异常监测数据自动识别方法,包括以下步骤:
[0037]S1、将核设施内辐射场中的辐射剂量率数据进行预处理并分类,形成对应数据集;
[0038]所述预处理及分类步骤包括根据不同测量场景对辐射剂量率数据进行分类,并分别存储作为不同数据集。
[0039]选取某核设施内辐射场中辐射剂量率监测数据,如果该辐射场内仅有一个核设施,故无需对核设施辐射场中区域辐射剂量率数据进行预处理并分类,只形成1个数据集。
[0040]S2、对每类数据抽取训练集,构建孤立树,所有孤立树的合集构成孤立森林。
[0041]S3、通过所述孤立森林对所述数据集进行异常评分,判断辐射场数据有无异常。
[0042]所述方法还包括将最新获取的辐射剂量率数据加入步骤S1中所述数据集后进行迭代。
[0043]其中,步骤S2中所述构建孤立树步骤包括以下子步骤:
[0044]S201、在每个数据集中随机抽取256个元素组成训练集,若数据集中元素小于256则全部抽取,存储于孤立树根节点。在根节点数据的最大值及最小值之间以平均分布随机生成分割值,将根节点数据中小于分割值及大于等于分割值的两部分,分别存储于左右子节点。
[0045]在本实施例中,组成训练集的元素个数为256个,事实上对此不作限制。
[0046]承接上例,如果该辐射场内仅有的一个核设施形成的1个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种辐射场异常监测数据自动识别方法,所述方法包括以下步骤:S1、将核设施内辐射场中的辐射剂量率数据进行预处理并分类,形成对应数据集;S2、对每类数据抽取训练集,构建孤立树,所有孤立树的合集构成孤立森林;S3、通过所述孤立森林对所述数据集进行异常评分,并据此判断所述辐射场中的辐射剂量率数据有无异常。2.如权利要求1中所述的一种辐射场异常监测数据自动识别方法,其特征在于:所述方法还包括将最新获取的辐射剂量率数据加入步骤S1中所述数据集后进行迭代。3.如权利要求1中所述的一种辐射场异常监测数据自动识别方法,其特征在于:步骤S1包括根据不同测量场景对所述辐射剂量率数据进行分类,并分别存储作为不同数据集。4.如权利要求1中所述的一种辐射场异常监测数据自动识别方法,其特征在于:步骤S2包括以下子步骤:S201、在每个数据集中随机抽取N个元素组成训练集,若数据集中元素小于N则全部抽取,存储于孤立树根节点,在所述根节点数据的最大值及最小值之间以平均分布随机生成分割值,将根节点数据中小于分割值及大于等于分割值的两部分,分别存储于左右子节点;S202、从所述左右子节点在各自节点数据的最大值及最小值之间以平均分布随机生成分割值,将训练集中小于分割值及大于等于分割值的两部分,分别存储于所述左子节点以及所述右子节点的左右子节点;S203、重复步骤S202,直至满足预设条件时将分割次数记为步长h;S204、重复步骤S201

S203,直至所述孤立树的数量达到设定值,此时所有孤立树的合集构成孤立森林。5.如权利要求4中所述的...

【专利技术属性】
技术研发人员:刘一聪王崇扬赵原曹勤剑韦加富宋佩涛杨彪李晓敦汪屿卫晓峰夏三强王晓龙金城赫潘红娟
申请(专利权)人:中国辐射防护研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1