一种数据发布方法及其系统、电子设备技术方案

技术编号:36264052 阅读:48 留言:0更新日期:2023-01-07 10:03
本发明专利技术具体公开一种数据发布方法及其系统、电子设备,本发明专利技术可以实现通过对信息增益的分析,实时将词条序列中的各词条的因素值按各词条的信息增益的大小通过预设风险权重序列进行风险权重赋值,能够实现将信息增益最大的词条的因素值赋值为最大的风险权重,目标语句中剩余的词条同理,即将目标语句中的对风险评估影响最大的词条的因素值赋予最大的风险权重,目标语句中剩余的词条也是按照各词条的信息增益的大小依次对应预设风险权重序列中的风险权重,即可实现对目标语句的高敏感度、高可靠性、高适用性的风险评估,大大提高了本发明专利技术的智能化程度和可靠性,进一步拓宽了本发明专利技术的应用场景。明的应用场景。明的应用场景。

【技术实现步骤摘要】
一种数据发布方法及其系统、电子设备


[0001]本专利技术属于数据发布方法领域,具体公开一种数据发布方法及其系统、电子设备。

技术介绍

[0002]随着移动技术和5G网络的快速发展普及,在各个行业不断产生海量数据。随着数据的沉淀与积累,数据的研究和利用价值不断显现。因此,数据的发布前的风险评估显得尤为重要,但是现阶段的数据发布前的风险评估过程中,对于用户不同的调用数据,往往需要建立不同的复杂算法来实现数据发布前的风险评估,风险评估过程亦可能因为算法和参数的设计偏差不够安全、可靠,现阶段的数据发布前的风险评估过程缺乏高安全性、高可靠性、高适用性的风险评估方案。
[0003]因此,现有技术还有待于进一步发展和改进。

技术实现思路

[0004]针对现有技术的种种不足,为了解决上述问题,本专利技术提出一种高安全性、高可靠性、高适用性的数据发布方法及其系统、电子设备,本专利技术提供如下技术方案:
[0005]根据本专利技术的第一方面,提供了一种数据发布方法,所述方法包括:
[0006]获取用户的登录信息并解析得到用户的权限等级;
[0007]获取用户所调用的数据的目标语句集合;
[0008]对所述目标语句集合中的每条目标语句进行拆分,得到每条目标语句各自对应的词条序列,所述词条序列包括所述目标语句拆分后得到的至少一个词条;
[0009]确定每条目标语句的各词条序列中各词条的信息熵,将各词条的信息熵按预设方法处理后的到各词条的因素值,通过计算条件熵和信息增益,将每条目标语句的词条序列中的各词条的因素值按各词条的信息增益大小依照预设风险权重序列进行风险权重赋值,将每条目标语句的各词条的因素值和其所对应的风险权重分别输入神经网络算法中计算得到每条目标语句的输出结果,将每条目标语句的输出结果与预设阈值进行比较,当每条目标语句的输出结果都小于预设阈值,在第一调整周期内按第一预设比例调整第一预设次数的预设风险权重序列中的各风险权重,并在每次调整后将每条目标语句中各词条的因素值和其所对应的调整后的风险权重输入神经网络算法中计算得到每条目标语句的输出结果;
[0010]当调整预设风险权重序列中各风险权重的次数达到第一预设次数时,判断该次神经网络的每条目标语句的输出结果仍都小于预设阈值,则判断目标语句集合符合发布要求,服务器发布数据。
[0011]进一步地,所述方法还包括:
[0012]当每条目标语句的输出结果小于预设阈值,在第一检测周期内按第一预设比例增大第一预设次数的预设风险权重序列中的各风险权重,并在每次调整后将每条目标语句的各词条的因素值和其所对应的调整后的风险权重分别输入神经网络算法中计算得到输出
结果;若在增大预设风险权重序列中的各风险权重的过程中,任意一条目标语句的输出结果大于预设阈值,则判断发布目标语句集合存在较大风险,服务器禁止发布数据并向终端发送数据发送失败提示。
[0013]进一步地,所述预设方法包括:
[0014]将各词条的信息熵取整后得到各词条的因素值。
[0015]进一步地,所述通过计算条件熵和信息增益,将词条序列中的各词条的因素值按各词条的信息增益大小通过预设风险权重序列进行风险权重赋值包括:
[0016]分别计算每条目标语句的各词条序列中的各词条的条件熵及信息增益大小,按照每条目标语句的各词条序列中的各词条的信息增益大小将各词条序列中的各词条的因素值从高到低依次赋予预设风险权重序列中的风险权重。
[0017]进一步地,所述预设风险权重序列中的风险权重按从大到小的顺序依次排列。
[0018]进一步地,所述方法还包括:
[0019]若按照每条目标语句中的各词条序列中的各词条的信息增益大小将词条序列中的各词条从高到低依次依照预设风险权重序列进行各词条的风险权重赋值后,仍有词条的因素值未进行风险权重赋值,则所有未进行风险权重赋值的词条的因素值不再进行风险权重赋值并不参与神经网络算法的计算。
[0020]进一步地,所述预设阈值包括第一预设阈值、第二预设阈值、第三预设阈值及第四预设阈值,所述用户的权限等级为数据所有者、数据管理者、数据生产者及数据使用者四项之一,当用户权限为数据所有者时,将所述预设阈值设置为第一预设阈值,当用户权限为数据管理者时,将所述预设阈值设置为第二预设阈值,当用户权限为数据生产者时,将所述预设阈值设置为第三预设阈值,当用户权限为数据使用者时,将所述预设阈值设置为第四预设阈值,所述第一预设阈值大于所述第二预设阈值,所述第二预设阈值大于所述第三预设阈值,所述第三预设阈值大于所述第四预设阈值。
[0021]进一步地,所述第一调整周期为5秒,所述第一预设次数为10次,所述第一预设比例为1%。
[0022]根据本专利技术的第二方面,提供了一种数据发布系统,所述数据发布系统包括:
[0023]获取模块,用于获取用户的登录信息并解析得到用户的权限等级;或获取用户所调用的数据的目标语句集合;或对所述目标语句集合中的每条目标语句进行拆分,得到每条目标语句各自对应的词条序列并将词条序列发送至分析模块;所述词条序列包括所述目标语句拆分后得到的至少一个词条;
[0024]分析模块,用于确定每条目标语句中各词条序列中各词条的信息熵,将每条目标语句中各词条的信息熵按预设方法处理后的到各词条的因素值,通过条件熵和信息增益对每条目标语句中各词条序列中的各词条确定风险等级并依照预设风险权重序列对各词条的因素值进行风险权重赋值,将每条目标语句中各词条的因素值和其所对应的风险权重分别输入神经网络算法中计算得到每条目标语句的输出结果,将每条目标语句的输出结果与预设阈值进行比较并向服务器发送比较结果;在每条目标语句的输出结果都小于预设阈值时,在第一检测周期内按第一预设比例调整第一预设次数的预设风险权重序列中的各风险权重,并在每次调整后将每条目标语句中的各词条的因素值和其所对应的调整后的风险权重分别输入神经网络算法中计算得到每条目标语句的输出结果并与预设阈值进行比较,并
将比较结果发送至服务器;
[0025]服务器,用于根据比较结果对所有模块的控制程序进行统一管理或控制分析模块进行风险权重调整或控制数据发布或禁止数据发布并向终端发送数据发布失败提示或在调整预设风险权重序列中各风险权重的次数等于第一预设次数且下一次神经网络的各目标语句的输出结果仍小于预设阈值,判断数据符合发布要求,发布数据。
[0026]根据本专利技术的第三方面,提供了一种电子设备,所述电子设备包括:
[0027]存储器;以及处理器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现根据权利要求1至8中任意一项所述的数据发布方法。
[0028]本专利技术的有益效果是:
[0029]1、本专利技术可以实现当获取模块获取到的用户的权限等级不同时,通过不同的预设阈值对神经网络算法的输出结果进行评估,当用户的权限等级越高,则对应的预设阈值越高,即用户可通过本数据发布系统获取风险等级更高的数据,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据发布方法,其特征在于,获取用户的登录信息并解析得到用户的权限等级;获取用户所调用的数据的目标语句集合;对所述目标语句集合中的每条目标语句进行拆分,得到每条目标语句各自对应的词条序列,所述词条序列包括所述目标语句拆分后得到的至少一个词条;确定每条目标语句的各词条序列中各词条的信息熵,将各词条的信息熵按预设方法处理后的到各词条的因素值,通过计算条件熵和信息增益,将每条目标语句的词条序列中的各词条的因素值按各词条的信息增益大小依照预设风险权重序列进行风险权重赋值,将每条目标语句的各词条的因素值和其所对应的风险权重分别输入神经网络算法中计算得到每条目标语句的输出结果,将每条目标语句的输出结果与预设阈值进行比较,当每条目标语句的输出结果都小于预设阈值,在第一调整周期内按第一预设比例调整第一预设次数的预设风险权重序列中的各风险权重,并在每次调整后将每条目标语句中各词条的因素值和其所对应的调整后的风险权重输入神经网络算法中计算得到每条目标语句的输出结果;当调整预设风险权重序列中各风险权重的次数达到第一预设次数时,判断该次神经网络的每条目标语句的输出结果仍都小于预设阈值,则判断目标语句集合符合发布要求,服务器发布数据。2.根据权利要求1所述的一种数据发布方法,其特征在于,所述方法还包括:当每条目标语句的输出结果小于预设阈值,在第一检测周期内按第一预设比例增大第一预设次数的预设风险权重序列中的各风险权重,并在每次调整后将每条目标语句的各词条的因素值和其所对应的调整后的风险权重分别输入神经网络算法中计算得到输出结果;若在增大预设风险权重序列中的各风险权重的过程中,任意一条目标语句的输出结果大于预设阈值,则判断发布目标语句集合存在较大风险,服务器禁止发布数据并向终端发送数据发送失败提示。3.根据权利要求1所述的一种数据发布方法,其特征在于,所述预设方法包括:将各词条的信息熵取整后得到各词条的因素值。4.根据权利要求1所述的一种数据发布方法,其特征在于,所述通过计算条件熵和信息增益,将词条序列中的各词条的因素值按各词条的信息增益大小通过预设风险权重序列进行风险权重赋值包括:分别计算每条目标语句的各词条序列中的各词条的条件熵及信息增益大小,按照每条目标语句的各词条序列中的各词条的信息增益大小将各词条序列中的各词条的因素值从高到低依次赋予预设风险权重序列中的风险权重。5.根据权利要求4所述的一种数据发布方法,其特征在于,所述预设风险权重序列中的风险权重按从大到小的顺序依次排列。6.根据权利要求1所述的一种数据发布方法,其特征在于,所述方法还包括:若按照每条目标语句中的各词条序列中的各词条的信息增益大小将词条序列中的各词条从高到低依次依照预设风险权重序列进行各词条的风险权重赋值后,仍...

【专利技术属性】
技术研发人员:王爱玲翟伟伟王超史铭立于杭玉徐小文
申请(专利权)人:青岛鹏海软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1