System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,具体而言,涉及一种基于ptd云的产业数据协同匿名方法及系统。
技术介绍
1、随着信息化和数字化时代的到来,工业互联产业数据变得越来越重要。这些数据不仅包含了大量的商业价值,也包含了许多敏感信息。如何在保护数据隐私的同时,有效利用这些数据,已经成为当前面临的一大挑战。
2、传统的数据处理方式通常只关注数据的提取和利用,往往忽视了数据隐私的保护。而一些现有的数据匿名处理方法,虽然可以保护数据隐私,但是它们通常无法充分利用数据之间的关系,导致处理后的数据失去了原有的结构和含义。此外,现有的匿名处理方法通常对所有数据应用相同的处理规则,无法灵活地根据不同的数据特性和需求进行调整。
3、因此,急需一种新的方法,既能够有效保护数据隐私,又能充分利用数据的价值,同时具有较高的灵活性和准确性。
技术实现思路
1、为了改善上述问题,本专利技术提供了一种基于ptd云的产业数据协同匿名方法及系统。
2、第一方面,提供一种基于ptd云的产业数据协同匿名方法,应用于数据协同匿名系统,所述方法包括:
3、对ptd云平台产业数据链中的各工业互联产业数据文本进行关键文本要素挖掘,得到各所述工业互联产业数据文本的关键业务文本要素知识向量;
4、分别对各连续的所述工业互联产业数据文本的关键业务文本要素知识向量进行文本语义推理状态识别,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量;
5、
6、依据所述第二数据匿名优先级的文本语义推理表征向量对所述工业互联产业数据文本中的核心文本单元进行协同匿名处理,得到工业互联产业匿名文本。
7、优选的,所述对ptd云平台产业数据链中的各工业互联产业数据文本进行关键文本要素挖掘,得到各所述工业互联产业数据文本的关键业务文本要素知识向量之前,所述方法还包括:
8、获取在目标数据匿名激活周期内对所述核心文本单元进行大数据爬取所得的页面信息,对所述页面信息进行处理得到页面文本数据队列;在所述页面文本数据队列中进行工业互联产业数据文本抽取,得到所述ptd云平台产业数据链;
9、或者,获取在所述目标数据匿名激活周期内对所述核心文本单元进行工业互联产业数据文本采集所得的ptd云平台产业数据链。
10、优选的,所述分别对各连续的所述工业互联产业数据文本的关键业务文本要素知识向量进行文本语义推理状态识别,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量包括:
11、以各连续的所述工业互联产业数据文本中的第一工业互联产业数据文本的关键业务文本要素知识向量为标识属性变量,以各连续的所述工业互联产业数据文本中的第二工业互联产业数据文本的关键业务文本要素知识向量为检索决策向量,对所述标识属性变量和所述检索决策向量进行特征焦点化操作,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量。
12、优选的,所述标识属性变量包括标识变量和属性变量;所述对所述标识属性变量和所述检索决策向量进行特征焦点化操作,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量包括:
13、对所述标识变量和所述检索决策向量进行联动特征焦点化操作,得到联动焦点化向量;
14、对所述联动焦点化向量进行特征映射,得到焦点化决策因子;
15、依据所述焦点化决策因子和所述属性变量,生成各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量。
16、优选的,所述对所述标识变量和所述检索决策向量进行联动特征焦点化操作,得到联动焦点化向量包括:
17、确定所述标识变量和所述检索决策向量之间的特征差异值;以及确定所述标识变量和所述检索决策向量之间的乘法运算结果;
18、基于所述标识变量和所述检索决策向量之间的乘法运算结果与所述特征差异值确定联动焦点化向量。
19、优选的,所述第一数据匿名优先级的各文本语义推理表征向量包括所述第一数据匿名优先级的各产业生命周期的文本语义推理表征向量;所述基于所述第一数据匿名优先级的各文本语义推理表征向量和各所述工业互联产业数据文本的关键业务文本要素知识向量,生成第二数据匿名优先级的文本语义推理表征向量包括:
20、基于所述ptd云平台产业数据链中第一产业生命周期对应的关键业务文本要素知识向量确定潜在文本要素知识向量;
21、将所述第一数据匿名优先级的第二产业生命周期的文本语义推理表征向量与所述潜在文本要素知识向量进行聚合,得到聚合知识向量;所述第一产业生命周期是在所述第二产业生命周期之前的产业生命周期;
22、依据所述聚合知识向量和第一特征投影指示列表确定语义牵涉特征;
23、基于所述聚合知识向量和第二特征投影指示列表确定语义联动特征,依据所述潜在文本要素知识向量、所述语义联动特征和第三特征投影指示列表确定第一中间潜在文本要素知识向量;
24、其中,所述语义牵涉特征是用于反映上一个产业生命周期的所述潜在文本要素知识向量对当前产业生命周期的所述潜在文本要素知识向量的内容牵涉权重,所述语义联动特征是用于反映上一个产业生命周期的所述潜在文本要素知识向量与当前产业生命周期的所述文本语义推理表征向量合并的特征;
25、基于所述第一中间潜在文本要素知识向量和所述语义牵涉特征,生成第二数据匿名优先级的文本语义推理表征向量。
26、优选的,所述依据所述第二数据匿名优先级的文本语义推理表征向量对所述工业互联产业数据文本中的核心文本单元进行协同匿名处理,得到工业互联产业匿名文本包括:
27、确定所述第二数据匿名优先级的文本语义推理表征向量与预配语义向量池中各预配语义推理表征向量之间的特征向量距离;
28、在所得的特征向量距离中筛选符合特征共性要求的目标特征向量距离;
29、通过所述目标特征向量距离对应的预配语义推理表征向量的核心文本匿名决策观点,生成工业互联产业匿名文本。
30、优选的,所述依据所述第二数据匿名优先级的文本语义推理表征向量对所述工业互联产业数据文本中的核心文本单元进行协同匿名处理,得到工业互联产业匿名文本之后,所述方法还包括:
31、基于所述工业互联产业匿名文本和ptd云环境下的待发布任务进行文本发布调整;
32、或者,依据所述工业互联产业匿名文本对产业报告推送服务器的推送权限进行调节。
33、优选的,所述关键业务文本要素知识向量是通过关键文本要素挖掘模型提取所得的;
34、本文档来自技高网...
【技术保护点】
1.一种基于PTD云的产业数据协同匿名方法,其特征在于,应用于数据协同匿名系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对PTD云平台产业数据链中的各工业互联产业数据文本进行关键文本要素挖掘,得到各所述工业互联产业数据文本的关键业务文本要素知识向量之前,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述分别对各连续的所述工业互联产业数据文本的关键业务文本要素知识向量进行文本语义推理状态识别,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量包括:
4.根据权利要求3所述的方法,其特征在于,所述标识属性变量包括标识变量和属性变量;所述对所述标识属性变量和所述检索决策向量进行特征焦点化操作,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述标识变量和所述检索决策向量进行联动特征焦点化操作,得到联动焦点化向量包括:
6.根据权利要求1所述的方法,其特征在于,所述第一数据
7.根据权利要求1所述的方法,其特征在于,所述依据所述第二数据匿名优先级的文本语义推理表征向量对所述工业互联产业数据文本中的核心文本单元进行协同匿名处理,得到工业互联产业匿名文本包括:
8.根据权利要求1所述的方法,其特征在于,所述依据所述第二数据匿名优先级的文本语义推理表征向量对所述工业互联产业数据文本中的核心文本单元进行协同匿名处理,得到工业互联产业匿名文本之后,所述方法还包括:
9.根据权利要求1所述的方法,其特征在于,所述关键业务文本要素知识向量是通过关键文本要素挖掘模型提取所得的;
10.一种数据协同匿名系统,其特征在于,所述数据协同匿名系统包括包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中调取计算机程序,并通过运行所述计算机程序实现权利要求1-9任一项所述的方法。
...【技术特征摘要】
1.一种基于ptd云的产业数据协同匿名方法,其特征在于,应用于数据协同匿名系统,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述对ptd云平台产业数据链中的各工业互联产业数据文本进行关键文本要素挖掘,得到各所述工业互联产业数据文本的关键业务文本要素知识向量之前,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述分别对各连续的所述工业互联产业数据文本的关键业务文本要素知识向量进行文本语义推理状态识别,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量包括:
4.根据权利要求3所述的方法,其特征在于,所述标识属性变量包括标识变量和属性变量;所述对所述标识属性变量和所述检索决策向量进行特征焦点化操作,得到各连续的所述工业互联产业数据文本之间的第一数据匿名优先级的文本语义推理表征向量包括:
5.根据权利要求4所述的方法,其特征在于,所述对所述标识变量和所述检索决策向量进行联动特征焦点化操作,得到联动焦点化向量包括:
6.根据权利要求1所述的方法,其特征在于,所述第一数据匿名优先...
【专利技术属性】
技术研发人员:张梅甫,郭顺雷,
申请(专利权)人:北京国联视讯信息技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。