一种数据生成系统、方法、介质及设备技术方案

技术编号:38996316 阅读:14 留言:0更新日期:2023-10-07 10:27
本公开涉及一种对抗网络和行为事理图谱融合的传感器数据生成系统、方法、介质及设备,所述系统包括:由鉴别器和生成器组成的对抗生成网络;其中,生成器由变分自编码器和解码器组成;鉴别器,用于通过训练来区分生成器在输入随机噪声时产生的样本和从真实数据集中提取的样本;状态转移模块,用于构建参考事理图谱的马尔科夫链为不同角色生成状态转移模板。本公开提出的系统和方法在准确率和多样性方面有显著改进。同时,通过事理图谱生成的状态转移模板,本公开创造性地生成了长效性、连续性、符合事理图谱逻辑的虚拟身份个性化传感器数据集,并且可以良好地反映用户的行为特征。并且可以良好地反映用户的行为特征。并且可以良好地反映用户的行为特征。

【技术实现步骤摘要】
一种数据生成系统、方法、介质及设备


[0001]本公开涉及深度学习
,更为具体来说,本公开涉及一种数据生成系统、方法、介质及设备。

技术介绍

[0002]生成对抗网络和变分自编码器等生成模型已被证实可以生成高仿真的合成数据,并且在文本、图像、音频等领域取得了令人难以置信的效果。然而,到目前为止并没有一种成熟的方法用来生成移动终端的传感器数据。这是因为传感器产生的数据是高维度、高复杂度的,包含了大量的噪声和变化,这使得生成模型很难从这些数据中学习到真实的分布。此外,不同的用户采集同种动作的传感器数据也会存在不同的特征,这就给如何生成细粒度的传感器数据带来更大的挑战。为了解决上述问题,本公开提出了一种生成对抗网络和行为事理图谱融合的个性化传感器数据生成系统,该方案创造性地引入了事理图谱,旨在利用源自事理图谱的事理逻辑和时序关系,降低个性化传感器数据集中不符合事理逻辑情况的出现概率,进而提升用户行为传感器数据生成的准确率。

技术实现思路

[0003]为解决现有技术的没有一种成熟的方法用来生成移动终端的传感器数据的技术问题。
[0004]为实现上述技术目的,本公开提供了一种对抗网络和行为事理图谱融合的传感器数据生成系统,包括:
[0005]由鉴别器和生成器组成的对抗生成网络;
[0006]其中,
[0007]生成器由变分自编码器和解码器组成;
[0008]鉴别器,用于通过训练来区分生成器在输入随机噪声时产生的样本和从真实数据集中提取的样本;
[0009]状态转移模块,用于构建参考事理图谱的马尔科夫链为不同角色生成状态转移模板。
[0010]进一步,所述状态转移模块具体包括:
[0011]构建模式层和数据层;
[0012]其中,模式层是对实体概念、属性以及实体间关系进行描述的组织框架;
[0013]数据层用于对用户个性化传感器领域知识进行实体、关系抽取。
[0014]进一步,所述模式层具体包括:
[0015]实体类型定义单元、属性类型定义单元和实体关系定义单元;
[0016]所述数据层具体包括:
[0017]存储单元用于知识的存储和查询;
[0018]抽取单元用于实体抽取和关系抽取;
[0019]创建单元用于构建传感器领域角色、标签和/或关键词;
[0020]其中,所述模式层和数据层之间的各模块之间具有关联映射关系。
[0021]进一步,所述鉴别器具体包括:
[0022]四个一维卷积层,每个所述卷积层都使用了64个滤波器,算子尺寸设定为3;
[0023]激活函数为ReLU函数;
[0024]填充方式为same;
[0025]一个Flatten层用于将卷积层的输出展平,
[0026]一个dropout层用于减少过拟合;
[0027]一个BatchNormalization层用于加速训练过程;
[0028]两个全连接层,其中第一个全连接层有256个节点,激活函数为ReLU,第二个全连接层的节点数量则由数据集的实际类别数量决定,激活函数使用softmax。
[0029]进一步,所述变分自编码器和解码器包括:
[0030]一个RNN编码器和一个RNN解码器;
[0031]RNN编码器将输入x编码为潜在空间向量z,同时返回z的均值和方差,用于计算KL散度;
[0032]RNN解码器接受潜在空间向量z和标签y作为输入,并生成重构输出。
[0033]为实现上述技术目的,本公开还能够提供一种对抗网络和行为事理图谱融合的传感器数据生成方法,应用于上述的对抗网络和行为事理图谱融合的传感器数据生成系统中,包括:
[0034]利用辅助分类器评价样本条件标签的函数计算生成模型和辅助模型在最大序列长度条件下的采样准确率,将结果存储;
[0035]使用生成模型对固定的采样标签和固定的噪声向量进行采样,得到最大序列长度的生成样本,将结果存储;
[0036]将训练过程中的各种参数和模型保存到文件中,以备后续使用。
[0037]进一步,所述方法还包括:
[0038]通过使用循环来迭代训练数据中的每个批次;对于每个批次,使用梯度带来计算模型的预测值、重构损失和KL散度损失,并使用这些值来计算总损失。
[0039]进一步,所述方法还包括:
[0040]计算梯度并将其应用于模型的可训练变量上;
[0041]在训练过程中,还跟踪了重构损失和KL散度损失的平均值,并在每个批次结束时更新它们。
[0042]为实现上述技术目的,本公开还能够提供一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时用于实现上述的对抗网络和行为事理图谱融合的传感器数据生成的方法的步骤。
[0043]为实现上述技术目的,本公开还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述的对抗网络和行为事理图谱融合的传感器数据生成的方法的步骤。
[0044]本公开的有益效果为:
[0045]本公开提出的系统和方法在准确率和多样性方面有显著改进。同时,通过事理图
谱生成的状态转移模板,本公开创造性地生成了长效性、连续性、符合事理图谱逻辑的虚拟身份个性化传感器数据集,并且可以良好地反映用户的行为特征。
附图说明
[0046]图1示出了本公开的实施例1的系统的结构示意图;
[0047]图2示出了本公开的实施例1的系统的用户个性化传感器领域事理图谱的构建过程示意图;
[0048]图3示出了本公开的实施例1的系统的生成对抗网络结构;
[0049]图4示出了本公开的实施例1的系统的鉴别器结构;
[0050]图5示出了本公开的实施例1的系统的编码器结构;
[0051]图6示出了本公开的实施例1的系统的解码器结构;
[0052]图7示出了权重改变曲线;
[0053]图8示出了本公开的实施例2的走路动作真实数据示意图;
[0054]图9示出了本公开的实施例2的走路动作生成数据示意图;
[0055]图10示出了本公开的实施例2的静坐生成数据示意图;
[0056]图11示出了本公开的实施例2的走路动作生成数据示意图;
[0057]图12示出了用户角色“本科生”相关节点以及关系构成的事理图谱;
[0058]图13示出了查询角色“本科生”,标签为“考研”和“普通人”对应事理图谱包含的关键词;
[0059]图14示出了本公开的实施例2的用户行为特征传感器数据;
[0060]图15示出了本公开的实施例2的流程示意图;
[0061]图16示出了本公开的实施例4的结构示意图。
具体实施方式
[0062]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对抗网络和行为事理图谱融合的传感器数据生成系统,其特征在于,包括:由鉴别器和生成器组成的对抗生成网络;其中,生成器由变分自编码器和解码器组成;鉴别器,用于通过训练来区分生成器在输入随机噪声时产生的样本和从真实数据集中提取的样本;状态转移模块,用于构建参考事理图谱的马尔科夫链为不同角色生成状态转移模板。2.根据权利要求1所述的系统,其特征在于,所述状态转移模块具体包括:构建模式层和数据层;其中,模式层是对实体概念、属性以及实体间关系进行描述的组织框架;数据层用于对用户个性化传感器领域知识进行实体、关系抽取。3.根据权利要求2所述的系统,其特征在于,所述模式层具体包括:实体类型定义单元、属性类型定义单元和实体关系定义单元;所述数据层具体包括:存储单元用于知识的存储和查询;抽取单元用于实体抽取和关系抽取;创建单元用于构建传感器领域角色、标签和/或关键词;其中,所述模式层和数据层之间的各模块之间具有关联映射关系。4.根据权利要求1所述的系统,其特征在于,所述鉴别器具体包括:四个一维卷积层,每个所述卷积层都使用了64个滤波器,算子尺寸设定为3;激活函数为ReLU函数;填充方式为same;一个Flatten层用于将卷积层的输出展平,一个dropout层用于减少过拟合;一个BatchNormalization层用于加速训练过程;两个全连接层,其中第一个全连接层有256个节点,激活函数为ReLU,第二个全连接层的节点数量则由数据集的实际类别数量决定,激活函数使用softmax。5.根据权利要求1所述的系统,其特征在于,所述变分自编码器和解码器包括:一个RN...

【专利技术属性】
技术研发人员:韩晗刘美辰赵芸伟崔牧凡李旭楠王宝吉
申请(专利权)人:国家计算机网络与信息安全管理中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1