一种基于条件随机场的物联网数据序列标注模型制造技术

技术编号:24889314 阅读:47 留言:0更新日期:2020-07-14 18:16
本发明专利技术公开了一种基于条件随机场的物联网数据序列标注模型,基于条件随机场的物联网数据序列标注模型中技术方案的架构图,是依据对象‑关系概率模型进行设计的,主要考虑两类的结构不确定性:关系不确定性,对象不确定性,即领域中实际对象的真实集合对分布建模,设计的架构为数据预处理模块、序列参数化与因子分析、确定成分构建确定性CPD、物理成因分析以及随机成分构建条件随机场。整个模型既融合了序列标注任务所需的信息,有助于模型对于实体的判断,又结合了上下文信息的表示能力,还保留CRF层求解标签序列的全局最优解的能力,从而为模型产生最优结果创造了可能。

【技术实现步骤摘要】
一种基于条件随机场的物联网数据序列标注模型
本专利技术属于计算机应用(数据挖掘)领域,涉及一种基于条件随机场模型及其在物联网数据上序列标注任务的应用。
技术介绍
物联网数据主要是指传感器和设备发过来的数据。这些数据一部分是对现实环境参数的采集值,一部分是设备的一些常规信息值,比如:部件状态、故障信息、运行情况等。物联网数据在任何情况下都会产生数据,无需人为参与就不会不断涌现出新的数据,其数据量远远大于传统业务系统的业务数据。如果,物联网只是负责采集一堆传感器和设备发过来的数据,那就只不过是一堆庞大的数据聚集在一起,产生不了实际的价值意义。在物联网数据处理中,很多业务问题都可以利用序列标注模型解决,比如工业生产中的流水线核心部件运行状态预告预警、传感器数据去噪、生产过程标注等。复杂的标注任务可以分解成分段任务(segmentation)和标注任务(tagging)这两个基本的标注任务。另外,物联网数据序列中时间序列数据中间的每个时刻的结果都可以使用元组(V,t)表示。V为需要观测的值;t为观测的值发生的时间,一个时间序列通常由多个元组组成本文档来自技高网...

【技术保护点】
1.一种基于条件随机场的物联网数据序列标注模型,其特征在于:基于条件随机场的物联网数据序列标注模型中技术方案的架构图,是依据对象-关系概率模型进行设计的,主要考虑两类的结构不确定性:关系不确定性,即对象之间的关系存在或不存在的情况下对分布建模;对象不确定性,即领域中实际对象的真实集合对分布建模。/n

【技术特征摘要】
1.一种基于条件随机场的物联网数据序列标注模型,其特征在于:基于条件随机场的物联网数据序列标注模型中技术方案的架构图,是依据对象-关系概率模型进行设计的,主要考虑两类的结构不确定性:关系不确定性,即对象之间的关系存在或不存在的情况下对分布建模;对象不确定性,即领域中实际对象的真实集合对分布建模。


2.根据权利要求1所述的一种基于条件随机场的物联网数据序列标注模型,其特征在于:其设计的架构包含数据预处理模块、序列参数化与因子分析、确定成分构建确定性CPD、物理成因分析以及随机成分构建条件随机场。


3.根据权利要求2所述的一种基于条件随机场的物联网数据序列标注模型,其特征在于:所述数据预处理模块包含将非结构化或半结构化的原始数据,整合成结构化数据;对数据进行统计分析与业务理解,将时间轴离散化为一组时间片段,系统状态在间隔为Δ的区间上测定,其中Δ为预先指定的时间粒度切割准则,这样可以将随机变量集合约束到X(0),X(1),...上,其中X(t)表示系统在时刻X(t-1)+t·Δ时刻状态的基础随机变量。


4.根据权利要求2所述的一种基于条件随机场的物联网数据序列标注模型,其特征在于:所述序列参数化与因子分析即给定输入X1,X2,...Xi,在与时间一致的方向上,Y=Y1...Yn(n≥0),其中Yi∈τ,1≤i≤n,τ为特征性质标注的集合,所表示的条件随机场网络的分布具有如下形式:
a)
b)
c)
其中特征性质标注输出概率最优结果δ为输入标记序列路径的集合,即为搜索空间;θ为模型参数,即为特征权重向量,另外,作为条件随机场需要参数化因子我们有能量函数来将其对数化,也称为对数线性模型:






参数化条件随机场的核心问题是,这种表示存在无向性,因此参数化在本质上需保持无向性特点,而因子既包含联合分布的概念,也包含CPD的概念,上的一个联合分布就是上的一个因子,它为的每个值的赋值都具体定义了一个实数,不过,CPD和联合分布都必须满足一定的归一化约束条件,例如,在联合分布中,实数之和必须为1,
与贝叶斯网一样,条件随机场的Xi结构也可以看作是对一系列独立性假设的编码:分离条件作为条件随机场中检测独立性的准则是可靠的,在图上的因子分解的任意分布都能满足分离性所蕴含的独立性条件。


5.根据权利要求2所述的一种基于条件随机场的物联网数据序列标注模型,其特征在于:其确定成分构建确定性CPD包括物联网数据有相当一部分来自于物理建模,这一类往往有一个确定的变量间的映射关系:比如对机器和电路,确定性依赖关系往往是设备规格...

【专利技术属性】
技术研发人员:倪巍
申请(专利权)人:华存数据信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1