【技术实现步骤摘要】
一种数据处理方法及装置
[0001]本申请涉及数据处理
,尤其涉及一种数据处理方法及装置
。
技术介绍
[0002]随着物联网的发展,物联网资产设备在持续
、
快速的增长
。
物联网资产设备会产生各种类型的数据比如日志型数据
、
资产型数据
、
风险型数据
、
统计型数据等
。
目前对于这些物联网资产设备产生的大量数据通常采用的是单一的数据接入方式,即通过预先定义待接入数据字段的格式与字段值,然后根据预先设定的数据过滤规则和数据匹配方式对待接入数据进行处理,得到所需类型的数据
。
[0003]此种数据接入方式的缺点在于,数据提供方无法自定义自己的数据格式和类型,不同类型的数据无法做区别处理
。
并且数据过滤规则设定较死板,导致很多实际有价值的数据被视为无用的数据而丢弃
。
[0004]因此,目前亟需一种方案,用以更精细化更智能化地对接入数据进行处理
。
技术实现思路
[0005]本申请提供一种数据处理方法及装置,用以更精细化更智能化地对接入数据进行处理
。
[0006]第一方面,本申请提供一种数据处理方法,该方法包括:接收设备上报的自定义格式的待处理数据;对于所述待处理数据中可处置的第一数据,提取第一数据的第一特征信息,对所述第一特征信息进行双向语义分析,得到与所述第一特征信息存在关联关系的第二特征信息;基于所述第一特征信 ...
【技术保护点】
【技术特征摘要】
1.
一种数据处理方法,其特征在于,所述方法包括:接收设备上报的自定义格式的待处理数据;对于所述待处理数据中可处置的第一数据,提取第一数据的第一特征信息,对所述第一特征信息进行双向语义分析,得到与所述第一特征信息存在关联关系的第二特征信息;基于所述第一特征信息和所述第二特征信息,得到符合所述第一数据对应的设定标准格式的第二数据
。2.
根据权利要求1所述的方法,其特征在于,所述基于所述第一特征信息和所述第二特征信息,得到符合所述第一数据对应的设定标准格式的第二数据,包括:通过所述第一数据对应的设定标准格式,对所述第一数据进行扩充,并获取扩充的第三特征信息;按照所述第一特征信息
、
所述第二特征信息
、
所述第三特征信息,得到符合所述第一数据对应的设定标准格式的第二数据
。3.
根据权利要求1所述的方法,其特征在于,所述提取第一数据的第一特征信息,对所述第一特征信息进行双向语义分析,得到与所述第一特征信息存在关联关系的第二特征信息,包括:将所述第一数据输入至数据处理模型的编码模块,通过所述编码模块中多个编码器的自注意力机制确定第一数据的类型,并对提取的第一数据的第一特征信息进行双向语义分析,得到与所述第一特征信息存在关联关系的第二特征信息
。4.
根据权利要求2所述的方法,其特征在于,所述通过所述第一数据对应的设定标准格式,对所述第一数据进行扩充,并获取扩充的第三特征信息,包括:将数据处理模型的编码模块输出的第一数据的编码信息,以及所述第一数据的类型对应的预设提示语输入至数据处理模型的解码模块,对所述第一数据进行扩充,并获取扩充的第三特征信息;所述解码模块包括至少一个解码器
。5.
根据权利要求3或4所述的方法,其特征在于,所述方法还包括
:
确定用于预训练的标准格式的第一训练数据;对所述第一训练数据增加掩码得到带有掩码的第一训练数据;对所述第一训练数据进行标注得到所述第一训练数据的类型;通过所述带有掩码的第一训练数据
、
所述第一训练数据的类型,以及所述标准格式的第一训练数据,对数据处理模型的编码模块进行预训练;确定对所述标准格式的第一训练数据进行扩充后的标准格式的第二训练...
【专利技术属性】
技术研发人员:黄自力,邱震尧,熊璐,秦璐,张叶,杨阳,陈舟,
申请(专利权)人:中国银联股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。