【技术实现步骤摘要】
数据匹配方法、装置及其设备、计算机存储介质
本专利技术涉及数据处理技术,尤其涉及一种数据匹配方法、装置及其设备、计算机存储介质。
技术介绍
多维时间序列是物联网系统最常见的一种数据。物联网系统每间隔一段固定或不固定时间,便同时采样设备的多个不同物理量形成多维时间序列。例如电力领域的大型设备,如变电站、发电站的汽轮车、发电机、励磁系统等设备在运行中通常都会安装物联网监测系统,这些监测系统会采集每个设备在运行中的多个物理量,并以多维时间序列的形式将多个物理量保存下来,形成重要的数据资产。当工作人员对某个设备的运行数据进行分析,例如对设备的运行温度进行分析时,往往需要查询预设时间段的设备运行温度对应的时间序列数据,并将多个时间序列数据进行相似度比较。但是现有的针对多维时间序列的查询技术十分落后,还局限于类SQL(StructuredQueryLanguage,结构化查询语言)查询的水平。数据搜索完成后,需要人工对查询到的数据进行标注,再对标注后的数据进行汇总,然后进行数据相似度的精确匹配。这种相似度匹配的方法需要大量的人力和时间,劳动成本大。目前针对多维时间序列数据的相似度匹配,还没有更为有效的解决方法。因此,现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。
技术实现思路
本专利技术提供一种数据匹配方法、装置及其设备、计算机存储介质,用以解决现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。一方面,本专利技术提供一种数据匹配方法,包括:获取设施语料库 ...
【技术保护点】
1.一种数据匹配方法,其特征在于,包括:/n获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;/n接收用户输入的待查询时间序列数据;/n对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;/n将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;/n获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;/n获取与所述多个相似多维时间序列原始数据对应的语义;/n输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。/n
【技术特征摘要】
1.一种数据匹配方法,其特征在于,包括:
获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;
接收用户输入的待查询时间序列数据;
对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;
将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;
获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;
获取与所述多个相似多维时间序列原始数据对应的语义;
输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。
2.根据权利要求1所述的方法,其特征在于,所述获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据中每个维度的时间序列数据对应的符号序列,包括:
从工业物理网服务器获取多个设备的所述多维时间序列原始数据;
获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的指定时间窗口,一个所述指定时间窗口对应有多个维度的时间序列数据;
获取所述指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理所述多个维度的时间序列数据中每个维度的时间序列数据,得到关于所述多个维度的原始符号序列;
分别分词操作处理所述多个维度的原始符号序列中每个维度的所述原始符号序列,得到所述多个维度中每个维度对应的分词符号序列组;
获取所述多个维度的排序规律,根据所述排序规律排序所述每个维度对应的分词符号序列组,得到序列句,所述序列句包括所述多个维度的分词符号序列组;
根据相似度标准聚类所述序列句中所述多个维度的分词符号序列组,得到所述多个维度对应的所述符号序列,即多维时间序列原始数据对应的符号序列;
根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库;
返回执行步骤获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取所述多个设备中每个设备的语料库,得到所述设施语料库。
3.根据权利要求2所述的方法,其特征在于,所述获取所述指定时间窗口中的时间序列数据,符号化所述时间序列数据,得到关于多个维度的原始符号序列,包括:
获取所述指定时间窗口对应的多个维度的时间序列数据,并摘录所述多个维度的时间序列数据的语义;
获取所述语义的持续时间;
根据所述持续时间,符号化所述多个维度的时间序列数据,得到关于所述多个维度的原始符号序列。
4.根据权利要求2所述的方法,其特征在于,所述根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库包括:
更新所述序列句中的所述多个维度的分词符号序列组为所述多个维度对应的所述符号序列,并根据更新结果建立所述任意一个设备的语料库。
5.根据权利要求2所述...
【专利技术属性】
技术研发人员:吕昱,熊飞,唐德宇,
申请(专利权)人:易通星云北京科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。