数据匹配方法、装置及其设备、计算机存储介质制造方法及图纸

技术编号:26222692 阅读:24 留言:0更新日期:2020-11-04 10:53
本发明专利技术提供一种数据匹配方法、装置及其设备、计算机存储介质。该方法包括:获取设施语料库,设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,符号序列是对多维时间序列原始数据进行符号化处理得到的;接收用户输入的查询请求,查询请求中包括待查询时间序列数据;对待查询时间序列数据进行符号化处理得到待查询符号序列;将待查询符号序列与设施语料库中的符号序列进行匹配,得到多个相似符号序列;获取与多个相似符号序列对应的多个相似多维时间序列原始数据;获取与多个相似多维时间序列原始数据对应的语义。本发明专利技术的方法,解决了现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。

【技术实现步骤摘要】
数据匹配方法、装置及其设备、计算机存储介质
本专利技术涉及数据处理技术,尤其涉及一种数据匹配方法、装置及其设备、计算机存储介质。
技术介绍
多维时间序列是物联网系统最常见的一种数据。物联网系统每间隔一段固定或不固定时间,便同时采样设备的多个不同物理量形成多维时间序列。例如电力领域的大型设备,如变电站、发电站的汽轮车、发电机、励磁系统等设备在运行中通常都会安装物联网监测系统,这些监测系统会采集每个设备在运行中的多个物理量,并以多维时间序列的形式将多个物理量保存下来,形成重要的数据资产。当工作人员对某个设备的运行数据进行分析,例如对设备的运行温度进行分析时,往往需要查询预设时间段的设备运行温度对应的时间序列数据,并将多个时间序列数据进行相似度比较。但是现有的针对多维时间序列的查询技术十分落后,还局限于类SQL(StructuredQueryLanguage,结构化查询语言)查询的水平。数据搜索完成后,需要人工对查询到的数据进行标注,再对标注后的数据进行汇总,然后进行数据相似度的精确匹配。这种相似度匹配的方法需要大量的人力和时间,劳动成本大。目前针对多维时间序列数据的相似度匹配,还没有更为有效的解决方法。因此,现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。
技术实现思路
本专利技术提供一种数据匹配方法、装置及其设备、计算机存储介质,用以解决现有的多维时间序列数据的相似度匹配方法存在劳动成本大的问题。一方面,本专利技术提供一种数据匹配方法,包括:获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;接收用户输入的待查询时间序列数据;对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;获取与所述多个相似多维时间序列原始数据对应的语义;输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。其中一项实施例中,所述获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据中每个维度的时间序列数据对应的符号序列,包括:从工业物理网服务器获取多个设备的所述多维时间序列原始数据;获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的指定时间窗口,一个所述指定时间窗口对应有多个维度的时间序列数据;获取所述指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理所述多个维度的时间序列数据中每个维度的时间序列数据,得到关于所述多个维度的原始符号序列;分别分词操作处理所述多个维度的原始符号序列中每个维度的所述原始符号序列,得到所述多个维度中每个维度对应的分词符号序列组;获取所述多个维度的排序规律,根据所述排序规律排序所述每个维度对应的分词符号序列组,得到序列句,所述序列句包括所述多个维度的分词符号序列组;根据相似度标准聚类所述序列句中所述多个维度的分词符号序列组,得到所述多个维度对应的所述符号序列,即多维时间序列原始数据对应的符号序列;根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库;返回执行步骤获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取所述多个设备中每个设备的语料库,得到所述设施语料库。其中一项实施例中,所述获取所述指定时间窗口中的时间序列数据,符号化所述时间序列数据,得到关于多个维度的原始符号序列,包括:获取所述指定时间窗口对应的多个维度的时间序列数据,并摘录所述多个维度的时间序列数据的语义;获取所述语义的持续时间;根据所述持续时间,符号化所述多个维度的时间序列数据,得到关于所述多个维度的原始符号序列。其中一项实施例中,所述根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库包括:更新所述序列句中的所述多个维度的分词符号序列组为所述多个维度对应的所述符号序列,并根据更新结果建立所述任意一个设备的语料库。其中一项实施例中,所述排序规律为所述多个维度之间的相关性由高至低的排序规律。其中一项实施例中,所述获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据,包括:从工业物联网服务器获取数据对应关系,所述数据对应关系是指所述设施语料库中的多维时间序列数据与对应的符号序列之间的对应关系;根据所述数据对应关系,从所述工业物联网服务器获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据。其中一项实施例中,所述将所述待查询符号序列与所述述设施语料库中的符号序列进行匹配,得到多个相似符号序列,包括:获取匹配模型;将所述待查询符号序列输入所述匹配模型,得到所述多个相似符号序列,所述匹配模型用于将所述待查询符号序列与所述设施语料库中的符号序列进行匹配。其中一项实施例中,所述获取匹配模型包括:获取词向量模型;根据所述设施语料库训练所述词向量模型,得到所述匹配模型。其中一项实施例中,所述将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列,包括:分别获取所述多个相似符号序列中每个所述相似符号序列与所述待查询符号序列的相似度;获取相似度排序规律;根据所述相似度排序规律排序所述相似度,以及排序与所述相似度对应的相似符号序列。另一方面,本专利技术提供一种数据匹配装置,包括:获取模块,用于获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;接收模块,用于接收用户输入的待查询时间序列数据;数据处理模块,用于对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;匹配模块,用于将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;所述获取模块还用于获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;所述获取模块还用于获取与所述多个相似多维时间序列原始数据对应的语义;输出模块,用于输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。另一方面,本专利技术提供一种电子设备,包括:处理器、存储器和收发器,所述存储器用于存储指令,所述收发器用于和其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如上实施例所述的数据匹配方法。另一方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被本文档来自技高网...

【技术保护点】
1.一种数据匹配方法,其特征在于,包括:/n获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;/n接收用户输入的待查询时间序列数据;/n对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;/n将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;/n获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;/n获取与所述多个相似多维时间序列原始数据对应的语义;/n输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。/n

【技术特征摘要】
1.一种数据匹配方法,其特征在于,包括:
获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据对应的符号序列,所述符号序列用于表征所述多维时间序列数据的特征,所述符号序列是对所述多维时间序列原始数据进行符号化处理得到的;
接收用户输入的待查询时间序列数据;
对所述待查询时间序列数据进行所述符号化处理得到待查询符号序列;
将所述待查询符号序列与所述设施语料库中的符号序列进行匹配,得到多个相似符号序列;
获取与所述多个相似符号序列对应的多个相似多维时间序列原始数据;
获取与所述多个相似多维时间序列原始数据对应的语义;
输出所述多个相似多维时间序列原始数据和所述多个多维相似时间序列原始数据对应的语义。


2.根据权利要求1所述的方法,其特征在于,所述获取设施语料库,所述设施语料库包括多个设备的多维时间序列原始数据中每个维度的时间序列数据对应的符号序列,包括:
从工业物理网服务器获取多个设备的所述多维时间序列原始数据;
获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的指定时间窗口,一个所述指定时间窗口对应有多个维度的时间序列数据;
获取所述指定时间窗口对应的多个维度的时间序列数据,分别符号分割化处理所述多个维度的时间序列数据中每个维度的时间序列数据,得到关于所述多个维度的原始符号序列;
分别分词操作处理所述多个维度的原始符号序列中每个维度的所述原始符号序列,得到所述多个维度中每个维度对应的分词符号序列组;
获取所述多个维度的排序规律,根据所述排序规律排序所述每个维度对应的分词符号序列组,得到序列句,所述序列句包括所述多个维度的分词符号序列组;
根据相似度标准聚类所述序列句中所述多个维度的分词符号序列组,得到所述多个维度对应的所述符号序列,即多维时间序列原始数据对应的符号序列;
根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库;
返回执行步骤获取所述多个设备中任意一个设备的所述多维时间序列原始数据对应的具有物理意义的时间窗口,直至获取所述多个设备中每个设备的语料库,得到所述设施语料库。


3.根据权利要求2所述的方法,其特征在于,所述获取所述指定时间窗口中的时间序列数据,符号化所述时间序列数据,得到关于多个维度的原始符号序列,包括:
获取所述指定时间窗口对应的多个维度的时间序列数据,并摘录所述多个维度的时间序列数据的语义;
获取所述语义的持续时间;
根据所述持续时间,符号化所述多个维度的时间序列数据,得到关于所述多个维度的原始符号序列。


4.根据权利要求2所述的方法,其特征在于,所述根据所述多维时间序列原始数据对应的符号序列建立所述任意一个设备的语料库包括:
更新所述序列句中的所述多个维度的分词符号序列组为所述多个维度对应的所述符号序列,并根据更新结果建立所述任意一个设备的语料库。


5.根据权利要求2所述...

【专利技术属性】
技术研发人员:吕昱熊飞唐德宇
申请(专利权)人:易通星云北京科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1