一种智能适配报文标签内容的解析方法及装置制造方法及图纸

技术编号:31927220 阅读:19 留言:0更新日期:2022-01-15 13:12
本发明专利技术提供一种智能适配报文标签内容的解析方法及装置,所述方法包括如下步骤:S1.获取XML格式报文,并对XML格式报文进行处理,生成待检索文本文件;S2.获取目标标签,并根据目标标签生成检索逻辑式;S3.通过检索逻辑式对待检索文本文件中字符进行匹配,得到目标标签对应内容。本发明专利技术提供的智能适配报文标签内容的解析方法及装置,通过根据目标标签生成的检索逻辑式对文本格式的XML文件直接进行匹配,得到目标标签内容,简化了原有XML报文格式标签内容解析的步骤,提高了获取数据的速度。提高了获取数据的速度。提高了获取数据的速度。

【技术实现步骤摘要】
一种智能适配报文标签内容的解析方法及装置


[0001]本专利技术属于报文标签解析
,具体涉及一种智能适配报文标签内容的解析方法及装置。

技术介绍

[0002]现有的XML格式报文解析的规则如下:首先把XML格式报文中的特殊字符转义,然后根据XML格式获取根节点数据,再根据根节点数据逐层获取下层节点数据,层层解析直至获取到要使用的节点数据。
[0003]现有XML格式报文的解析规则使用起来操作复杂,步骤繁多,不但需要根据返回的XML报文格式进行适配相应的标签规则,而且需要逐层解析,尤其当需要的数据处在最下方一层节点时,则需要一直解析到最后一层才可以取到数据,此时,要获取需要的数据内容就需要进行多次解析。此种逐层解析XML报文数据的规则,而不能直接取得所需标签内的内容,尤其当需要多种标签内容时,每次都需要逐层解析,大大影响了获取数据的速度。
[0004]此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种智能适配报文标签内容的解析方法及装置,是非常有必要的。

技术实现思路

[0005]针对现有技术的上述现有逐层解析XML格式报文的规则,在所需标签内容在最底层以及需要多种标签内容是,解析速度慢,影响获取数据速度的缺陷,本专利技术提供一种智能适配报文标签内容的解析方法及装置,以解决上述技术问题。
[0006]第一方面,本专利技术提供一种智能适配报文标签内容的解析方法,包括如下步骤:
[0007]S1.获取XML格式报文,并对XML格式报文进行处理,生成待检索文本文件;
[0008]S2.获取目标标签,并根据目标标签生成检索逻辑式;
[0009]S3.通过检索逻辑式对待检索文本文件中字符进行匹配,得到目标标签对应内容。
[0010]进一步地,步骤S1具体步骤如下:
[0011]S11.获取经过转义处理的XML格式报文;
[0012]S12.将XML格式报文中经过转义的特殊字符转码回正常字符;
[0013]S13.将完成转码的XML格式报文进行压缩,并去除冗余数据,生成待检索文本文件。对XML格式报文处理的目的是将XML格式报文转换为文本格式,为下一步直接匹配做准备。
[0014]进一步地,步骤S13中,所述冗余数据包括空格和标点符号。去除作为空格及标点符号对文本内容检索的干扰。所述冗余数据包括但不限于空格和标点符号。
[0015]进一步地,步骤S2具体步骤如下:
[0016]S21.获取目标标签及目标标签内容的取值范围;
[0017]S22.根据目标标签及目标标签内容的取值范围生成检索逻辑式。目标标签及需要检索的XML报文格式的字段项,而标签内容的取值范围为该检索项的值的限制。如大于或小
于多少的标签内容。
[0018]进一步地,步骤S21中,获取目标标签数量及每个目标标签内容的取值范围;
[0019]步骤S22中,根据各目标标签内容的取值范围及各目标标签间的逻辑关系生成检索逻辑式;所述检索逻辑式采用正则表达式。各目标标签间的逻辑关系包括与、或及非的关系。
[0020]进一步地,步骤S3具体步骤如下:
[0021]S31.将待检索文本文件进行分段处理,生成待检索子文本;
[0022]S32.设置多线程,每个线程通过检索逻辑式对一段待检索子文本中字符进行匹配,再将各线程检索内容进行合并,得到目标标签对应内容。多线程进行检索,提高了匹配检索的速度。
[0023]第二方面,本专利技术提供一种智能适配报文标签内容的解析装置,包括:
[0024]待检索文本生成模块,用于获取XML格式报文,并对XML格式报文进行处理,生成待检索文本文件;
[0025]检索逻辑式生成模块,用于获取目标标签,并根据目标标签生成检索逻辑式;
[0026]检索模块,用于通过检索逻辑式对待检索文本文件中字符进行匹配,得到目标标签对应内容。
[0027]进一步地,待检索文本生成模块包括:
[0028]XML格式报文获取单元,用于获取经过转义处理的XML格式报文;
[0029]特殊字符转码单元,用于将XML格式报文中经过转义的特殊字符转码回正常字符;
[0030]冗余数据去除单元,用于将完成转码的XML格式报文进行压缩,并去除冗余数据,生成待检索文本文件。
[0031]进一步地,检索逻辑式生成模块包括:
[0032]目标标签获取单元,用于获取目标标签及目标标签内容的取值范围;
[0033]检索逻辑式生成单元,用于根据目标标签及目标标签内容的取值范围生成检索逻辑式。
[0034]进一步地,检索模块包括:
[0035]待检索文本分段单元,用于将待检索文本文件进行分段处理,生成待检索子文本;
[0036]分段匹配单元,用于设置多线程,每个线程通过检索逻辑式对一段待检索子文本中字符进行匹配,再将各线程检索内容进行合并,得到目标标签对应内容。
[0037]本专利技术的有益效果在于:
[0038]本专利技术提供的智能适配报文标签内容的解析方法及装置,通过根据目标标签生成的检索逻辑式对文本格式的XML文件直接进行匹配,得到目标标签内容,简化了原有XML报文格式标签内容解析的步骤,提高了获取数据的速度。
[0039]此外,本专利技术设计原理可靠,结构简单,具有非常广泛的应用前景。
[0040]由此可见,本专利技术与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
[0041]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0042]图1是本专利技术智能适配报文标签内容的解析方法的实施例1流程示意图。
[0043]图2是本专利技术智能适配报文标签内容的解析方法的实施例2流程示意图。
[0044]图3为本专利技术智能适配报文标签内容的解析装置示意图。
[0045]图中,1

待检索文本生成模块;1.1

XML格式报文获取单元;1.2

特殊字符转码单元;1.3

冗余数据去除单元;2

检索逻辑式生成模块;2.1

目标标签获取单元;2.2

检索逻辑式生成单元;3

检索模块;3.1

待检索文本分段单元;3.2

分段匹配单元。
具体实施方式
[0046]为了使本
的人员更好地理解本专利技术中的技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种智能适配报文标签内容的解析方法,其特征在于,包括如下步骤:S1.获取XML格式报文,并对XML格式报文进行处理,生成待检索文本文件;S2.获取目标标签,并根据目标标签生成检索逻辑式;S3.通过检索逻辑式对待检索文本文件中字符进行匹配,得到目标标签对应内容。2.如权利要求1所述的智能适配报文标签内容的解析方法,其特征在于,步骤S1具体步骤如下:S11.获取经过转义处理的XML格式报文;S12.将XML格式报文中经过转义的特殊字符转码回正常字符;S13.将完成转码的XML格式报文进行压缩,并去除冗余数据,生成待检索文本文件。3.如权利要求2所述的智能适配报文标签内容的解析方法,其特征在于,步骤S13中,所述冗余数据包括空格和标点符号。4.如权利要求1所述的智能适配报文标签内容的解析方法,其特征在于,步骤S2具体步骤如下:S21.获取目标标签及目标标签内容的取值范围;S22.根据目标标签及目标标签内容的取值范围生成检索逻辑式。5.如权利要求4所述的智能适配报文标签内容的解析方法,其特征在于,步骤S21中,获取目标标签数量及每个目标标签内容的取值范围;步骤S22中,根据各目标标签内容的取值范围及各目标标签间的逻辑关系生成检索逻辑式;所述检索逻辑式采用正则表达式。6.如权利要求5所述的智能适配报文标签内容的解析方法,其特征在于,步骤S3具体步骤如下:S31.将待检索文本文件进行分段处理,生成待检索子文本;S32.设置多线程,每个线程通过检索逻辑式对一段待检索子文本中字符进行匹配,再将各线程...

【专利技术属性】
技术研发人员:张玉龙董登科赵华太
申请(专利权)人:神思智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1