法律法规解析方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号:35682336 阅读:20 留言:0更新日期:2022-11-23 14:25
本发明专利技术公开了一种法律法规解析方法、装置、计算机设备及可读存储介质,其方法包括:对加载的原始法律法规文档进行预解析得到预解析数据,预解析数据包括目录信息项与各目录信息项对应的最大序号,根据解析数据生成法律法规模板;对原始法律法规文档进行逐行解析并与法律法规模板进行比对,将解析得到的各条款挂载到法律法规模板中对应的各目录信息项下,形成法律法规模型;验证法律法规模型。本发明专利技术基于模板对象方法解析法规内容,解析的层级及关系会更准确;当法律法规内容发生调整时会提醒系统中所有引用或使用处能及时提醒,确保所有引用处能及时更新调整。引用处能及时更新调整。引用处能及时更新调整。

【技术实现步骤摘要】
法律法规解析方法、装置、计算机设备及可读存储介质


[0001]本专利技术涉及政策法律法规解析
,具体涉及一种法律法规解析方法、装置、计算机设备及可读存储介质。

技术介绍

[0002]目前大部分的法律、行政法规、政府规章、部门规章、地方性法规、通知公告等都以PDF、RTF、OFD等格式文本存储,法律法规内容查找和使用困难,在行政执法过程中涉及处罚依据问题查找不方便,法规内容变更时无法及时更新。
[0003]中国专利CN202110152861.1公开了一种基于正则表达式匹配算法的政策法律法规解析方法及系统,通过对有代表性的少量政策法律法规进行人工解析,整理出部分规则算法库;再对大量的历史政策法律法规文件进行训练,不断挖掘补充新的匹配规则,最终形成较完整的匹配规则模型。然而该模型不能够针对不同结构的法规文件按照不同的模版文件实现解析,且没有公开对于“款”、“项”、“目”的解析方法,模型层级相对不明确。

技术实现思路

[0004]本专利技术的目的是提供一种法律法规解析方法、装置、计算机设备及可读存储介质,基于模板对象实现法规文件解析,使不同结构的法规文件按照不同的模板文件实现解析,按照层级对文件实现结构化信息入库,方便查找与使用。
[0005]为解决上述问题,本专利技术的第一方面提供了一种法律法规解析方法,包括:对加载的原始法律法规文档进行预解析得到预解析数据,所述预解析数据包括:目录信息项和各所述目录信息项对应的最大索引序号;所述目录信息项包括:“卷”目录、“编”目录、“章”目录和“条”内容,所述“条”内容包括:“条”目录和“款”段落;所述“卷”目录、“编”目录、“章”目录和“条”目录均位于所述原始法律法规文档每行的第一个空格之前,所述“款”段落为所述“条”目录下,无数字排序的自然段;根据所述预解析数据生成法律法规模板;逐行解析所述原始法律法规文档并与所述法律法规模板比对,将解析得到的各条款挂载到所述法律法规模板中对应的各目录信息项下,形成法律法规模型;验证所述法律法规模型。
[0006]优选地,目录信息项还包括:“节”目录,所述“节”目录位于所述原始法律法规文档每行的第一个空格之前。
[0007]优选地,以最大序号的序号数为各所述目录信息项的项数生成法律法规模板。
[0008]优选地,原始法律法规文档的格式包括:word文档、文本文档、PDF文档或网页文档。
[0009]优选地,法律法规模型的生成方法具体包括:按照所述原始法律法规文档的结构逐行解析所述原始法律法规文档的内容,逐行
读取原始法律法规文档的目录信息项及其索引序号并与所述法律法规模板中的目录信息项及其索引序号比对,找到所述原始法律法规文档中每行的内容对应在所述法律法规模板中的具体位置并挂载。
[0010]优选地,法律法规模型的形成方法还包括逐行对
ꢀ“
项”目录、“目”目录的解析和挂载;所述“项”基于“款”目录下,非所述目录信息项,以“项”的应用格式开始的行,解析为“项”;所述“目”基于“项”目录下,非所述目录信息项,以“目”的应用格式开始的行,解析为“目”。
[0011]优选地,法律法规模型的验证内容包括:在全篇法律法规下对所述目录信息项的索引序号连续性的验证;对每个“条”内容下“款”目录的索引序号连续性的验证;和/或对每个“款”目录下“项”目录的索引序号连续性的验证;和/或对每个“项”目录下“目”目录的索引序号连续性的验证;对解析得到的各条款的内容正确性的验证。
[0012]优选地,在全篇法律法规下对所述目录信息项的索引序号连续性的验证内容包括:“条”内容的索引序号在每个“章”和/或“节”目录下连续性的验证;“条”内容的索引序号在所述全篇法律法规下连续性的验证;还可以包括:“项”目录的索引序号在所述全篇法律法规下连续性的验证。
[0013]优选地,法律法规模型的验证还包括二次验证,所述二次验证用于通过对所述原始法律法规文档再次进行解析,与生成的所述法律法规模型比对,标记验证不通过的条款。
[0014]优选地,还包括:利用ASCII码对加载的原始法律法规文档进行清洗。
[0015]根据本专利技术的第二方面提供了一种法律法规解析装置,应用于计算机设备,包括:预解析模块,用于生成法律法规模板;模型生成模块,用于解析原始法律法规文档并与所述法律法规模板进行比对,将解析得到的各条款挂载到所述法律法规模板中对应的各目录信息项下,形成法律法规模型;验证模块,用于对所述法律法规模型进行验证和二次验证;存储单元,用于加载所述原始法律法规文档和存储所述法律法规模型;还可以包括:清洗模块,用于对所述法律法规模板进行清洗。
[0016]优选地,预解析模块包括:读取单元、预解析单元、提取单元、模板生成单元;所述读取单元用于读取所述原始法律法规文档的内容;所述预解析单元用于解析所述原始法律法规文档的结构,判断是否包含目录信息项;所述提取单元用于提取目录信息项与所述目录信息项对应的最大索引序号的序号值;所述模板生成单元用于根据目录信息项与所述目录信息项对应的最大索引序号
值生成法律法规模板。
[0017]优选地,模型生成模块包括:解析单元、比对匹配单元;解析单元用于逐行解析并提取所述原始法律法规文档的目录信息项及其序号,解析
ꢀ“
项”目录和“目”目录及其索引序号;比对匹配单元用于将原始法律法规文档的目录信息项、“项”目录和“目”目录及其索引序号与所述法律法规模型中的目录信息项、
ꢀ“
项”目录和“目”目录及其索引序号比对,找到原始法律法规文档中每行的内容对应在所述法律法规模型中的具体位置并挂载。
[0018]根据本专利技术的第三方面提供了一种计算机设备,计算机设备包括处理器及存储有计算机指令的非易失性存储器,计算机指令被处理器执行时,计算机设备执行第一方面至少一种可能的实施方式中的法律法规解析方法。
[0019]根据本专利技术的第四方面提供了一种可读存储介质,可读存储介质包括计算机程序,计算机程序运行时控制可读存储介质所在计算机设备执行第一方面至少一种可能的实施方式中的法律法规解析方法。
[0020]本专利技术的上述技术方案具有如下有益的技术效果:本专利技术基于模板对象方法解析法规内容,解析的层级及关系会更准确;当法律法规内容发生调整时会提醒系统中所有引用或使用处能及时提醒,确保所有引用处能及时更新调整。
附图说明
[0021]图1是本专利技术第一实施方式的法律法规解析方法的流程图;图2是本专利技术一个实施例的预解析方法的流程图;图3是本专利技术一个实施例的法律法规模型生成方法的流程图;图4是本专利技术一个实施例的写入临时库中的法律法规模板的截图;图5是本专利技术一个实施例的法律法规模解析方法的逻辑框图;图6是本专利技术第二实施方式的法律法规解析装置的结构示意图;图7是本专利技术一个实施例的预解析模块的结构示意图;图8是本专利技术一个实施例的模型生成模块的结构示意图。
[0022]附图标记:预解析模块1、读取单元11、预解析单元12、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种法律法规解析方法,其特征在于,包括:对加载的原始法律法规文档进行预解析得到预解析数据,所述预解析数据包括:目录信息项和各所述目录信息项对应的最大索引序号;所述目录信息项包括:“卷”目录、“编”目录、“章”目录和“条”内容,所述“条”内容包括:“条”目录和“款”段落;所述“卷”目录、“编”目录、“章”目录和“条”目录均位于所述原始法律法规文档每行的第一个空格之前,所述“款”段落为所述“条”目录下,无数字排序的自然段;根据所述预解析数据生成法律法规模板;逐行解析所述原始法律法规文档并与所述法律法规模板比对,将解析得到的各条款内容挂载到所述法律法规模板中对应的各目录信息项下,形成法律法规模型;验证所述法律法规模型。2.根据权利要求1所述的法律法规解析方法,其特征在于,所述目录信息项还包括:“节”目录,所述“节”目录位于所述原始法律法规文档每行的第一个空格之前。3.根据权利要求1或2所述的法律法规解析方法,其特征在于,以所述最大索引序号的序号数为各所述目录信息项的项数生成法律法规模板。4.根据权利要求3所述的法律法规解析方法,其特征在于,所述原始法律法规文档的格式包括:word文档、文本文档、PDF文档或网页文档。5.根据权利要求1所述的法律法规解析方法,其特征在于,形成所述法律法规模型的方法具体包括:按照所述原始法律法规文档的结构逐行解析所述原始法律法规文档的内容,逐行读取原始法律法规文档的目录信息项及其索引序号并与所述法律法规模板中的目录信息项及其索引序号比对,找到所述原始法律法规文档中每行的内容对应在所述法律法规模板中的具体位置并挂载。6.根据权利要求1或2所述的法律法规解析方法,其特征在于,所述法律法规模型的形成方法还包括:逐行对“项”目录、“目”目录的解析和挂载;所述“项”基于“条”目录或“款”段落下,非所述目录信息项,以“项”的应用格式开始的行,解析为“项”;所述“目”基于“项”目录下,非所述目录信息项,以“目”的应用格式开始的行,解析为“目”。7.根据权利要求1或6所述的法律法规解析方法,其特征在于,所述法律法规模型的验证的内容包括:对全篇法律法规的所述目录信息项的索引序号连续性的验证;和/或对每个“款”段落下“项”目录的索引序号连续性的验证;和/或对每个“项”目录下“目”目录的索引序号连续性的验证;对解析得到的各条款的内容正确性的验证。8.根据权利要求1或7所述的法律法规解析方法,其特征在于,所述在全篇法律法规下对所述目录信息项的索引序号连续性的验证内容包括:“条”目录的索引序号在每个“章”和/或“节”目录下连续性的验证;“条”目录的索引序号在所述全篇法律法规下连续性的验证;
还可以包括...

【专利技术属性】
技术研发人员:马旭慧张凯陈铭柳进军李浩浩武帅兴张海军刑凯翔李俊鹏陈楠
申请(专利权)人:北京中海住梦科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1