【技术实现步骤摘要】
文书智能排版方法及系统
[0001]本专利技术涉及法律知识工程
,特别是涉及一种文书智能排版方法及系统。
技术介绍
[0002]国家公文和各类法律文书为保障其严肃性,都有严格的版式规定。国家公文和各类法律文书一般以非结构化自然语言文档方式来表示。为了严格符合版式要求,人工排版往往会耗时耗力,特别是针对特殊情形的文书,肉眼有时都难以观察和把控。因此,采用计算机技术对文档内容和结构进行识别并按照对应文档类型之下的排版标准进行自动排版,是解决国家公文和各类法律文书排版工作在信息化场景下的关键技术。最接近的同类技术及其不足之处,分述如下:
[0003]1.法律文书自动排版方法及装置(申请号/专利号:CN201910769647.3):核心的方法包括:通过模板式信息填充生成法律文书;以用户对文书的格式要求为标准,以预先设计的刷格式模型为参考,配置刷格式XML文件;程序解析法律文书Word文件为Word模型,根据Word中结构书签和内容标记书签的分布,为每个段落设置结构书签和段落书签,然后加载刷格式配置,进行格式的设置。本 ...
【技术保护点】
【技术特征摘要】
1.一种文书智能排版方法,其特征在于,包括:根据每类文书的书写规范、文本结构和内容特征,从后续排版要求出发,设计一套针对每一类文书的xml信息模型;根据每类文书的排版规范,结合这类文书的xml信息模型,定义一套排版样式模型;根据不同类文书的书写规范、文本结构和内容特征,设计一套识别文书类型的分类算法,实现对每一篇文书实例的自动分类;根据不同类文书的书写规范、文本结构和内容特征,结合这类文书的xml信息模型,采用基于规则和深度学习混合的方法,对文书全文进行分段切片和局部要素提取,按照文书的xml信息模型形成一个实例xml;根据当前文书的排版规范,调用对应的排版计算模型和排版样式模型,对当前文书实例xml进行自动排版,输出一个word或wps文档。2.根据权利要求1所述的文书智能排版方法,其特征在于,根据每类文书的书写规范、文本结构和内容特征,从后续排版要求出发,设计一套针对每一类文书的xml信息模型,包括:总结每类文书文本书写规范和文本结构,将文本各段落按照逻辑关系划分出多层级的文本片;基于每类文书文本的切片业务特征、排版规范和语义特征,每一层级的分片,都包括分片属性和分片内容,同一层级分片之间定义上下文顺序,每一层级的分片,基于后续排版规范的需求,设计需要包含的信息要素;设计文书切片信息模型用以存储文书文本各层级切片及其要素。3.根据权利要求1所述的文书智能排版方法,其特征在于,根据每类文书的排版规范,结合这类文书的xml信息模型,定义一套排版样式模型,包括:总结文书中要素的信息,设计一套针对各个部分样式存储的xml信息模型。4.根据权利要求3所述的文书智能排版方法,其特征在于,xml信息模型包括:字体设置,及段落设置,字体设置中进行存储样式,字体、字号、样式、字号、颜色、字符间距、字符间隔,段落设置中进行存储样式,对其方式、左右缩进、行距、首行缩进类型。5.根据权利要求1所述的文书智能排版方法,其特征在于,根据不同类文书的书写规范、文本结构和内容特征,设计一套识别文书类型的分类算法,实现对每一篇文书实例的自动...
【专利技术属性】
技术研发人员:陈浩,
申请(专利权)人:北京法意科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。