一种文书生成方法、装置、存储介质和电子设备制造方法及图纸

技术编号:17109808 阅读:30 留言:0更新日期:2018-01-24 22:28
本发明专利技术公开了一种文书生成方法、装置、存储介质和电子设备,所述方法包括:对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;对所述内容信息进行知识表示;基于所述内容信息的知识表示,自动生成文书。通过本发明专利技术可解决现有技术只能采用人工方法来生成内容结构不固定文书所带来的耗时耗力、效率低下等问题。

An instrument generation method, device, storage medium, and electronic equipment

The invention discloses a document generation method, device, storage medium and electronic device, the method includes: extracting information related information to generate documents, obtain the documents needed to generate content information; knowledge of the content information; said the content information based on knowledge of the automatic generation of documents. The invention can solve the problem that the existing technology can only use artificial methods to generate the time consuming and low efficiency and low efficiency caused by the unfixed contents of the content structure.

【技术实现步骤摘要】
一种文书生成方法、装置、存储介质和电子设备
本专利技术涉及文书生成领域,尤其涉及一种文书生成方法、装置、存储介质和电子设备。
技术介绍
自然语言生成(NaturalLanguageGeneration,NLG)技术是人工智能(ArtificialIntelligence,AI)中非常活跃的一个领域,其在各行各业均有着广泛的应用,如军事文书的生成、司法文书的生成等。以司法应用为例,在司法办案过程中,所需文书众多,其文书的处理工作是司法办案过程中的一项重要部分,处理的效率直接影响着办案效率的高低。现有的司法文书生成主要采用以下两种方法:1、基于人工的文书生成:由文书涉及领域的相关工作人员,基于专业知识、经验和待生成文书相关资料,人工生成需要的文书。2、基于模板技术的文书生成:首先预先按照可能出现的几种情况事先构造数个相应的模板,每个模板包含一些常量和一些变量。当用户输入一定的信息后,文本生成器将这些信息作为字符串嵌入到模板中替代变量,生成文本。然而,上述现有方案缺存在如下不足:基于人工的文书生成方法耗时耗力,影响整个办案效率,且在当今案件日渐增多的现状下,文书生成无疑给司法工作人员带来了很重的工作负担;基于模板技术的文书生成方法,与纯人工方法相比,虽在一定程度上减少了司法人员工作量,但其只能解决有固定结构部分的文书生成,通用性较差。
技术实现思路
为克服上述现有技术存在的不足,本专利技术之目的在于提供一种文书生成方法、装置、存储介质和电子设备,以解决现有技术只能采用人工方法来生成内容结构不固定文书所带来的耗时耗力、效率低下等问题。为达上述目的,本专利技术提供的技术方案如下:一种文书生成方法,包括如下步骤:步骤一,对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;步骤二,对所述内容信息进行知识表示;步骤三,基于所述内容信息的知识表示,自动生成文书。可选的,步骤二进一步包括:对所述内容信息确定知识表示结构;通过对所述知识表示结构中各节点对应的具体内容进行语法和成分分析,填充所述知识表示结构中各节点,得到初步知识表示结构;将得到的初步知识表示结构中的各节点进行去聚合重组,得到所述内容信息的知识表示。可选的,步骤一进一步包括:对所述待生成文书相关资料中每个标注单元进行标注;根据待生成文书类型从已标注的资料中抽取出文书生成需要的信息。可选的,于步骤一中,还包括:对抽取出的内容进行相似性分析,剔除相似度低的内容信息。可选的,所述将得到的初步的知识表示中节点进行去聚合重组的步骤进一步包括:选取一篇文档作为基准文档,依次选取该基准文档的初始知识表示结构末级节点中的每一个节点;遍历其他文档的初始知识表示结构的末级节点,比较两节点对应句子的语义相似度;根据比较结果对两节点进行去聚合重组。可选的,所述根据比较结果对两节点进行去聚合重组的步骤为:若比较结果为两节点对应句子语义相关联,则按照句法规则在所述基准文档的知识表示结构中将原节点与对比的其他文档节点进行合并;若比较结果为两节点对应句子的语义相同,则对其他文档中的该相同语义的节点进行删除;若比较结果为两节点对应句子语义无关,则将其他文档中该节点所对应的各上级节点,在所述基准文档的知识表示结构中增加。可选的,所述句法规则为根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理。可选的,所述根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理步骤具体包括:若两节点对应句子的谓词相同,则进一步判断两个句子的主语是否一致;若两个句子的主语一致,则合并为一个句子,若两个句子的主语不一致而其他部分完全相同,则将两个句子合并为具有复合成分的句子。可选的,所述根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理步骤具体包括:可选地,所述根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理步骤具体包括:若两节点对应的谓词不相同,进一步判断两个句子的主语是否相同;如果两个句子的主语相同,则省略其他文档节点对应的句子的主语进行合并。可选地,若两个句子的主语相同,进一步判断两个句子的状语是否相同;若两个句子的状语也相同,则省略其他文档节点对应的句子的状语进行合并。可选的,当两节点对应的谓词不相同时,若两个句子中,所述基准文档节点对应的句子的施事与其他文档节点对应的句子的修饰性成分相同,则把其他文档节点对应的句子的相应成分换成指代成分的词。本专利技术还提供一种文书生成装置,包括:信息抽取单元,用于对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;知识表示单元,用于对所述内容信息进行知识表示;文书生成单元,用于基于所述内容信息的知识表示,自动生成文书。可选的,所述知识表示单元进一步包括:知识表示结构确定单元,用于对所述内容信息确定知识表示结构;分析单元,用于通过对所述知识表示结构中各节点对应的具体内容进行语法和成分分析,填充所述知识表示结构中各节点,得到初步知识表示结构;去聚合重组单元,用于将得到的初步知识表示结构中的各节点进行去聚合重组,得到所述内容信息的知识表示。可选的,所述去聚合重组单元包括:节点选取单元,用于选取一篇文档作为基准文档,依次选取该基准文档初始知识表示结构中最末级节点中的每一个节点;遍历比较单元,用于遍历其他文档初始知识表示末级节点,比较两节点对应句子的语义相似度;比较结果处理单元,用于根据比较结果进行去聚合重组处理。本专利技术还提供一种存储介质,其中存储有多条指令,所述指令由处理器加载,执行上述所述方法的步骤。本专利技术还提供一种电子设备,所述电子设备包括;存储介质,存储有多条指令,所述指令由处理器加载,执行上述所述方法的步骤;以及处理器,用于执行所述存储介质中的指令。本专利技术一种文书生成方法、装置、存储介质和电子设备通过从待生成文本相关资料中抽取文书生成需要的内容信息,并对该内容信息进行知识表示,自动生成文书,实现了针对内容结构均不固定的文书的自动生成的目的,解决了现有技术只能采用人工方法来生成内容结构不固定文书所带来的耗时耗力、效率低下等问题。附图说明图1为本专利技术一种文书生成方法的一个实施例的步骤流程图;图2为本专利技术具体实施例中步骤102的细部流程图;图3为本专利技术具体实施例中每篇文档(即每个抽取的内容信息)的知识表示结构图;图4为本专利技术具体实施例中步骤S3的细部流程图;图5为本专利技术一种文书生成装置的一个实施例的结构示意图;图6为本专利技术具体实施例中知识表示单元的细部结构图;图7为本专利技术用于文书生成方法的电子设备的结构示意图。具体实施方式为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对照附图说明本专利技术的具体实施方式。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。为使图面简洁,各图中只示意性地表示出了与本专利技术相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。在本专利技术的一个实施例中,如图1所示,本专利技术一种文书生成方法,包括如下步骤:步骤1本文档来自技高网...
一种文书生成方法、装置、存储介质和电子设备

【技术保护点】
一种文书生成方法,包括:步骤一,对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;步骤二,对所述内容信息进行知识表示;步骤三,基于所述内容信息的知识表示,自动生成文书。

【技术特征摘要】
1.一种文书生成方法,包括:步骤一,对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;步骤二,对所述内容信息进行知识表示;步骤三,基于所述内容信息的知识表示,自动生成文书。2.如权利要求1所述的一种文书生成方法,其特征在于,步骤二进一步包括:对所述内容信息确定知识表示结构;通过对所述知识表示结构中各节点对应的具体内容进行语法和成分分析,填充所述知识表示结构中各节点,得到初步知识表示结构;将得到的初步知识表示结构中的各节点进行去聚合重组,得到所述内容信息的知识表示。3.如权利要求1所述的一种文书生成方法,其特征在于,步骤一进一步包括:对所述待生成文书相关资料中每个标注单元进行标注;根据待生成文书类型从已标注的资料中抽取出文书生成需要的信息。4.如权利要求3所述的一种文书生成方法,其特征在于,于步骤一中,还包括:对抽取出的内容进行相似性分析,剔除相似度低的内容信息。5.如权利要求2所述的一种文书生成方法,其特征在于,所述将得到的初步的知识表示中节点进行去聚合重组的步骤进一步包括:选取一篇文档作为基准文档,依次选取该基准文档的初始知识表示结构末级节点中的每一个节点;遍历其他文档的初始知识表示结构的末级节点,比较两节点对应句子的语义相似度;根据比较结果对两节点进行去聚合重组。6.如权利要求5所述的一种文书生成方法,其特征在于,所述根据比较结果进行去聚合重组的步骤为:若比较结果为两节点对应句子语义相关联,则按照句法规则在所述基准文档的知识表示结构中将原节点与对比的其他文档节点进行合并;若比较结果为两节点对应句子的语义相同,则对其他文档中的该相同语义的节点进行删除;若比较结果为两节点对应句子语义无关,则将其他文档中该节点所对应的各上级节点,在所述基准文档的知识表示结构中增加。7.如权利要求6所述的一种文书生成方法,其特征在于:所述句法规则为根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理。8.如权利要求7所述的一种文书生成方法,其特征在于,所述根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理步骤具体包括:若两节点对应句子的谓词相同,则进一步判断两个句子的主语是否一致;如果两个句子的主语一致,则合并为一个句子;如果两个句子的主语不一致而其他部分完全相同...

【专利技术属性】
技术研发人员:师玉娇李宝善
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1