The invention discloses a document generation method, device, storage medium and electronic device, the method includes: extracting information related information to generate documents, obtain the documents needed to generate content information; knowledge of the content information; said the content information based on knowledge of the automatic generation of documents. The invention can solve the problem that the existing technology can only use artificial methods to generate the time consuming and low efficiency and low efficiency caused by the unfixed contents of the content structure.
【技术实现步骤摘要】
一种文书生成方法、装置、存储介质和电子设备
本专利技术涉及文书生成领域,尤其涉及一种文书生成方法、装置、存储介质和电子设备。
技术介绍
自然语言生成(NaturalLanguageGeneration,NLG)技术是人工智能(ArtificialIntelligence,AI)中非常活跃的一个领域,其在各行各业均有着广泛的应用,如军事文书的生成、司法文书的生成等。以司法应用为例,在司法办案过程中,所需文书众多,其文书的处理工作是司法办案过程中的一项重要部分,处理的效率直接影响着办案效率的高低。现有的司法文书生成主要采用以下两种方法:1、基于人工的文书生成:由文书涉及领域的相关工作人员,基于专业知识、经验和待生成文书相关资料,人工生成需要的文书。2、基于模板技术的文书生成:首先预先按照可能出现的几种情况事先构造数个相应的模板,每个模板包含一些常量和一些变量。当用户输入一定的信息后,文本生成器将这些信息作为字符串嵌入到模板中替代变量,生成文本。然而,上述现有方案缺存在如下不足:基于人工的文书生成方法耗时耗力,影响整个办案效率,且在当今案件日渐增多的现状下,文书生成无疑给司法工作人员带来了很重的工作负担;基于模板技术的文书生成方法,与纯人工方法相比,虽在一定程度上减少了司法人员工作量,但其只能解决有固定结构部分的文书生成,通用性较差。
技术实现思路
为克服上述现有技术存在的不足,本专利技术之目的在于提供一种文书生成方法、装置、存储介质和电子设备,以解决现有技术只能采用人工方法来生成内容结构不固定文书所带来的耗时耗力、效率低下等问题。为达上述目的,本专利技术提供的技术 ...
【技术保护点】
一种文书生成方法,包括:步骤一,对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;步骤二,对所述内容信息进行知识表示;步骤三,基于所述内容信息的知识表示,自动生成文书。
【技术特征摘要】
1.一种文书生成方法,包括:步骤一,对待生成文书的相关资料进行信息抽取,获取文书生成需要的内容信息;步骤二,对所述内容信息进行知识表示;步骤三,基于所述内容信息的知识表示,自动生成文书。2.如权利要求1所述的一种文书生成方法,其特征在于,步骤二进一步包括:对所述内容信息确定知识表示结构;通过对所述知识表示结构中各节点对应的具体内容进行语法和成分分析,填充所述知识表示结构中各节点,得到初步知识表示结构;将得到的初步知识表示结构中的各节点进行去聚合重组,得到所述内容信息的知识表示。3.如权利要求1所述的一种文书生成方法,其特征在于,步骤一进一步包括:对所述待生成文书相关资料中每个标注单元进行标注;根据待生成文书类型从已标注的资料中抽取出文书生成需要的信息。4.如权利要求3所述的一种文书生成方法,其特征在于,于步骤一中,还包括:对抽取出的内容进行相似性分析,剔除相似度低的内容信息。5.如权利要求2所述的一种文书生成方法,其特征在于,所述将得到的初步的知识表示中节点进行去聚合重组的步骤进一步包括:选取一篇文档作为基准文档,依次选取该基准文档的初始知识表示结构末级节点中的每一个节点;遍历其他文档的初始知识表示结构的末级节点,比较两节点对应句子的语义相似度;根据比较结果对两节点进行去聚合重组。6.如权利要求5所述的一种文书生成方法,其特征在于,所述根据比较结果进行去聚合重组的步骤为:若比较结果为两节点对应句子语义相关联,则按照句法规则在所述基准文档的知识表示结构中将原节点与对比的其他文档节点进行合并;若比较结果为两节点对应句子的语义相同,则对其他文档中的该相同语义的节点进行删除;若比较结果为两节点对应句子语义无关,则将其他文档中该节点所对应的各上级节点,在所述基准文档的知识表示结构中增加。7.如权利要求6所述的一种文书生成方法,其特征在于:所述句法规则为根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理。8.如权利要求7所述的一种文书生成方法,其特征在于,所述根据两节点对应的句子的谓词是否相同对两节点进行相应的合并处理步骤具体包括:若两节点对应句子的谓词相同,则进一步判断两个句子的主语是否一致;如果两个句子的主语一致,则合并为一个句子;如果两个句子的主语不一致而其他部分完全相同...
【专利技术属性】
技术研发人员:师玉娇,李宝善,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。