【技术实现步骤摘要】
本专利技术涉及摘要自动生成技术,特别是一种裁判文书摘要生成方法及系统、存储介质。
技术介绍
1、目前主流的文本摘要自动生成有三种方式,一种是抽取式(extractive),一种是生成式(abstractive),还有结合了前两种的混合式。抽取式摘要是按照一定权重,从原文中寻找跟中心思想最接近的一条或几条句子。抽取式摘要目前已经相对成熟,但抽取质量及内容流畅度均差强人意。生成式摘要是基于nlg技术,根据源文档内容,由算法模型自己生成自然语言描述,而非提取原文的句子,使用深度学习技术像人类一样解释和缩短原始文档。由于抽象机器学习算法可以生成代表源文本中最重要信息的新短语和句子,因此它们可以帮助克服基于抽取技术得到的摘要句内冗余高的问题。而混合式则结合了抽取和生成,先通过抽取的方式得到重要的候选句子,再对所有候选句子进行抽象摘要生成,混合式通过在抽象生成前以抽取技术对输入进行筛选,更好地适应了目前抽象生成模型对输入长度的限制,使得抽象生成模型在有限的文本内对更多重要的信息进行摘要概括。
2、然而将混合式抽象技术用于指导案例生成会存
...【技术保护点】
1.一种裁判文书摘要生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的裁判文书摘要生成方法,其特征在于,步骤S1中,对所述裁判文书进行分句处理时,添加以下规则:
3.根据权利要求1所述的裁判文书摘要生成方法,其特征在于,所述法律结构角色类型包括:事实、下级法院的裁决、论点、法规、先例、判决理由和本院裁决。
4.根据权利要求1所述的裁判文书摘要生成方法,其特征在于,所述法律结构解析模型包括依次连接的BERT模型、BiLSTM模型和CRF模型;所述BERT模型的输入为预处理后的裁判文书数据的句子序列。
5.根据权
...【技术特征摘要】
1.一种裁判文书摘要生成方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的裁判文书摘要生成方法,其特征在于,步骤s1中,对所述裁判文书进行分句处理时,添加以下规则:
3.根据权利要求1所述的裁判文书摘要生成方法,其特征在于,所述法律结构角色类型包括:事实、下级法院的裁决、论点、法规、先例、判决理由和本院裁决。
4.根据权利要求1所述的裁判文书摘要生成方法,其特征在于,所述法律结构解析模型包括依次连接的bert模型、bilstm模型和crf模型;所述bert模型的输入为...
【专利技术属性】
技术研发人员:李玮,谢芳,蒋璋玥,董翔云,肖正,王中,
申请(专利权)人:湖南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。