【技术实现步骤摘要】
本专利技术涉及文本处理,尤其涉及一种基于小样本学习的法律文书粗细粒度结构化方法和装置。
技术介绍
1、法律文书内容通常较长,尤其在涉及复杂案情的案件中,法官面临着从相似案例中快速提取关键信息点、梳理司法逻辑的巨大挑战。这项工作耗时且繁重,给法官的审判工作增加了压力。法律文书的格式虽然比较固定,但是不同时间不同地区的法律文书依然存在许多不同,对于法律文书中的原告诉求、原告证据、被告答辩、被告诉求、被告证据、法院认定、争议焦点等信息仍然以大段文本的方式进行组织,以自然段落的方式包含在法律文书中。如果想针对其中的重要信息进行抽取和分析,就需要熟练的人员对法律文书的进行结构化分块。熟练的相关标注人员一天能进行结构化分块的法律文书数量大概也就在500条左右,并且,目前有的一些机器学习的方法,多数时候还是需要进行大量的人工标注以及大量的正则化方法,也需要前期投入非常巨大的人力进行标注。
2、在法律领域,数据标注需要人工进行,而且标注质量对模型效果有很大影响。小样本学习可以通过利用少量样本进行模型训练,从而减少数据标注的数量和成本。在小样
...【技术保护点】
1.一种基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,包括:
2.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述根据法律文书文本特征,构建法律文书标注触发词库,利用信息抽取方法,提取法律文书中的人名,确定原告和被告名称,包括:
3.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述将法律文书集合按照段落进行分割,对字符大于设定阈值的段落进行摘要,包括:
4.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述根据预先确定的标注粒度,
...【技术特征摘要】
1.一种基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,包括:
2.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述根据法律文书文本特征,构建法律文书标注触发词库,利用信息抽取方法,提取法律文书中的人名,确定原告和被告名称,包括:
3.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述将法律文书集合按照段落进行分割,对字符大于设定阈值的段落进行摘要,包括:
4.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述根据预先确定的标注粒度,利用标注触发词库对少于设定数量的分割后的法律文书样本进行人工标注,包括:
5.根据权利要求1所述的基于小样本学习的法律文书粗细粒度结构化方法,其特征在于,所述将标注的少于设定数量的法律文书作为预训练神经网络模型的输入,生成经过归...
【专利技术属性】
技术研发人员:李昆,杨兰,孙锐,司成良,周兴发,刘峻枫,展华益,
申请(专利权)人:四川启睿克科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。