【技术实现步骤摘要】
一种基于mT5的条旨生成方法
[0001]本专利技术涉及法条条旨生成
,更具体的说是涉及一种基于mT5的条旨生成方法。
技术介绍
[0002]条旨,即法律法规条文的要旨,具有理解、查阅法条的便利功能和立法指引的作用。在立法工作中,是立法关注的工具和方法。法条条旨从立法的角度来看,要求不重复,不交叉,不含糊,不冗余。
[0003]其目前主要通过以下两种方法生成:一是抽取式文本生成,二是生成式文本生成。抽取式文本生成,顾名思义是从已有的文本中抽取一些文本予以生成,虽然其能够解决一些文本生成任务,但存在以下缺点:(1)所有生成的文本都存在于原文本中,没有归纳总结的部分;(2)所生成的文本通顺度不高,易于出现模棱两可的情形。生成式文本生成,顾名思义是根据已有文本通过模型自身的归纳总结产生新的文本,其效果优于抽取式文本生成,但是仍存在以下缺点:(1)通常对于所处理的文本长度有所限制,在短文本中效果好;(2)通常都是对文本进行字符化处理,但是中文更多是词语表达含义,不能够很好将中文词语信息予以保留,效果欠佳。因此,如何精准 ...
【技术保护点】
【技术特征摘要】
1.一种基于mT5的条旨生成方法,其特征在于,具体步骤为:信息收集:获取法律法规的内容;行文结构拆解:对法律法规进行结构化解析;条旨生成:利用mT5条旨提取模型对解析后的法律法规进行条旨生成。2.根据权利要求1所述的一种基于mT5的条旨生成方法,其特征在于,行文结构拆解包括整体内容拆解和条文拆解。3.根据权利要求2所述的一种基于mT5的条旨生成方法,其特征在于,整体内容拆解为名称、正文、发布日期、效力级别的提取。4.根据权利要求2所述的一种基于mT5的条旨生成方法,其特征在于,条文拆解是将法条内容拆解成编、章、节、条、款、项、目的层次结构。5.根据权利要求1所述的一种基于mT5的条旨生成方法,其特征在于,条旨生成的步骤为:对输入的法条进行文本token编码;将文本token编码、position编码以及segmentation编码进行结合,再送入mT5的编码器,生成编码文件;将编码文件送入mT5的解码器,输出条旨。6.根据权利要求5所述的一种基于mT5的...
【专利技术属性】
技术研发人员:范军涛,许芸鹭,赵海涛,张玉环,
申请(专利权)人:中国人民解放军军事科学院军事法制研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。