一种基于mT5的条旨生成方法技术

技术编号:37300200 阅读:24 留言:0更新日期:2023-04-21 22:46
本发明专利技术公开了一种基于mT5的条旨生成方法,涉及法条条旨生成技术领域,具体步骤为:获取法律法规的内容;对法律法规进行结构化解析;利用mT5条旨提取模型对解析后的法律法规进行条旨生成,其中,条旨生成的步骤为:对输入的法条进行文本token编码;将文本token编码、position编码以及segmentation编码进行结合,再送入mT5的编码器,生成编码文件;将编码文件送入mT5的解码器,输出条旨。本发明专利技术不仅能够实现法规信息的智能拆解,还能通过精准的中文分词提高条旨生成的准确性。词提高条旨生成的准确性。词提高条旨生成的准确性。

【技术实现步骤摘要】
一种基于mT5的条旨生成方法


[0001]本专利技术涉及法条条旨生成
,更具体的说是涉及一种基于mT5的条旨生成方法。

技术介绍

[0002]条旨,即法律法规条文的要旨,具有理解、查阅法条的便利功能和立法指引的作用。在立法工作中,是立法关注的工具和方法。法条条旨从立法的角度来看,要求不重复,不交叉,不含糊,不冗余。
[0003]其目前主要通过以下两种方法生成:一是抽取式文本生成,二是生成式文本生成。抽取式文本生成,顾名思义是从已有的文本中抽取一些文本予以生成,虽然其能够解决一些文本生成任务,但存在以下缺点:(1)所有生成的文本都存在于原文本中,没有归纳总结的部分;(2)所生成的文本通顺度不高,易于出现模棱两可的情形。生成式文本生成,顾名思义是根据已有文本通过模型自身的归纳总结产生新的文本,其效果优于抽取式文本生成,但是仍存在以下缺点:(1)通常对于所处理的文本长度有所限制,在短文本中效果好;(2)通常都是对文本进行字符化处理,但是中文更多是词语表达含义,不能够很好将中文词语信息予以保留,效果欠佳。因此,如何精准的生成条旨是本领域技本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于mT5的条旨生成方法,其特征在于,具体步骤为:信息收集:获取法律法规的内容;行文结构拆解:对法律法规进行结构化解析;条旨生成:利用mT5条旨提取模型对解析后的法律法规进行条旨生成。2.根据权利要求1所述的一种基于mT5的条旨生成方法,其特征在于,行文结构拆解包括整体内容拆解和条文拆解。3.根据权利要求2所述的一种基于mT5的条旨生成方法,其特征在于,整体内容拆解为名称、正文、发布日期、效力级别的提取。4.根据权利要求2所述的一种基于mT5的条旨生成方法,其特征在于,条文拆解是将法条内容拆解成编、章、节、条、款、项、目的层次结构。5.根据权利要求1所述的一种基于mT5的条旨生成方法,其特征在于,条旨生成的步骤为:对输入的法条进行文本token编码;将文本token编码、position编码以及segmentation编码进行结合,再送入mT5的编码器,生成编码文件;将编码文件送入mT5的解码器,输出条旨。6.根据权利要求5所述的一种基于mT5的...

【专利技术属性】
技术研发人员:范军涛许芸鹭赵海涛张玉环
申请(专利权)人:中国人民解放军军事科学院军事法制研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1