【技术实现步骤摘要】
一种基于语义的立法冲突检测方法及系统
[0001]本专利技术涉及法规间立法冲突审查
,更具体的说是涉及一种基于语义的立法冲突检测方法及系统。
技术介绍
[0002]BERT(Bidirectional Encoder Representations from Transformers)是一种无监督的模型,其本质上是一个自编码模型;它的结构和transformer的Encode部分相同;与传统的预训练模型相比,BERT的一大创新点在于它能同时看到每个词的前后信息,极大增强了模型的表达能力。BERT在预训练阶段主要有两大任务:一个是Mask Language Model(简称:MLM),还有一个是Next Sentence Prediction(简称:NSP);MLM可以理解为完形填空,针对每个句子15%的词MASK掉,然后用其上下文来预测;NSP会选择一些句子对A与B,其中50%的数据B是A的下一条句子,剩余50%的数据B是语料库中随机选择的,学习其中的相关性,以增加模型对句子对特征的学习、泛化能力。
[0003 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义的立法冲突检测方法,其特征在于,包括以下步骤:收集不同来源的法规信息,并对法规行文结构进行拆解,获取各类来源法规的结构化信息;利用法条条旨生成算法和法条要素提取算法对法规中的法条内容进行结构化信息智能提取,获得法条条旨和法条要素;基于法规的结构化信息以及法条条旨、法条要素,构建法规知识图谱;审查新编法规与上位法是否存在冲突,获取冲突性审查结果。2.根据权利要求1所述的一种基于语义的立法冲突检测方法,其特征在于,法规信息包括:宪法、民法、刑法、公开的地方性法规、涉密不公开的法规。3.根据权利要求1所述的一种基于语义的立法冲突检测方法,其特征在于,对法规行文结构进行拆解,具体包括以下步骤:从法规内容中拆解出包括法规名称、正文、发布日期、效力级别在内的结构化信息,通过效力级别定义法规间的上下位法关系;将法条内容拆解成编、章、节、条、款、项、目的层级结构。4.根据权利要求1所述的一种基于语义的立法冲突检测方法,其特征在于,法条条旨利用mT5模型获得。5.根据权利要求1所述的一种基于语义的立法冲突检测方法,其特征在于,法条要素包括:假设、主体、强制权利、任意权利、可为义务、不可为义务、对象以及后果责任。6.根据权利要求1所述的一种基于语义的立法冲突检测方法,其特征在于,法条要素的获取采用BERT+BILSTM+CRF的方式,具体包括以下步骤:对输入文本进行字符化处理,将句子处理成单一的字符排列,获得字符信息;将处理好的字符信息送入BERT进行特征处理,获取输入文本信息中的字向量,记为序列X=(x1,x2,
…
,x
n
);将获取的n维向量经过BILSTM作为各个时间步的输入,得到BILSTM层的隐状态序列,其中,隐状态序列包括前向和后向待前向与后向全部处理完后,对各个隐状态序列按照位置拼接得到完整的隐状态序列,记为h
t
=(h1,h2,
…
,h
n
)∈R
(n*m)
;通过线性输出层将完整的隐状态序列映射到s维,将提取的句子特征即全部映射...
【专利技术属性】
技术研发人员:张玉环,许芸鹭,赵海涛,张民全,范军涛,
申请(专利权)人:中国人民解放军军事科学院军事法制研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。