【技术实现步骤摘要】
一种融合法条关键词的法条推荐方法
[0001]本专利技术涉及一种融合法条关键词的法条推荐方法。
技术介绍
[0002]传统的司法审判工作,案例审判主要基于法官、律师、检察官等法律相关的人士的专业审查和辩论的结果。一方面,随着人们法律意识的提高,案件数量的井喷式增长,然而法官数量不增反减,导致法院工作量急剧增加;另一方面,有些案件错综复杂,对法官、律师的自身素养要求极高。在案件审判的过程中,法官需要仔细阅读大量的法律法规,然后结合对案件事实的考量,来确保判决的公平正义。这一过程通常需要耗费大量的时间和精力,其次,对于同一类型的案件,不同法官往往会有不一样的裁判尺度,可能导致出现误判、漏判情况的出现。
技术实现思路
[0003]专利技术目的:本专利技术所要解决的技术问题是针对现有技术的不足,本专利技术的目的是为了实现一种融合法条关键词的法条推荐方法,通过对案件事实的描述编码,自动检索以往案例,搜索相似案例,再进行接下来的处理,从而给出该案件事实涉及的相关法条,其达到的效果可以准确预测相关法条。
[0004 ...
【技术保护点】
【技术特征摘要】
1.一种融合法条关键词的法条推荐方法,其特征在于,包括如下步骤:步骤1,构建一个法条关键词表;步骤2,构建成一个以往案例查找库,将词嵌入后的案件事实描述保存在一个字典中,用于相似案例查找,字典的键key是一个案件事实描述向量,值value为相关法条;步骤3:对用户输入的案件事实描述进行处理,根据处理后的案件事实描述从以往案例查找库中查找相似案例,将相似案例的法条根据规则进行排序,选取前k个相似案例的法条作为备选法条集,根据法条关键词表抽取出这k个法条的关键词;步骤4,根据用户输入的案件事实描述,通过步骤3抽取出法条关键词,将处理后的案件事实描述和抽取出的法条关键词进行联合编码后,输入到一个全连接层做法条分类,全连接层的输出即为该案件事实描述所涉及的相关法条。2.根据权利要求1所述的方法,其特征在于,步骤1包括:通过TF
‑
IDF方法抽取出每个法条所包含的关键词。3.根据权利要求2所述的方法,其特征在于,步骤1中,采用如下公式抽取出每个法条所包含的关键词:包含的关键词:TF
i,j
‑
IDF
i
=TF
i,j
·
IDF
i
其中,n
i,j
表示关键词t
i
在法条d
j
中出现的次数,n
k,j
表示关键词t
k
在法条d
j
中出现的次数,k是一个设定的的参数,表示一个法条关键词的个数;TF
i,j
表示关键词t
i
在法条d
j
中出现的频率,IDF
i
表示关键词t
i
在所有法条中的逆向文件频率,
·
表示乘法操作,|D|表示所有法条的数量,|j:t
i
∈d
j
|表示包含关键词t
i
的法条数量。4.根据权利要求3所述的方法,其特征在于,步骤2包括:将数据集中的案件事实描述全部向量化表示,即对每条数据中的案件事实描述T进行向量化编码。5.根据权利要求4所述的方法,其特征在于,步骤2具体包括以下步骤:步骤2
‑
1:首先将案件事实描述T进行分词、去除停用词操作,在经过分词去除停用词后由一系列单词w1,w2,...,w
s
组成,w
s
表示第s个单词,即T={w1,w2,w3,...,w
s
},将每个单词转化为词向量的形式x
i
:x
i
=E(w
i
)其中,E∈R
|V|
×
d
为词嵌入矩阵,其中R为实数,|V|是词表的大小,d是词向量的维度;步骤2
‑
2:对每条数据的所有词向量集合采用向量求和的方法得到案件事实描述的向量表示W
i
,步骤2
‑
3:将案件事实描述的向量表示W
i
保存在一个字典中,字典的键key、值value分别为案件事实描述的向量表示W
i
以及该案件对应的法条L,从而得到以往案例查找库M。6.根据权利要求5所述的方法,其特征在于,步骤3包括:对输入的案件事实描述T
in
执行步骤2操作,通过步骤2
‑
1~步骤2
‑
2处理后获得模型输入的案件事实描述的向量化表示I
in
,通过I
in
与以往案例查找库M中的案件事实向量化表示I
t
进行欧几里得距离计算,从而比较相似度:
其中,d(x,y
i
)表示向量x与y
i
之间的距离,sim(x,y
i
)表示向量x与y
i
之间的相似度,x是模型输入的案件事实描述向量化表示I
in
,y
i
是以往案例查找库M中的案件事实向量化表示I
t
;通过计算输入的案件事实描述与以往案例查找库M的案件事实描述的欧几里得距离,从小到大排序,从而获得相似度最高的k个案例,根据以往案例查找库M将前k个案例的法条抽取出来作为备选法条集;根据步骤1建立的法条关键词表,抽取出备选法条集中的法条关键词Z。7.根据权利要求6所述的方法,其特征在于,步骤4包括:将模型输入的案件事实描述和步骤3获得的法条关键词分别编码后,再进行融合,将融合后的特征输入到一个全连接层,全连接层的输出即为所推荐的法条,具体包括以下步骤:步骤4
‑
1:将模型输入的案件事实描述通过步骤2
‑
1操作后获得文本中每个词的词向量J,再对词向量J分别使用Attention注意力机制与BiLSTM双向长短时序记忆获取词级关键信息以及词级全局结构信息;使用Attention机制捕获词级关键模式信息I1公式如下:公式如下:其中,u是训练的注意力参数,u
T
是u的转置,a
i
表示加权后的每个词向量,s为处理后的案件事实描述所包含的词的个数;使用BiLSTM作用在词向量上,来捕获案件事实描述词级的全局结构信息I2:::其中,词级全局结构信息I2是由前向LSTM的最终状态和反向LSTM的最终状态拼接而成,x
s
表示第s个单词的词向量;...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。