【技术实现步骤摘要】
一种基于网络表示学习的相似案例推荐方法
本专利技术属于网络表示学习领域,涉及一种基于网络表示学习的相似案例推荐方法。
技术介绍
随着我国司法制度的日趋完善,以及中国裁判文书网等法律文书公示网的建立,大量的法律文书涌现在互联网上。类案发现是根据用户当前查看的文书,给出当前文书的相似文书。从以往的案例中找到相似的案例可以确保相似的情况得到相似的判断结果。类案发现也是司法大数据和智慧司法的典型应用模块,是我国依法治国的极大助力。类案发现在法律文件的司法实践中非常重要。对于法官,这是为了确保相同情况得到类似处理以确保公正,对于律师来说,可以借助于先前的案例更好地为当事人辩护。但是,衡量文书之间的相似性是一项重大挑战,需要解决当前文书描述与先前文书描述之间的相关性问题。事实上,法律文书通常很长而且结构复杂,此外,单个法律文书可能包括许多不同的法律问题。这些复杂性给衡量文书之间的相似性带来很大挑战。因此,两个法律文书之间的相似性测量过程的自动化具有重要的意义。网络结构数据可以自然地表达物体和物体间的联系,在我们的日常生活与工作中 ...
【技术保护点】
1.一种基于网络表示学习的相似案例推荐方法,其特征在于,该方法包括如下步骤:/n1)从网络中爬取海量法律文书和法律实体;/n2)利用正则表达式对法律文书进行初步处理,选择有价值的段落,将段落中的实体链接到构建的法律实体集合中;/n具体为利用字符串匹配技术,通过匹配法律实体名在法律文书中是否出现过,链接法律文书中的法律实体到法律实体库中;/n3)利用bert预训练模型,计算法律实体与法律实体之间的相似度,将满足阈值的法律实体之间构建相似法律实体关系;/n4)将构建完成的法律实体与法律文书网络和法律实体与法律实体之间的相似网络输入到LINE网络表示学习模型中,利用skip-gr ...
【技术特征摘要】
1.一种基于网络表示学习的相似案例推荐方法,其特征在于,该方法包括如下步骤:
1)从网络中爬取海量法律文书和法律实体;
2)利用正则表达式对法律文书进行初步处理,选择有价值的段落,将段落中的实体链接到构建的法律实体集合中;
具体为利用字符串匹配技术,通过匹配法律实体名在法律文书中是否出现过,链接法律文书中的法律实体到法律实体库中;
3)利用bert预训练模型,计算法律实体与法律实体之间的相似度,将满足阈值的法律实体之间构建相似法律实体关系;
4)将构建完成的法律实体与法律文书网络和法律实体与法律实体之间的相似网络输入到LINE网络表示学习模型中,利用skip-gram的损失函数计算得到法律文书和法律实体的向量表;
具体为对于法律文书和法律实体之间的网络,利用网络表示学习模型LINE,并将法律文书作为中心点,法律实体作为邻居结点,利用skip-gram的损失函数进行训练,对于法律文书和法律文书之间的网络,同样利用LINE模型进行训练,但是损失函数采用一阶损失函数进行训练,对于两个网络进行联合训练,最终得到法律文书的向量表示;
5)计算法律文书之间的余弦相...
【专利技术属性】
技术研发人员:黄焱晖,毕胜,漆桂林,陈佳敏,
申请(专利权)人:东南大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。