【技术实现步骤摘要】
一种可复用的法条推荐框架
本专利技术涉及一种法条推荐框架,具体涉及一种可复用的法条推荐框架,属于自然语言处理领域。
技术介绍
近年来,人民法院信息化建设迈出了跨越式步伐,现代科技与法院工作愈发深度融合,信息时代审判运行新模式正在逐步形成。审判结果预测作为人工智能在法院信息化建设过程中的一个成功应用,吸引了众多研究学者的关注,其目标在于自动、高效且准确地预测案件的指控罪名、案件引用的法律法条等一系列审判结果。在案件的裁决过程中,法官通常需要完寻找合适的法律法条作为审判依据。在这一过程中,一方面,鉴于法条总数之多,针对每一个案件寻找几条甚至是确切的某一条法条是一项庞大且困难的工作;另一方面,每天发生的案件数量之多也使得为数不多的法官分身乏力,面对频繁发生的案件类型,重复相似的过程以寻找合适法律条文是很容易让人感到疲乏的;相反,如果案件情况很复杂,就需要消耗大量的时间和精力去分析案件过程以寻得合适的法条。而对于那些牵扯案件或面对法律问题却缺乏相关法律专业知识的普通群众而言,他们则需要寻找专业的法律顾问来解决问题,这一过程需 ...
【技术保护点】
1.一种可复用的法条推荐框架,其特征在于包含以下步骤:/n步骤(1)从中国裁判文书网中随机提取裁判文书集,构建训练语料;/n步骤(2)裁判文书预处理;/n步骤(3)用户输入预处理;/n步骤(4)法条集预排序;/n步骤(5)提取推荐法条集;/n步骤(6)输出推荐法条列表。/n
【技术特征摘要】
1.一种可复用的法条推荐框架,其特征在于包含以下步骤:
步骤(1)从中国裁判文书网中随机提取裁判文书集,构建训练语料;
步骤(2)裁判文书预处理;
步骤(3)用户输入预处理;
步骤(4)法条集预排序;
步骤(5)提取推荐法条集;
步骤(6)输出推荐法条列表。
2.根据权利要求1所述的一种可复用的法条推荐框架,其特征在于步骤(1)中从中国裁判文书网中随机提取裁判文书集,构建训练语料。
3.根据权利要求1所述的一种可复用的法条推荐框架,其特征在于步骤(2)中裁判文书预处理,具体子步骤包括:
步骤(2.1)使用正则表达式从裁判文书中抽取出案件基本情况段落和引用法条列表;
步骤(2.2)将案件基本情况段落进行中文分词,转化成由词汇组成的列表,同时得到语料库包含的所有词汇的集合;
步骤(2.3)去停用词。首先构建法律专有停用词列表,其内容包括:连词、介词一类的常用停止词;时间、地点、人名一类的专有名词;频繁出现在裁判文书中但对区别具体案件没有实际作用的法律专有词汇。接着去除整个数据集中的所有停用词;
步骤(2.4)学习案件基本情况的词向量表示模型。基于以上步骤获取的语料词汇集合,利用Word2vec模型训练得到案件基本情况的词向量表示模型;
步骤(2.5)构建法条推荐任务的输出空间。将训练语料中每一篇裁判文书引用的法条合并起来,从中挑选频次相对较高的法条构成该任务的输出空间;
步骤(2.6)学习法条的语义向量模型。学习一个关于案件基本情况的语言模型,以一篇案件基本情况中的上下文词汇及其所引用的法条为输入,预测对应的中心词汇。通过不断优化该模型的预测效果,同时学习得到了法条的语义向量模型。
4.根据权利要求1所述的一种可复用的法条推荐框架,其特征在于步骤(3)中对用户输入的案件基本情况进行预处理,具体子步骤包括:
步骤(3.1)中文分词;
步骤(3.2)去除法律专有停用词;
步骤(3.3)将案件基本情况转化为固定大小的词向量表示。
5.根据权利要求1所述的一种可复用的法条推荐框架,其特征在于步骤(4)中将案件基本情况...
【专利技术属性】
技术研发人员:李传艺,葛季栋,冯奕,黄云云,周晓松,周筱羽,骆斌,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。