【技术实现步骤摘要】
一种基于知识图谱和文本分类模型的法律条文推荐方法
本专利技术公开了一种基于知识图谱和文本分类模型的法律条文推荐方法,涉及知识图谱和NLP
技术介绍
随着人工智能在各个行业的广泛应用,人工智能结合法律成了一个热门的研究方向。其中比较常见的应用就是法律条文推荐,不仅能够辅助法官进行信息处理,还能为广大群众进行普法,具有明显应用价值。现有技术中存在一些推荐方法:1.基于FastText算法的智能法条推荐方法:通过FastText算法针对诈骗罪、抢劫、经济犯罪或离婚纠纷案件类的判决文书(案情描述),将法条作为分类标签,进行多标签文本分类识别,对案件事实进行分析,提供适用的法条推送。2.基于倒排索引与Seq2Seq模型的法律法规推荐:构建法律法规的全文倒排索引,然后通过seq2seq神经网络模型输出检索文本对应的关键词序列,通过关键词序列在索引库中进行查询对应的法条信息。现有技术中,方法一用法条作为分类标签,当罪名涉及多个法条的时候,会导致相同样例对应的法条标签增加,增加了模型训练的复杂度。方 ...
【技术保护点】
1.一种基于知识图谱和文本分类模型的法律条文推荐方法,其特征在于,所述方法包括如下步骤:/n步骤一、法律知识图谱构建;/n步骤二、训练文本数据预处理;/n步骤三、多分类标签模型训练;/n步骤四、法律罪名要素识别;/n步骤五、法律条文推荐,根据罪名分类在法律知识图谱中快速找到对应的法律罪名实体和对应的法律条文实体。/n
【技术特征摘要】 【专利技术属性】
1.一种基于知识图谱和文本分类模型的法律条文推荐方法,其特征在于,所述方法包括如下步骤:
步骤一、法律知识图谱构建;
步骤二、训练文本数据预处理;
步骤三、多分类标签模型训练;
步骤四、法律罪名要素识别;
步骤五、法律条文推荐,根据罪名分类在法律知识图谱中快速找到对应的法律罪名实体和对应的法律条文实体。
2.如权利要求1所述的一种基于知识图谱和文本分类模型的法律条文推荐方法,其特征在于,所述法律知识图谱构建,包括:
101、从法律网站采集所有法律罪名信息和法律条文信息;
102、根据本体定义,将罪名和法条处理成实体和关系;
103、将数据入图库,构建法律知识图谱。
3.如权利要求1所述的一种基于知识图谱和文本分类模型的法律条文推荐方法,其特征在于,所述训练文本数据预处理,包括:
201、数据集构建:选择训练文本,对文本数据进行打标,标签为训练文本数据对应的罪名信息,然后将训练文本数据进行shape转换,shape维度是m∗2;
202、数据清洗分词:对shape中的content数据进行清洗,同时进行中文分词;
203、样本数值化:对shape中的content内容进行id化,提取所有分词,形成vocab,然后将中文替换成id,同时获取最大文本分词数量max_length,将content分词转换成维度是1∗max_length的矩阵,对于长度小于max_length的进行zeropadding,用0进行补位,最终输出input_x矩阵,表示所有的文本信息;
204、标签数值化:对shape中的label进行数值化,将标签类型表示为one-hot向量编码,生成input_y矩阵,表示input_x对应的标签信息,同时保存好标签转换器,存为label.pickle,供模型预测使用;
205、文本词向量转换:通过bert中文向量模型,将vocab对应的分词转换为词向量,生成embedding_matrix。
技术研发人员:穆宁,陶辉,陈洲,阮祥超,朱丹,
申请(专利权)人:南京烽火星空通信发展有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。