基于bert模型和法条知识的法条推荐处理方法技术

技术编号:24888815 阅读:79 留言:0更新日期:2020-07-14 18:16
本发明专利技术涉及基于bert模型和法条知识的法条推荐处理方法,属于数据处理技术领域。本发明专利技术对司法领域法条知识进行关键词抽取;对案情描述文本和法条知识关键词进行语义表征;基于注意力机制,对案情描述文本语义表征向量和法条知识关键词语义表征向量进行融合,获得融合法条知识关键词的案情描述特征向量;将融合法条知识关键词的案情描述特征向量进行线性变换和softmax,最终实现法条推荐。本发明专利技术将法律条文知识与案件描述进行融合,实现基于知识驱动的智能法条推荐。

【技术实现步骤摘要】
基于bert模型和法条知识的法条推荐处理方法
本专利技术涉及基于bert模型和法条知识的法条推荐处理方法,属于数据处理

技术介绍
以案情描述内容与法律条文关联为基础的法条推荐是根据案件案情的描述内容,结合司法领域法律条款知识,来实现对相关法律条文的选择与推荐。现已有的法条推荐算法大都基于数据驱动的方式,早期的法律判决和条文预测都是基于统计的方法实现,与此同时伴随着机器学习算法的不断深入发展,已有基于文本分类的方式来实现法条推荐,例如使用SVM的方法对判决据结果进行预测,也可用基于SVM的方法进行初步法条分类。近年来,随着深度学习的不断发展,基于深度神经网络的方法在法律判决预测领域得到长足的发展。法条推荐并不是一个简单的基于数据驱动的法条预测过程,它具有较强的司法领域特性,法官在审案过程中,通常是以法律知识为准则对案件进行分析,并选择相应法条知识作为量刑和罪名判定的依据,例如,关于“抢劫”和“抢夺”,“诈骗”和“敲诈勒索”等刑事案件审判过程中,法官在裁定过程中,通常关注如下词汇见表1所示。表1法官审案中法条关注情本文档来自技高网...

【技术保护点】
1.基于bert模型和法条知识的法条推荐处理方法,其特征在于:/n对司法领域法条知识进行关键词抽取;/n对案情描述文本和法条知识关键词进行语义表征;/n基于注意力机制,对案情描述文本语义表征向量和法条知识关键词语义表征向量进行融合,获得融合法条知识关键词的案情描述特征向量;/n将融合法条知识关键词的案情描述特征向量进行线性变换和softmax,最终实现法条推荐。/n

【技术特征摘要】
1.基于bert模型和法条知识的法条推荐处理方法,其特征在于:
对司法领域法条知识进行关键词抽取;
对案情描述文本和法条知识关键词进行语义表征;
基于注意力机制,对案情描述文本语义表征向量和法条知识关键词语义表征向量进行融合,获得融合法条知识关键词的案情描述特征向量;
将融合法条知识关键词的案情描述特征向量进行线性变换和softmax,最终实现法条推荐。


2.根据权利要求1所述的基于bert模型和法条知识的法条推荐处理方法,其特征在于,使用基于TextRank方法对司法领域法条知识进行关键词抽取,得到法条知识关键词。


3.根据权利要求1所述的基于bert模型和法条知识的法条推荐处理方法,其特征在于,包括:
依次采用基于bert模型和双向LSTM对案情描述文本进行语义表征,得到案情描述文本语义表征向量;
依次采用基于bert模型和双向LSTM对法条知识关键词进行语义表征,得到法条知识关键词语义表征向量。


4.根据权利要求1所述的基于bert模型和法条知识的法条推荐处理方法,其特征在于,对案情描述文本和法条知识关键词进行语义表征包括:
案情描述文本X=[x1,…,xN]和法条知识关键词文本集合Y=[y1,…,ym],其中,N表示案情描述文本的长度,m为法条知识关键词文本集合的长度,采用bert预训练模型分别对其进行表征,基于bert模型,分别得到具体的文本描述的语义表征向量,为了提升文本序列信息的连续表征能力,bert模块后增加双向LSTM层,进一步提升文本特征向量的上下文特征信息能力。

【专利技术属性】
技术研发人员:余正涛唐光远张亚飞郭军军高盛祥
申请(专利权)人:昆明理工大学
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1