The invention belongs to the field of large data processing, and provides a method for determining a charge, a device, a computer device and a storage medium. The determination methods of the charges include: obtaining the information of the criminal facts to be determined; segmenting and denoising the information of the criminal facts; extracting the keywords from the criminal facts text information processed by segmenting and denoising, and using the keywords to represent a criminal fact; and extracting the keywords from the criminal facts text information processed by segmenting and denoising. The key word information is brought into the conviction classifier, and the conviction classifier generates the result of the conviction judgment of the criminal facts to be determined. The conviction classifier is obtained by training the criminal facts to learn the corpus. This application not only simplifies the conviction process, improves the efficiency of handling cases, but also provides assistance to legal professionals in handling cases, and provides guidance for the relevant counseling of non-legal personnel.
【技术实现步骤摘要】
一种罪名的判定方法、装置及计算机设备、存储介质
本专利技术涉及大数据处理领域,尤其涉及一种罪名的判定方法、装置及计算机设备、存储介质。
技术介绍
互联网发展到今天,“人工智能”是被提到最多的词汇之一,法律信息服务行业也不例外。在互联网颠覆时代的大背景下,法律行业逐渐受到冲击并发生改变。尤其是法律网络数据库中包含着海量数据,很容易被联想到“大数据”。然而“大数据”的概念远不止传统数据库对数据的存储、检索和管理,更是对数据的分析和使用,是对海量数据实用价值和经济价值的深度挖掘。正是由于大数据分析的重要性,结合司法案例数据体量巨大的特点,独立的案例分析平台建设是十分必要的。而“定罪”是案例分析中非常重要的工作之一,利用技术手段实现智能定罪可以极大的提高定罪这个过程的速率,这会给办案人员、律师、甚至是非法律人士带来巨大的帮助。目前来说,定罪的工作主要还是依靠法律专业人员的本身知识、经验结合相关的法律法规进行人为的得出结论,整个定罪的过程如下:第一步,通过证据确定的犯罪事实中找到嫌疑人的行为。第二步,寻找该行为法定特征,与相似罪名找区别点,比如故意杀人和故意伤害,区别在于嫌疑人主管犯罪目的是什么。再比如,故意伤害罪和聚众斗殴罪,区别是二者侵犯的客体不同,对犯罪主体要求也不同,比对区别是隐藏步骤,不一定每一次都会用到)。第三步,找到犯罪主体(嫌疑人)的特征,比如是否有特殊身份。第四步,文书中寻找是否有酌定的定罪情节,例如犯罪动机,犯罪目的,犯罪时间、犯罪地点等方面。现在的定罪手段主要依靠的是人,要靠人的学识、经验结合法律法规来判定一些非常见的犯罪事实的罪名,这是一个很 ...
【技术保护点】
1.一种罪名的判定方法,其特征在于,包括:获取待判定的犯罪事实文本信息;对所述犯罪事实文本信息进行分词处理和去噪处理;从经过分词处理和去噪处理的犯罪事实文本信息中进行关键字提取,所述关键字用以表征一段犯罪事实;将提取的关键字信息带入定罪分类器,生成对所述待判定的犯罪事实的罪名判定结果,所述定罪分类器通过训练犯罪事实学习语料获得。
【技术特征摘要】
1.一种罪名的判定方法,其特征在于,包括:获取待判定的犯罪事实文本信息;对所述犯罪事实文本信息进行分词处理和去噪处理;从经过分词处理和去噪处理的犯罪事实文本信息中进行关键字提取,所述关键字用以表征一段犯罪事实;将提取的关键字信息带入定罪分类器,生成对所述待判定的犯罪事实的罪名判定结果,所述定罪分类器通过训练犯罪事实学习语料获得。2.根据权利要求1所述的罪名的判定方法,其特征在于,所述对犯罪事实文本信息进行分词处理,具体包括:利用分词器对所述犯罪事实文本信息进行分词处理;利用word2vector技术对分词后的词进行向量化处理。3.根据权利要求2所述的罪名的判定方法,其特征在于,所述对犯罪事实文本信息进行去噪处理,具体包括:利用设定的规则库和噪音库对分词处理后的犯罪事实文本信息进行去噪处理。4.根据权利要求1-3任一项所述的罪名的判定方法,其特征在于,所述定罪分类器通过训练犯罪事实学习语料获得,具体包括:构建各个罪名的犯罪事实学习语料库;构建各个罪名对应的规则库和噪音库;利用所述规则库和噪音库对所述犯罪事实学习语料库进行清洗;对清洗后的犯罪事实学习语料库进行建模处理,得到定罪分类器。5.一种罪名的判定装置,其特征在于,包括:获取模块,用于获取待判定的犯罪事实文本信息;预处理模块,用于对所述犯罪事实文本信息进行分词处理和去噪处理;关键字提取模块,用于从经过分词处理和去噪处理的犯罪事实文本信息中进行关键字提取,所述关键字用以表征一段犯罪事实;判定模块,用于将提取的关键...
【专利技术属性】
技术研发人员:武光鼎,
申请(专利权)人:北京北大英华科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。