【技术实现步骤摘要】
面向庭审过程中犯罪嫌疑人态度预测的方法
本专利技术属于数据挖掘领域,是对智能司法的一种落地,能够对庭审过程中犯罪嫌疑人态度进行预测。
技术介绍
随着自然语言处理领域的不断发展,近年来智慧司法作为其中的一个重要研究方向呈现一个逐步上升的趋势,该项研究能够有效帮助法律工作人员从繁琐重复的工作解放出来,给予相关人员方便且快捷的法律建议,减轻律师的工作压力,并且对于多数欠缺法律背景的大众百姓起到一个普法的作用。通常而言,智能司法包括具体的几个子任务,比方说罚金预测、量刑预测、法条预测等等,通常量刑预测任务目前主要的研究发现被当成是一个自然语言处理中的文本预测任务,研究者们会从文本中去挖掘语义信息,从而去解决罚金或者法条预测务。但在实际庭审过程中,情况复杂多变。人们常说“坦白从宽,抗拒从严”,一个人在法庭上庭审过程的表现,如姿态、语气、神情,会在一定程度上影响他最终的量刑结果,而法律条款当中也有如蔑视法庭罪名。可以说犯罪嫌疑人的态度及行为举止,反应了犯罪嫌疑人的认错、反省的程度。但目前少有对庭审过程中犯罪嫌疑人的态度进 ...
【技术保护点】
1.一种面向庭审过程中犯罪嫌疑人态度预测的方法,其特征在于,包括如下步骤:/nS1.庭审数据的获取与解析;/nS2.数据规整及标注对齐;/nS3.庭审过程多模态信息的抽取与拓展;/nS4.利用多模态信息对犯罪嫌疑人态度进行预测。/n
【技术特征摘要】
1.一种面向庭审过程中犯罪嫌疑人态度预测的方法,其特征在于,包括如下步骤:
S1.庭审数据的获取与解析;
S2.数据规整及标注对齐;
S3.庭审过程多模态信息的抽取与拓展;
S4.利用多模态信息对犯罪嫌疑人态度进行预测。
2.如权利要求1所述的面向庭审过程中犯罪嫌疑人态度预测的方法,其特征在于,
所述步骤S1.庭审数据的获取与解析,具体包括:
A1.数据范围筛选:从中国裁判文书网(http://wenshu.court.gov.cn/Index)和中国庭审公开网(http://tingshen.court.gov.cn/)上收集数据;
A2.数据获取:确定所获取庭审案件号,通过编写网页爬虫程序,于目标庭审案件号上按照指定庭审视频和裁判文书爬取庭审案件的信息;
A3.网页解析:借助BeautifulSoup工具解析将爬取的网页中的数据,通过HTML标签和属性信息,解析出与庭审案件的相关信息。
3.如权利要求1所述的面向庭审过程中犯罪嫌疑人态度预测的方法,其特征在于,
所述步骤S2.数据规整以及标注对齐,具体包括:
B1.数据选取;
B2.数据处理:对收集的视频数据进行剪辑,提取与视频片段配套的音频,作为音频数据,再从音频中提取配套的文字,文本信息存储为TXT格式;
B3.数据标注:由若干标注者观看视频片段并进行数据标注,标注犯罪嫌疑人态度的最终结果按照标注者投票所获得。
4.如权利要求1所述的面向庭审过程中犯罪嫌疑人态度预测的方法,其特征在于,
所述步骤S3.庭审过程多模态信息的抽取与拓展,具体包括:
C1.文本特征提取:使用BERT进行文本的特征提取,对于每个句子L,经过处理后得到768维的句向量表示,融合最后三层的transformer层的参数,取其平均值,并且选取每句话前面的CLS...
【专利技术属性】
技术研发人员:杨亮,曾景杰,李树群,林鸿飞,
申请(专利权)人:大连理工大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。