一种基于任务导向预训练的法律事件检测模型构建方法与应用技术

技术编号:42245883 阅读:39 留言:0更新日期:2024-08-02 13:56
本发明专利技术公开了一种基于任务导向预训练的法律事件检测模型构建方法与应用,属于人工智能技术领域;所构建的法律事件检测模型包括:级联的token化层、训练好的文本特征提取模块和分类模块;在对文本特征提取模块进行训练的过程中,将法律领域文本语料数据集中的法律判决文书事实部分文本对应的token序列中表征法律事件语义特征的token进行掩码后,再输入至文本特征提取模块中进行MLM预训练;通过基于法律事件特征的选择性掩码策略实现了事件检测任务导向的领域预训练,从而将文本特征提取模块中预训练语言模型的训练与法律事件检测任务相关联,对法律事件关键要素具备良好的感知理解与特征提取能力,提高了法律事件检测的准确性。

【技术实现步骤摘要】

本专利技术属于人工智能,更具体地,涉及一种基于任务导向预训练的法律事件检测模型构建方法与应用


技术介绍

1、法律事件检测旨在自动识别出法律案件中的事件候选触发词的事件类型,从而完成案件事实的快速重构,是实现智能辅助办理和管理决策的重要环节;因此,法律事件检测逐渐开始成为重要的研究热点。

2、现有的法律事件检测模型通常基于大量公开的裁判文书数据构建无监督的领域预训练语料,并基于随机掩码策略来训练法律领域的预训练语言模型,进而基于预训练语言模型所提取的特征来实现法律事件检测。虽然法律领域的预训练语言模型与法律领域相关,但是掩码过程存在随机性,并未与下游的事件检测任务紧密关联,无法准确地进行法律事件检测。


技术实现思路

1、针对现有技术的以上缺陷或改进需求,本专利技术提供了一种基于任务导向预训练的法律事件检测模型构建方法与应用,用以解决现有技术无法准确地进行法律事件检测的技术问题。

2、为了实现上述目的,第一方面,本专利技术提供了一种基于任务导向预训练的法律事件检测模型构建方法,包括:...

【技术保护点】

1.一种基于任务导向预训练的法律事件检测模型构建方法,其特征在于,包括:

2.根据权利要求1所述的法律事件检测模型构建方法,其特征在于,所述token序列中表征法律事件语义特征的token包括:词性为动词的token。

3.根据权利要求1所述的法律事件检测模型构建方法,其特征在于,所述token序列中表征法律事件语义特征的token包括:将token序列输入至触发词检测模型后所得的触发词token;

4.根据权利要求1所述的法律事件检测模型构建方法,其特征在于,所述token序列中表征法律事件语义特征的token包括:将token序列输入至重要toke...

【技术特征摘要】

1.一种基于任务导向预训练的法律事件检测模型构建方法,其特征在于,包括:

2.根据权利要求1所述的法律事件检测模型构建方法,其特征在于,所述token序列中表征法律事件语义特征的token包括:词性为动词的token。

3.根据权利要求1所述的法律事件检测模型构建方法,其特征在于,所述token序列中表征法律事件语义特征的token包括:将token序列输入至触发词检测模型后所得的触发词token;

4.根据权利要求1所述的法律事件检测模型构建方法,其特征在于,所述token序列中表征法律事件语义特征的token包括:将token序列输入至重要token...

【专利技术属性】
技术研发人员:王玉明王忆宁彭俊聪范财胜
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1