【技术实现步骤摘要】
本专利技术涉及自然语言处理,具体涉及一种基于大规模语言模型的低资源法律信息抽取方法及系统。
技术介绍
1、信息抽取是自然语言处理领域一个经典的任务,其通常被分为两个子任务,命名实体识别和实体关系抽取。命名实体识别指从文本中抽取各种类型的实体名词,实体关系抽取指从文本中识别实体间具有的某种关系,通常使用三元组(实体1,关系,实体2)的模型表达。在在线教育领域中,从用户作答的纯文本文字中识别并抽取命名实体以及实体间相关关系,是智能阅卷任务中核心的一环。例如“20**年*月*日早上*时许,吸毒人员徐某某来到林某某的养猪场购买毒品海洛因,当两人完成交易时,被公安民警当场抓获。”在这句话中涉及到人名实体“徐某某、林某某”,毒品实体“海洛因”。涉及到的部分实体关系包括“(林某某,贩卖给人,徐某某),(林某某,贩卖毒品,海洛因)”等。如果用户在作答过程中,理解错误两个人物间的关系,会导致智能阅卷出现误判的情况发生。如何更加准确的识别用户书写文本中的各项信息,对提升智能阅卷的准确性有极大的意义。
2、当前主要的解决方法可归结为以下两类:基于
...【技术保护点】
1.一种基于大规模语言模型的低资源法律信息抽取方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述构建用于实体识别和信息抽取任务的预测模型的具体方法包括:构建多头注意力模块、构建旋转位置编码模块、构建前馈网络模块和构建层归一化模块。
3.如权利要求2所述的方法,其特征在于,所述构建多头注意力模块的具体方法包括:
4.如权利要求3所述的方法,其特征在于,所述构建旋转位置编码模块的具体方法包括:
5.如权利要求4所述的方法,其特征在于,所述构建前馈网络模块的具体方法包括:
6.如权利要求2所述的
...【技术特征摘要】
1.一种基于大规模语言模型的低资源法律信息抽取方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述构建用于实体识别和信息抽取任务的预测模型的具体方法包括:构建多头注意力模块、构建旋转位置编码模块、构建前馈网络模块和构建层归一化模块。
3.如权利要求2所述的方法,其特征在于,所述构建多头注意力模块的具体方法包括:
4.如权利要求3所述的方法,其特征在于,所述构建旋转位置编码模块的具体方法包括:
5.如权利要求4所述的方法,其特征在于,所述构建前馈网络模块的具体方法包括:
6.如权利要求2所述的方法,其特征在于,所述方法还包括对构建的预测模型进行训练,具体包括:
<...【专利技术属性】
技术研发人员:刘琛,陈旭阳,杨旭川,
申请(专利权)人:重庆觉晓科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。