执行主体的提取方法、装置、存储介质和电子设备制造方法及图纸

技术编号:32322545 阅读:12 留言:0更新日期:2022-02-16 18:28
本公开涉及一种执行主体的提取方法、装置、存储介质和电子设备,涉及电子信息技术领域,该方法包括:获取待处理的公告文本;提取该公告文本中包括的多个分句;将该多个分句中包括主体信息的分句作为目标分句,并对该目标分句进行预设处理,得到目标文本,该目标文本不包括该主体信息;将该目标文本输入至预先训练的识别模型,得到该识别模型输出的该目标文本对应的关联结果;若该关联结果指示该目标文本为关联,根据该目标文本包括的该主体信息确定该公告文本的执行主体。这样,能够有效提高提取公告文本中执行主体的准确率和召回率。取公告文本中执行主体的准确率和召回率。取公告文本中执行主体的准确率和召回率。

【技术实现步骤摘要】
执行主体的提取方法、装置、存储介质和电子设备


[0001]本公开涉及电子信息
,具体地,涉及一种执行主体的提取方法、装置、存储介质和电子设备。

技术介绍

[0002]司法拍卖官网会定期发布一些司法拍卖公告,有些司法拍卖公告中不会给出拍卖的主体公司(例如:抵押权人、标的物所有者等),导致这些司法拍卖公告很难与主体公司进行关联。因此,需要自动识别出司法拍卖公告中的主体公司,以便用户的查询。
[0003]目前,对于司法拍卖公告中主体公司的提取方式主要有两种,一种是将司法拍卖公告中的全部公司作为主体公司,这种方式的准确率较低。另一种是根据预先建立的抽取规则从司法拍卖公告中抽取主体公司,抽取规则的建立耗时耗力,而且很难覆盖所有的场景,导致召回率较低。

技术实现思路

[0004]本公开的目的是提供一种执行主体的提取方法、装置、存储介质和电子设备,用于提高提取公告文本中执行主体的准确率和召回率。
[0005]根据本公开实施例的第一方面,提供一种执行主体的提取方法,所述方法包括:获取待处理的公告文本;提取所述公告文本中包括的多个分句;将所述多个分句中包括主体信息的分句作为目标分句,并对所述目标分句进行预设处理,得到目标文本,所述目标文本不包括所述主体信息;将所述目标文本输入至预先训练的识别模型,得到所述识别模型输出的所述目标文本对应的关联结果;若所述关联结果指示所述目标文本为关联,根据所述目标文本包括的所述主体信息确定所述公告文本的执行主体。
[0006]可选地,所述提取所述公告文本中包括的多个分句,包括:删除所述公告文本中的指定符号,得到初始公告文本,所述指定符号根据所述公告文本的类型确定;按照预设的分隔符,对所述初始公告文本进行划分,得到多个所述分句。
[0007]可选地,所述将所述多个分句中包括主体信息的分句作为目标分句,包括:将每个所述分句与预先建立的主体信息集进行比较,若该分句与所述主体信息集匹配,将该分句作为所述目标分句,所述主体信息集包括多种所述主体信息;或者,对每个所述分句进行语义识别,以确定该分句中是否包括主体信息,若该分句包括主体信息,将该分句作为所述目标分句。
[0008]可选地,所述对所述目标分句进行预设处理,得到目标文本,包括:针对每个所述目标分句,删除该目标分句中的无效词,得到每个所述目标分句对应的初始文本;对多个所述初始文本进行去重处理,得到至少一个中间文本;删除所述中间文本中包括的所述主体信息,得到所述目标文本。
[0009]可选地,所述识别模型通过以下方式训练得到:获取多个样本公告文本,并根据多个所述样本公告文本确定多个样本目标文本;将所述样本目标文本作为样本输入,以得到
包括多个所述样本输入的样本输入集;获取样本输出集,所述样本输出集中包括与每个所述样本输入对应的样本输出,每个所述样本输出包括对应的所述样本目标文本所属的真实关联结果;将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型。
[0010]可选地,所述根据多个所述样本公告文本确定多个样本目标文本,包括:提取每个所述样本公告文本中包括的多个样本分句;将所述多个样本分句中包括主体信息的样本分句作为样本目标分句,并对所述样本目标分句进行所述预设处理,得到所述样本目标文本,所述样本目标文本不包括所述主体信息。
[0011]可选地,所述方法还包括:将所述公告文本与所述执行主体进行关联;响应于针对所述执行主体的查询指令,输出所述公告文本。
[0012]根据本公开实施例的第二方面,提供一种执行主体的提取装置,所述装置包括:获取模块,用于获取待处理的公告文本;提取模块,用于提取所述公告文本中包括的多个分句;处理模块,用于将所述多个分句中包括主体信息的分句作为目标分句,并对所述目标分句进行预设处理,得到目标文本,所述目标文本不包括所述主体信息;第一确定模块,用于将所述目标文本输入至预先训练的识别模型,得到所述识别模型输出的所述目标文本对应的关联结果;第二确定模块,用于若所述关联结果指示所述目标文本为关联,根据所述目标文本包括的所述主体信息确定所述公告文本的执行主体。
[0013]可选地,所述提取模块包括:第一删除子模块,用于删除所述公告文本中的指定符号,得到初始公告文本,所述指定符号根据所述公告文本的类型确定;划分子模块,用于按照预设的分隔符,对所述初始公告文本进行划分,得到多个所述分句。
[0014]可选地,所述处理模块用于将每个所述分句与预先建立的主体信息集进行比较,若该分句与所述主体信息集匹配,将该分句作为所述目标分句,所述主体信息集包括多种所述主体信息;或者,对每个所述分句进行语义识别,以确定该分句中是否包括主体信息,若该分句包括主体信息,将该分句作为所述目标分句。
[0015]可选地,所述处理模块包括:第二删除子模块,用于针对每个所述目标分句,删除该目标分句中的无效词,得到每个所述目标分句对应的初始文本;去重子模块,用于对多个所述初始文本进行去重处理,得到至少一个中间文本;第三删除子模块,用于删除所述中间文本中包括的所述主体信息,得到所述目标文本。
[0016]可选地,所述识别模型通过以下装置训练得到:样本获取模块,用于获取多个样本公告文本,并根据多个所述样本公告文本确定多个样本目标文本;第三确定模块,用于将所述样本目标文本作为样本输入,以得到包括多个所述样本输入的样本输入集;输出集获取模块,用于获取样本输出集,所述样本输出集中包括与每个所述样本输入对应的样本输出,每个所述样本输出包括对应的所述样本目标文本所属的真实关联结果;训练模块,用于将所述样本输入集作为所述识别模型的输入,将所述样本输出集作为所述识别模型的输出,以训练所述识别模型。
[0017]可选地,所述样本获取模块包括:提取子模块,用于提取每个所述样本公告文本中包括的多个样本分句;处理子模块,用于将所述多个样本分句中包括主体信息的样本分句作为样本目标分句,并对所述样本目标分句进行所述预设处理,得到所述样本目标文本,所述样本目标文本不包括所述主体信息。
[0018]可选地,所述装置还包括:关联模块,用于将所述公告文本与所述执行主体进行关联;输出模块,用于响应于针对所述执行主体的查询指令,输出所述公告文本。
[0019]根据本公开实施例的第三方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开实施例第一方面中任一项所述方法的步骤。
[0020]根据本公开实施例的第四方面,提供一种电子设备,包括:存储器,其上存储有计算机程序;处理器,用于执行所述存储器中的所述计算机程序,以实现本公开实施例第一方面中任一项所述方法的步骤。
[0021]通过上述技术方案,本公开首先获取待处理的公告文本;提取该公告文本中包括的多个分句;将该多个分句中包括主体信息的分句作为目标分句,并对该目标分句进行预设处理,得到目标文本,该目标文本不包括该主体信息;将该目标文本输入至预先训练的识别模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种执行主体的提取方法,其特征在于,所述方法包括:获取待处理的公告文本;提取所述公告文本中包括的多个分句;将所述多个分句中包括主体信息的分句作为目标分句,并对所述目标分句进行预设处理,得到目标文本,所述目标文本不包括所述主体信息;将所述目标文本输入至预先训练的识别模型,得到所述识别模型输出的所述目标文本对应的关联结果;若所述关联结果指示所述目标文本为关联,根据所述目标文本包括的所述主体信息确定所述公告文本的执行主体。2.根据权利要求1所述的方法,其特征在于,所述提取所述公告文本中包括的多个分句,包括:删除所述公告文本中的指定符号,得到初始公告文本,所述指定符号根据所述公告文本的类型确定;按照预设的分隔符,对所述初始公告文本进行划分,得到多个所述分句。3.根据权利要求1所述的方法,其特征在于,所述将所述多个分句中包括主体信息的分句作为目标分句,包括:将每个所述分句与预先建立的主体信息集进行比较,若该分句与所述主体信息集匹配,将该分句作为所述目标分句,所述主体信息集包括多种所述主体信息;或者,对每个所述分句进行语义识别,以确定该分句中是否包括主体信息,若该分句包括主体信息,将该分句作为所述目标分句。4.根据权利要求1所述的方法,其特征在于,所述对所述目标分句进行预设处理,得到目标文本,包括:针对每个所述目标分句,删除该目标分句中的无效词,得到每个所述目标分句对应的初始文本;对多个所述初始文本进行去重处理,得到至少一个中间文本;删除所述中间文本中包括的所述主体信息,得到所述目标文本。5.根据权利要求1所述的方法,其特征在于,所述识别模型通过以下方式训练得到:获取多个样本公告文本,并根据多个所述样本公告文本确定多个样本目标文本;将所述样本目标文本作为样本输入,以得到包括多个所述样本输入的样本输入...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:盐城金堤科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1