一种标签提取方法、设备和存储介质技术

技术编号:36219110 阅读:43 留言:0更新日期:2023-01-04 12:16
本申请公开了一种标签提取方法、设备和存储介质。该方法包括:获取若干目标文本;提取各目标文本对应的关键信息,并对若干目标文本进行分类处理,得到属于各目标类别的第一目标文本集;对于各目标类别,基于目标类别的第一目标文本集中各目标文本对应的关键信息,提取目标类别的目标标签。通过上述方式,本申请能够提高标签提取的准确性。提高标签提取的准确性。提高标签提取的准确性。

【技术实现步骤摘要】
一种标签提取方法、设备和存储介质


[0001]本申请涉及数据处理领域,特别是涉及一种标签提取方法、设备和存储介质。

技术介绍

[0002]标签提取可以使例如文章这样的无结构文本提取出结构化的标签,以通过标签快速且清晰的了解文本的内容,而提取的标签的准确性更有利于准确了解文本的内容。
[0003]例如像企业关于银行账户的管理,由于企业银行账户的交易量大,很难直观的感知账户的交易行为,容易形成管理盲区,致使资金安全管理存在安全隐患。而全面、精准的交易用途标签,能够使企业快速且准确的了解资金用途,为企业的资金安全提供保障。
[0004]因此,如何提高标签提取的准确性意义重大。

技术实现思路

[0005]本申请主要解决的技术问题是提供一种标签提取方法、设备和存储介质,能够提高标签提取的准确性。
[0006]为解决上述技术问题,本申请采用的一个技术方案是:提供一种标签提取方法,该方法包括:获取若干目标文本;提取各目标文本对应的关键信息,并对若干目标文本进行分类处理,得到属于各目标类别的第一目标文本集;对于各目标类别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种标签提取方法,其特征在于,所述方法包括:获取若干目标文本;提取各所述目标文本对应的关键信息,并对若干所述目标文本进行分类处理,得到属于各目标类别的第一目标文本集;对于各所述目标类别,基于所述目标类别的第一目标文本集中各所述目标文本对应的关键信息,提取所述目标类别的目标标签。2.根据权利要求1所述的方法,其特征在于,所述提取各所述目标文本对应的关键信息,包括:对于各所述目标文本,获取所述目标文本的特征表示;基于所述特征表示,得到所述目标文本对应的关键信息。3.根据权利要求2所述的方法,其特征在于,所述获取所述目标文本的特征表示,包括:对所述目标文本进行分词处理,得到所述目标文本的至少一个分词和对应的分词表示;基于各所述分词表示,得到所述目标文本的所述特征表示。4.根据权利要求3所述的方法,其特征在于,所述基于各所述分词表示,得到所述目标文本的所述特征表示,包括:对各所述分词表示和所述目标文本进行编码,得到各所述分词的上下文信息;基于各所述分词的上下文信息,得到所述目标文本的所述特征表示;所述基于所述特征表示,得到所述目标文本对应的关键信息,包括:基于各所述分词的上下文信息和所述特征表示的匹配程度,得到所述目标文本对应的关键信息。5.根据权利要求4所述的方法,其特征在于,所述基于各所述分词的上下文信息和所述特征表示的匹配程度,得到所述目标文本对应的关键信息,包括:分别获取各所述分词的上下文信息和所述特征表示的匹配程度;将所述匹配程度达到第一预设条件对应的所述分词,作为所述目标文本的关键信息。6.根据权利要求2所述的方法,其特征在于,在所述对若干所述文本进行分类处理,得到属于各目标类别的第一目标文本集之前,所述方法还包括:确定需分类的类别数量;所述对若干所述目标文本进行分类处理,得到属于各目标类别的第一目标文本集,包括:对若干所述目标文本进行分类处理,得到所述类别数量个目标类别分别对应的第一目标文本集。...

【专利技术属性】
技术研发人员:李玫丁德智
申请(专利权)人:远光软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1