文本分类方法、装置和电子设备制造方法及图纸

技术编号:27620371 阅读:29 留言:0更新日期:2021-03-10 11:00
本公开提供了一种文本分类方法、装置和电子设备,可用于大数据领域或其他领域,该文本分类方法包括:获取输入文本,输入文本是针对指定场景的,指定场景具有对应的文本结构信息;响应于输入文本,获取与输入文本对应的结构化文本信息,结构化文本信息包括输入文本的关键信息和与文本结构信息对应的文本信息;以及利用文本分类模型处理结构化文本信息,确定输入文本的类别。输入文本的类别。输入文本的类别。

【技术实现步骤摘要】
文本分类方法、装置和电子设备


[0001]本公开涉及人工智能
,更具体地,涉及一种文本分类方法、装置和电子设备。

技术介绍

[0002]随着信息技术的不断发展,人工智能技术越来越普及,智能分类作为人工智能技术的重要组成也越来越受到重视。
[0003]在应用智能分类的场景中,需要对文本信息进行分类以便基于分类结果进行业务处理。例如,在记账场景中,需要基于文本信息确定交易的类型,以便将交易金额计入对应的交易类型中,提升用户确定不同的交易类型各自的金额占比的便捷度。记账所依赖的文本信息来自各家银行机构以及第三方交易平台等,行业内并没有统一标准及规范术语,仅通过简单的关键字匹配等方式实现账目分类,命中率较低。为了提升命中率,相关技术可以采用深度学习技术从文本信息中学习到高层属性类别或特征,以发现数据的特征分布表示,提高文本分类的命中率。
[0004]在实现本公开构思的过程中,申请人发现相关技术至少存在如下问题:基于深度学习技术的文本分类模型,其构建及调参过程较复杂,模型训练异常消耗资源,并且需要海量训练数据以提升其针对多种场景的命中率。

技术实现思路

[0005]有鉴于此,本公开提供了一种有助于改善模型训练异常消耗资源,并且需要海量训练数据的问题的文本分类方法、装置和电子设备。
[0006]本公开的一个方面提供了一种文本分类方法,该方法包括:获取输入文本,输入文本是针对指定场景的,指定场景具有对应的文本结构信息;响应于输入文本,获取与输入文本对应的结构化文本信息,结构化文本信息包括输入文本的关键信息和与文本结构信息对应的文本信息;以及利用文本分类模型处理结构化文本信息,确定输入文本的类别。
[0007]本公开的一个方面提供了一种文本分类装置,包括:输入文本获取模块、输入文本响应模块和分类模块。其中,输入文本获取模块用于获取输入文本,输入文本是针对指定场景的,指定场景具有对应的文本结构信息;输入文本响应模块用于响应于输入文本,获取与输入文本对应的结构化文本信息,结构化文本信息包括输入文本的关键信息和与文本结构信息对应的文本信息;以及分类模块用于利用文本分类模型处理结构化文本信息,确定输入文本的类别。
[0008]本公开的另一方面提供了一种电子设备,包括一个或多个处理器以及存储装置,其中,存储装置用于存储可执行指令,可执行指令在被处理器执行时,实现如上所述的方法。
[0009]本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,指令在被执行时用于实现如上所述的方法。
[0010]本公开的另一方面提供了一种计算机程序,计算机程序包括计算机可执行指令,指令在被执行时用于实现如上所述的方法。
[0011]本公开实施例提供的文本分类方法、装置和电子设备,获取了输入文本的关键信息和与针对指定场景的文本结构信息对应的文本信息,由于文本结构信息对应的文本信息可以表征针对指定场景的文本信息的数据特点和共性特征,可以较好地表达针对指定场景的输入文本的语义信息。基于该文本结构信息对应的文本信息结合关键信息进行文本分类时,可以在不降低分类命中率的基础上,有效降低模型训练消耗的计算资源、时间资源等。此外,由于针对指定场景的训练数据的质量较高,有助于降低所需训练数据的数据量。
[0012]本公开实施例提供的文本分类方法、装置和电子设备,文本分类模型是基于在大语义库下预训练的来自变换器的双向编码器表征量(Bidirectional Encoder Representations from Transformers,简称BERT)模型(也称为预训练模型)基础上,依据测试数据进行微调(fine-tuning),使得文本分类模型可以更快地收敛,同样有助于降低模型训练消耗的计算资源、时间资源等。
附图说明
[0013]通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
[0014]图1示意性示出了根据本公开实施例的文本分类方法、装置和电子设备的应用场景;
[0015]图2示意性示出了根据本公开另一实施例的文本分类方法、装置和电子设备的应用场景;
[0016]图3示意性示出了根据本公开实施例的可以应用文本分类方法、装置和电子设备的示例性系统架构;
[0017]图4示意性示出了根据本公开实施例的文本分类方法的流程图;
[0018]图5示意性示出了根据本公开实施例的账目信息示意图;
[0019]图6示意性示出了根据本公开实施例的交互界面的示意图;
[0020]图7示意性示出了根据本公开另一实施例的交互界面的示意图;
[0021]图8示意性示出了根据本公开另一实施例的交互界面的示意图;
[0022]图9示意性示出了根据本公开实施例的分类结果的示意图;
[0023]图10示意性示出了根据本公开实施例的文本分类装置的方框图;
[0024]图11示意性示出了根据本公开实施例的文本分类装置的逻辑图;以及
[0025]图12示意性示出了根据本公开实施例的电子设备的方框图。
具体实施方式
[0026]以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。一个或多个实施例在没有这些具体细节的情况下也可以被实施。在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
[0027]在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用
的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
[0028]在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
[0029]在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。
[0030]为了便于理解本公开的技术方案,首先对自然语言处理模型进行说明。自然语言处理领域近几年来最令人激动的发展就是预训练语言模型,包括基于循环神经网络(Rerrent Neural Network,简称RNN)的语言向量模型(Embeddings from Language Model,简称ELMo)、通用语言模型微调(Universal Language Model Fine-tuning for T本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本分类方法,包括:获取输入文本,所述输入文本是针对指定场景的,所述指定场景具有对应的文本结构信息;响应于所述输入文本,获取与所述输入文本对应的结构化文本信息,所述结构化文本信息包括所述输入文本的关键信息和与所述文本结构信息对应的文本信息;以及利用文本分类模型处理所述结构化文本信息,确定所述输入文本的类别。2.根据权利要求1所述的方法,其中,所述输入文本包括业务摘要文本,所述文本结构信息包括至少一个属性信息;所述结构化文本信息通过如下方式确定:基于正则表达式匹配的方式从所述输入文本中获取与所述属性信息相匹配的文本属性信息以及获取所述输入文本的关键信息;以及拼接所述文本属性信息和所述输入文本的关键信息,获得所述结构化文本信息。3.根据权利要求2所述的方法,其中,所述指定场景是记账场景;所述文本结构信息包括:账号关联信息、交易类型、交易日期、交易金额、交易渠道中至少一种;所述输入文本的关键信息包括:所述业务摘要文本的标题、主题、副标题、业务标签或者备注信息中至少一种;以及所述方法还包括:在所述利用文本分类模型处理所述结构化文本信息以确定所述输入文本的类别之后,基于与所述文本结构信息对应的文本信息中至少部分信息和所述输入文本的类别更新记账信息。4.根据权利要求1所述的方法,其中,所述文本分类模型通过如下方式进行训练;基于针对所述指定场景的第一训练数据集合对所述文本分类模型进行第一次训练,得到模型参数集合;以及基于针对所述指定场景的第二训练数据集合对所述文本分类模型进行第二次训练,以微调所述模型参数集合。5.根据权利要求4所述的方法,其中,所述基于针对所述指定场景的第一训练数据集合对所述文本分类模型进行第一次训练,得到模型参数集合包括:重复执行如下操作直至达到预设训练轮数,其中,针对每一个训练轮,从所述第一训练数据集合中获取指定个数的训练数据;以及将所述指定个数的训练数据以及所述指定个数的训练数据各自的标签信息输入所述文本分类模型,通过随机梯度下降算法更新所述文本分类模型的模型参数。6.根据权利要求4所述的方法,其中,所述基于针对所述指定场景的第二训练数据集合对所述文本分类模型进行第二次训练,以微调所述模型参数集合包括:基于至少两个测试数据集合分别对所述文本分类模型...

【专利技术属性】
技术研发人员:孟欣冉闫跃郭松刘通
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1