文本分类展示方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:34935625 阅读:11 留言:0更新日期:2022-09-15 07:32
本公开的实施例公开了文本分类展示方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取待分类文本;将上述待分类文本输入至预先训练的文本分类模型包括的动态规划切分层,得到待分类子文本集合;将上述待分类子文本集合输入至上述向量生成层,得到待分类子文本向量集合;将上述待分类子文本向量集合输入至上述向量融合层,得到待分类文本向量;将上述待分类文本向量输入至上述分类输出层,得到文本类别标签;在文本展示窗口包括的对应上述文本类别标签的文本展示区域对上述待分类文本进行展示。该实施方式提高了对文本进行分类的准确率。对文本进行分类的准确率。对文本进行分类的准确率。

【技术实现步骤摘要】
文本分类展示方法、装置、电子设备和计算机可读介质


[0001]本公开的实施例涉及文本分类
,具体涉及文本分类展示方法、装置、电子设备和计算机可读介质。

技术介绍

[0002]随着互联网的发展,在各种各样的场景下往往会产生大量的文本。在使用或处理文本前,通常需要对文本进行分类。例如,对于新闻文本,需要将新闻文本进一步分类为体育新闻、社会新闻等,再分门别类地呈现给观看新闻的用户。目前,在进行文本分类时,可以采用BERT模型。
[0003]然而,当采用上述方式进行文本分类时,经常会存在如下技术问题:第一,对于篇幅较长的文本,BERT模型会采取截断处理,丢弃文本中超出预设文本长度阈值的部分,无法根据整个文本生成文本类别标签,导致文本的分类准确率较低。
[0004]第二,预先指定待训练的模型以及模型的损失函数,无法通过比较将表现效果更好的模型和损失函数作为待训练的模型和损失函数,进一步造成模型对于文本的分类准确率的降低。
[0005]第三,未引入软负例,无法在构造噪声的基础上训练文本分类模型,导致模型的泛化能力较差,对文本的分类准确率较低。

技术实现思路

[0006]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0007]本公开的一些实施例提出了文本分类展示方法、装置、电子设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一项或多项。
[0008]第一方面,本公开的一些实施例提供了一种文本分类展示方法,该方法包括:获取待分类文本,其中,上述待分类文本的文本长度大于等于预设文本长度阈值;将上述待分类文本输入至预先训练的文本分类模型包括的动态规划切分层,得到待分类子文本集合,其中,上述文本分类模型包括上述动态规划切分层、向量生成层、向量融合层和分类输出层;将上述待分类子文本集合输入至上述向量生成层,得到待分类子文本向量集合;将上述待分类子文本向量集合输入至上述向量融合层,得到待分类文本向量;将上述待分类文本向量输入至上述分类输出层,得到文本类别标签;在文本展示窗口包括的对应上述文本类别标签的文本展示区域对上述待分类文本进行展示。
[0009]第二方面,本公开的一些实施例提供了一种文本分类展示装置,装置包括:获取单元,被配置成获取待分类文本,其中,上述待分类文本的文本长度大于等于预设文本长度阈值;第一输入单元,被配置成将上述待分类文本输入至预先训练的文本分类模型包括的动态规划切分层,得到待分类子文本集合,其中,上述文本分类模型包括上述动态规划切分
层、向量生成层、向量融合层和分类输出层;第二输入单元,被配置成将上述待分类子文本集合输入至上述向量生成层,得到待分类子文本向量集合;第三输入单元,被配置成将上述待分类子文本向量集合输入至上述向量融合层,得到待分类文本向量;第四输入单元,被配置成将上述待分类文本向量输入至上述分类输出层,得到文本类别标签;展示单元,被配置成在文本展示窗口包括的对应上述文本类别标签的文本展示区域对上述待分类文本进行展示。
[0010]第三方面,本公开的一些实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现上述第一方面任一实现方式所描述的方法。
[0011]第四方面,本公开的一些实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,程序被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0012]第五方面,本公开的一些实施例提供了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现上述第一方面任一实现方式所描述的方法。
[0013]本公开的上述各个实施例具有如下有益效果:通过本公开的一些实施例的文本分类展示方法,提高了文本的分类准确率。具体来说,导致文本的分类准确率较低的原因在于:对于篇幅较长的文本,BERT模型会采取截断处理,丢弃文本中超出预设文本长度阈值的部分,无法根据整个文本生成文本类别标签,导致文本的分类准确率较低。基于此,本公开的一些实施例的文本分类展示方法,首先,获取待分类文本。其中,上述待分类文本可以为文本长度大于等于预设文本长度阈值且等待分类的文本。由此,可以获取到文本长度大于等于预设文本长度阈值的待分类文本。然后,将上述待分类文本输入至预先训练的文本分类模型包括的动态规划切分层,得到待分类子文本集合。其中,上述文本分类模型包括上述动态规划切分层、向量生成层、向量融合层和分类输出层。由此,可以避免对于待分类文本中超出预设文本长度阈值的文本的丢弃。其次,将待分类子文本集合输入至向量生成层,得到待分类子文本向量集合。由此,可以得到每个待分类子文本的向量表征。然后,将待分类子文本向量集合输入至向量融合层,得到待分类文本向量。由此,可以将各个待分类子文本向量融合为待分类文本向量。之后,将上述待分类文本向量输入至上述分类输出层,得到文本类别标签。由此,可以实现对于待分类文本的分类,得到表征待分类文本类别的文本类别标签。最后,在文本展示窗口包括的对应文本类别标签的文本展示区域对待分类文本进行展示。由此,可以在相应的文本展示区域对待分类文本进行展示。因为避免了对于待分类文本中超出预设文本长度阈值的文本的丢弃,从而可以根据整个待分类文本生成文本类别标签,进而提高了对于待分类文本进行分类的准确率。
附图说明
[0014]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,元件和元素不一定按照比例绘制。
[0015]图1是根据本公开的文本分类展示方法的一些实施例的流程图;图2是根据本公开的文本分类展示方法的文本分类模型的架构图;图3是根据本公开的文本分类展示装置的一些实施例的结构示意图;
图4是适于用来实现本公开的一些实施例的电子设备的结构示意图。
具体实施方式
[0016]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例。相反,提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0017]另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0018]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
[0019]需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本分类展示方法,包括:获取待分类文本,其中,所述待分类文本的文本长度大于等于预设文本长度阈值;将所述待分类文本输入至预先训练的文本分类模型包括的动态规划切分层,得到待分类子文本集合,其中,所述文本分类模型包括所述动态规划切分层、向量生成层、向量融合层和分类输出层;将所述待分类子文本集合输入至所述向量生成层,得到待分类子文本向量集合;将所述待分类子文本向量集合输入至所述向量融合层,得到待分类文本向量;将所述待分类文本向量输入至所述分类输出层,得到文本类别标签;在文本展示窗口包括的对应所述文本类别标签的文本展示区域对所述待分类文本进行展示。2.根据权利要求1所述的方法,其中,所述文本分类模型是通过以下步骤训练得到的:获取初始样本集合,其中,所述初始样本集合中的初始样本包括样本文本,以及与所述样本文本对应的样本文本类别标签,所述样本文本的样本文本长度大于等于所述预设文本长度阈值;从所述初始样本集合中提取至少一个初始样本作为样本集合;对于样本集合包括的每个样本,执行以下向量生成步骤:将所述样本包括的样本文本输入至所述动态规划切分层,以对所述样本文本进行动态规划切分处理,得到样本子文本集合;对于所述样本子文本集合中的每个样本子文本,将所述样本子文本输入至所述向量生成层包括的预先训练的向量生成模型,得到样本子文本向量,以生成对应所述样本子文本集合的样本子文本向量集合;将所述样本子文本向量集合输入至所述向量融合层包括的图神经网络模型,得到样本文本向量;基于样本集合和所得到的各个样本文本向量,对待训练的文本分类模型进行模型训练,得到训练完成的文本分类模型作为所述文本分类模型。3.根据权利要求2所述的方法,其中,所述对待训练的文本分类模型进行模型训练,包括:将所得到的各个样本文本向量输入至所述分类输出层包括的目标神经网络模型,得到样本集合中的每个样本对应的预测样本文本类别标签;将所述样本集合中的每个样本对应的预测样本文本类别标签与所述样本包括的样本文本类别标签进行比较;根据比较结果确定文本分类模型是否达到预设的优化目标;响应于确定文本分类模型达到所述优化目标,将达到所述优化目标的文本分类模型作为训练完成的文本分类模型;响应于确定文本分类模型未达到所述优化目标,调整文本分类模型的网络参数,以及使用所述初始样本集合中未提取过的初始样本组成样本集合,使用调整后的文本分类模型作为待训练的文本分类模型,再次执行所述向量生成步骤和对待训练的文本分类模型进行的模型训练。4.根据权利要求2所述的方法,其中,所述将所述样本包括的样本文本输入至所述动态
规划切分层,包括:根据所述样本包括的样本文本中的标点符号,对所述样本文本进行分割处理,得到分割处理后的各个样本子片段作为样本子片段集合;根据所述样本子片段集合,生成候选样本子文本集合;根据所述候选样本子文本集合,构建候选节点有向无环图,其中,所述候选节点有向无环图包括至少一个候选节点和一个虚拟节点,每个候选节点对应一个候选样本子文本;根据所述候选节点有向无环图,生成至少一个候选路径;从所述至少一个候选路径中选择满足预设路径条件的候选路径作为目标路径;将所述目标路径对应的各个候选节点确定为目标节点集合;将所述目标节点集合中...

【专利技术属性】
技术研发人员:赵祥李建华王静宇张昆鹏马亚中王辉郭宝松
申请(专利权)人:中关村科学城城市大脑股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1