用于文本分类的装置和方法制造方法及图纸

技术编号:36155612 阅读:49 留言:0更新日期:2022-12-31 20:01
提供了用于使用文本分类器对文本内容进行分类的装置和方法,以确定所述文本内容所属的类。在分类后,所述文本分类器将所述分类结果以及与所述分类结果相关的上下文提供给解释系统。所述解释系统根据所述分类结果以及与所述分类结果相关的所述上下文预测所述分类结果背后的一个或多个理由。了解所述理由后,所述分类结果更易于理解,并且社交媒体服务或类似服务等的用户也能更好地理解他们的评论或其它文本内容被拒绝的原因。或其它文本内容被拒绝的原因。或其它文本内容被拒绝的原因。

【技术实现步骤摘要】
【国外来华专利技术】用于文本分类的装置和方法


[0001]本专利技术大体涉及能够执行计算机程序的电子设备领域。更具体地,本专利技术涉及用于文本分类的装置和方法。

技术介绍

[0002]现代计算机及具有计算能力的设备,例如手机、汽车和家用电器,通常能够执行第三方计算机应用。在这些计算机应用中,有许多应用能够让使用社交媒体应用的不同人进行互动。例如,第一个人可以获取假日旅行的图像,然后使用社交媒体平台或其它类似服务发布这些图像。发布者还可以在发布的图像中加入评论。
[0003]通常,社交媒体平台的其他用户还可以对发布的图像以及可能早先发布的评论进行评论。这些评论通常会被分析,从而可以防止发布不希望的评论。例如,发布的原稿可能包括含有非法内容的评论,或者其他用户的评论可能不礼貌、具有冒犯性或违反平台运营商制定的规则。
[0004]早期的社交媒体平台依赖于利用人类仲裁员在发布评论之前或之后批准或不批准这些评论。这些评论的数量已经显著增加,并且已经开发出基于计算机的方法。在基于计算机的方法中,通常采用使用机器学习装置的文本分类器。基于机器学习装置的文本分类器经过训练能够指示(例如)被分析的评论是可接受的还是不可接受的。
[0005]文本分类器通常以无监督的方式使用非常大的语料库进行训练。在本专利技术中,无监督学习用于表示一种机器学习算法,这种机器学习算法用于从数据集中做出推断,其中,这些数据集由不具有预先存在的标签的输入数据组成。无监督学习可以称为预训练,因为它通常采用有监督学习加以补充。针对识别可接受和不可接受的评论这一任务,有监督学习使用已经由训练有素的人标记的输入数据。传统的文本分类器能够以训练有素的人理解评论为什么被归类为可接受或不可接受的方式提供正确的分类结果。
[0006]随着社交媒体内容等数量的增加,需要改进文本分类。

技术实现思路

[0007]提供了用于使用文本分类器对文本内容进行分类的装置和方法,以确定所述文本内容所属的类。在分类后,所述文本分类器将所述分类结果以及与所述分类结果相关的上下文提供给解释系统。所述解释系统根据所述分类结果以及与所述分类结果相关的所述上下文预测所述分类结果背后的一个或多个理由。了解所述理由后,所述分类结果更易于理解,并且社交媒体服务或类似服务的用户也能更好地理解他们的评论或其它文本内容被拒绝的原因。
[0008]上述和其它目的是通过由独立权利要求请求保护的主题来实现的。其它实现方式在从属权利要求、说明书和附图中显而易见。
[0009]在第一方面,公开了一种用于确定文本分类理由的方法。所述方法包括:接收待分类的文本输入;使用文本分类器预测所述文本输入的类;提取与预测结果相关的上下文;根
据所述提取的上下文确定所述预测结果的一个或多个理由;提供所述预测结果和所述确定的一个或多个理由作为分类结果。
[0010]有利的是,可以确定所述文本分类理由,使得获得所述分类结果的用户可以理解完成分类的原因。这可以通过以下方式来实现:根据所述接收的输入识别与所述判定相关的所述上下文,并根据所述相关的上下文预测所述分类的实际理由。这还会改善用户体验,因为用户信任自动判定。此外,人类仲裁员能够提供更好的知情判定。所述理由促进特定于文化的仲裁,并且还可以更好地考虑与特定内容的仲裁有关的法律问题。
[0011]在所述第一方面的第一种实现方式中,提取与所述预测结果相关的所述上下文包括:识别与所述预测结果相关的所述上下文,其中,所述识别包括使用可解释的多头注意力模块选择与所述预测最相关的输入单词。使用多头注意力模块是有利的,因为所述多头注意力模块可以关注多个输入并选择最相关的输入。
[0012]在所述第一方面的第二种实现方式中,确定所述预测结果的一个或多个理由包括:使用机器学习装置根据所述识别的上下文确定所述预测结果的一个或多个理由,并进一步使用理由分类器和知识库预测所述分类理由。使用知识库是有利的,因为它可以用于微调所述理由,特别是在确定理由无把握的情况下。这提高了推理的正确性,因此减少了人为干预的需要。
[0013]在所述第一方面的第三种实现方式中,预测所述分类理由包括:使用知识库扩展所述识别的上下文,其中,所述知识库包括单词的语义关系。扩展所述识别的上下文是有利的,因为根据所述扩展的识别内容能够更轻松地确定正确的理由。当所述确定基于具有语义关系的较大单词组时,这会增加理由确定的正确性。
[0014]在所述第一方面的第四种实现方式中,所述方法还包括:计算表示所述预测结果和所述确定的一个或多个理由的置信度的值。计算表示所述预测的置信度的值或系数是有利的。这有助于确定需要利用的是知识库还是人类仲裁员。这提高了判定的正确性并减少了人工工作的需要。
[0015]在所述第一方面的第五种实现方式中,所述方法还包括:将所述计算值与阈值进行比较,并且当所述计算值低于所述阈值时,将所述文本输入、所述预测结果以及所述一个或多个理由转发给系统操作员。确定表示置信度的所述计算值的阈值是有利的,这使得能够轻松确定必须是微调还是审查所述确定的理由。
[0016]在所述第一方面的第六种实现方式中,所述方法还包括:根据所述一个或多个理由生成解释。为用户提供解释而不是一个或多个理由是有利的,因为其目的是提高对所述分类结果的理解。
[0017]在所述第一方面的第七种实现方式中,所述文本分类器是基于语言表示的神经网络。使用基于语言表示的神经网络是有利的,因为所述神经网络能够进行有效的文本分类。
[0018]在第二方面,公开了一种包括计算机程序代码的计算机程序,当所述计算机程序代码在计算设备中执行时,所述计算机程序代码用于执行上述方法。使用计算机程序实现上述优点和技术效果是有利的。
[0019]在第三方面,公开了一种用于确定文本分类理由的装置,所述装置包括处理电路系统,所述处理电路系统用于:接收待分类的文本输入;使用文本分类器预测所述文本输入的类;提取与预测结果相关的上下文;根据所述提取的上下文确定所述预测结果的一个或
多个理由;提供所述预测结果和所述确定的一个或多个理由作为分类结果。
[0020]有利的是,可以确定所述文本分类理由,使得获得所述分类结果的用户可以理解完成分类的原因。这可以通过以下方式来实现:根据所述接收的输入识别与所述判定相关的所述上下文,并根据所述相关的上下文预测所述分类的实际理由。
[0021]在所述第三方面的第一种实现方式中,当提取与所述预测结果相关的所述上下文时,所述处理电路系统用于识别与所述预测结果相关的所述上下文,其中,所述识别包括使用可解释的多头注意力模块选择与所述预测最相关的输入单词。使用多头注意力模块是有利的,因为所述多头注意力模块可以关注多个输入并选择最相关的输入。
[0022]在所述第三方面的第二种实现方式中,所述处理电路系统还用于通过以下方式确定所述预测结果的一个或多个理由:使用机器学习装置根据所述识别的上下文确定所述预测结果的一个或多个理由,并进一步使用理由分类器和知识库预测所述分类理由本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于确定文本分类理由的方法,其特征在于,所述方法包括:接收待分类的文本输入;使用文本分类器预测所述文本输入的类;提取与预测结果相关的上下文;根据所述提取的上下文确定所述预测结果的一个或多个理由;提供所述预测结果和所述确定的一个或多个理由作为分类结果。2.根据权利要求1所述的方法,其特征在于,提取与所述预测结果相关的所述上下文包括:识别与所述预测结果相关的所述上下文,其中,所述识别包括使用可解释的多头注意力模块选择与所述预测最相关的输入单词。3.根据权利要求2所述的方法,其特征在于,确定所述预测结果的一个或多个理由包括:使用机器学习装置根据所述识别的上下文确定所述预测结果的一个或多个理由,并进一步使用理由分类器和知识库预测所述分类理由。4.根据权利要求3所述的方法,其特征在于,预测所述分类理由包括:使用知识库扩展所述识别的上下文,其中,所述知识库包括单词的语义关系。5.根据权利要求1至4中任一项所述的方法,其特征在于,还包括:计算表示所述预测结果和所述确定的一个或多个理由的置信度的值。6.根据权利要求5所述的方法,其特征在于,还包括:将所述计算值与阈值进行比较,并且当所述计算值低于所述阈值时,将所述文本输入、所述预测结果以及所述一个或多个理由转发给系统操作员。7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:根据所述一个或多个理由生成解释。8.根据权利要求1至7中任一项所述的方法,其特征在于,所述文本分类器是基于语言表示的神经网络。9.一种包括计算机程序代码的计算机程序,其特征在于,当所述计算机程序代码在计算设备中执行时,所述计算机程序代码用于执行根据权利要...

【专利技术属性】
技术研发人员:苏莱曼
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1