游戏评论的处理方法及相关设备技术

技术编号:24035777 阅读:36 留言:0更新日期:2020-05-07 01:51
本公开实施例提供了一种游戏评论的处理方法及相关设备,属于计算机技术领域。该方法包括:获取对游戏评论进行标注得到的标注数据,标注数据包括游戏评论及其标注类别;通过预训练模型对标注数据中的游戏评论进行处理,获得游戏评论的语义表示向量;其中,预训练模型是通过针对无标注的游戏评论预训练获得的;通过全连接层对游戏评论的语义表示向量进行处理,获得游戏评论的目标类别的概率;通过游戏评论的目标类别的概率确定游戏评论的预测类别;根据标注类别和预测类别对预训练模型和全连接层进行训练以得到游戏评论分类模型。

Game review processing methods and related equipment

【技术实现步骤摘要】
游戏评论的处理方法及相关设备
本公开涉及计算机
,具体而言,涉及一种游戏评论的处理方法及装置、电子设备和计算机可读存储介质。
技术介绍
随着互联网技术的发展,越来越多的用户在网上发表各种评论,例如游戏玩家可以针对其玩过的游戏发表评论。游戏平台或者游戏厂商需要从海量的评论数据中找出有价值的信息,获得用户对其推出的游戏的体验和感受,以便其改进。为了从海量的评论数据中提取出有价值的信息,首先需要对海量的评论数据进行分类。相关技术中,采用以下方式来实现分类功能:首先,构建训练集,利用构建好的训练集训练AdaBoost分类器;然后,计算当前待分类的评论语句的文本特征值、情感特征值和有用性特征值;再调用训练好的AdaBoost分类器,将该评论语句的文本特征值、情感特征值和有用性特征值输入至AdaBoost分类器,以实现对评论语句的分类。但是,上述相关技术提供的方案至少存在以下技术问题:需要人工设计特征,构建的特征不够全面。同时,为了提高AdaBoost分类器的预测准确性,需要采用大量的标注数据来生成训练集,由此导致数据标注时间较长、成本较高的问题,此外,训练时间也较长,需要较多的计算资源。如果采用的标注数据不足够,则会导致训练好的AdaBoost分类器的预测准确率较低。因此,需要一种新的游戏评论的处理方法及装置、电子设备和计算机可读存储介质。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解。
技术实现思路
本公开实施例提供一种游戏评论的处理方法及装置、电子设备和计算机可读存储介质,通过训练预训练模型和全连接层,可以获得能够对游戏评论进行精准分类的网络模型。本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。本公开实施例提供一种游戏评论的处理方法,所述方法包括:获取对游戏评论进行标注得到的标注数据,所述标注数据包括所述游戏评论及其标注类别;通过预训练模型对所述标注数据中的游戏评论进行处理,获得所述游戏评论的语义表示向量;其中,所述预训练模型是通过针对无标注的游戏评论预训练获得的;通过全连接层对所述游戏评论的语义表示向量进行处理,获得所述游戏评论的目标类别的概率;通过所述游戏评论的目标类别的概率确定所述游戏评论的预测类别;根据所述标注类别和所述预测类别对所述预训练模型和所述全连接层进行训练以得到游戏评论分类模型。本公开实施例提供一种游戏评论的处理装置,所述装置包括:标注数据获取模块,配置为获取对游戏评论进行标注得到的标注数据,所述标注数据包括所述游戏评论及其标注类别;语义向量获得模块,配置为通过预训练模型对所述标注数据中的游戏评论进行处理,获得所述游戏评论的语义表示向量;其中,所述预训练模型是通过针对无标注的游戏评论预训练获得的;类别概率获得模块,配置为通过全连接层对所述游戏评论的语义表示向量进行处理,获得所述游戏评论的目标类别的概率;预测类别确定模块,配置为通过所述游戏评论的目标类别的概率确定所述游戏评论的预测类别;分类模型训练模块,配置为根据所述标注类别和所述预测类别对所述预训练模型和所述全连接层进行训练以得到游戏评论分类模型。在本公开的一些示例性实施例中,所述装置还包括:第一目标词语确定模块,配置为从所述无标注的游戏评论中确定第一预定数量的第一目标词语;词语遮挡处理模块,配置为对所述第一目标词语进行遮挡处理;第一模型预训练模块,配置为通过所述预训练模型预测被遮挡的所述第一目标词语。在本公开的一些示例性实施例中,所述装置还包括:第二目标词语确定模块,配置为从所述无标注的游戏评论中确定第二预定数量的第二目标词语;词语随机替换模块,配置为用随机词语替换所述第二目标词语;第二模型预训练模块,配置为通过所述预训练模型预测被替换的所述第二目标词语。在本公开的一些示例性实施例中,所述装置还包括:第三目标词语确定模块,配置为从所述无标注的游戏评论中确定第三预定数量的第三目标词语;第三模型预训练模块,配置为通过所述预训练模型预测所述第三目标词语。在本公开的一些示例性实施例中,所述装置还包括:正样本获得模块,配置为从所述无标注的游戏评论中抽取连续的两个句子,对所述连续的两个句子中的部分词语进行遮挡,将遮挡后的所述连续的两个句子作为正样本;负样本获得模块,配置为从所述无标注的游戏评论中抽取非连续的两个句子,对所述非连续的两个句子中的部分词语进行遮挡,将遮挡后的所述非连续的两个句子作为负样本;第一句子关系预测模块,配置为将所述正样本输入至所述预训练模型,预测所述正样本中的两个句子之间的上下句关系;第二句子关系预测模块,配置为将所述负样本输入至所述预训练模型,预测所述负样本中的两个句子之间的上下句关系。在本公开的一些示例性实施例中,所述语义向量获得模块包括:开始字符添加单元,配置为在所述当前游戏评论数据的n个字符前加入一个句子开始字符,n为大于或等于1的正整数;词向量获得单元,配置为通过所述预训练模型对所述n个字符和所述句子开始字符进行处理,获得所述n个字符和所述句子开始字符的词向量;语义向量获得单元,配置为通过所述预训练模型对所述n个字符和所述句子开始字符的词向量进行处理,获得所述n个字符和所述句子开始字符的语义表示向量。在本公开的一些示例性实施例中,所述类别概率获得模块包括:类别概率获得单元,配置为利用所述全连接层对所述句子开始字符的语义表示向量进行处理,获得所述游戏评论的目标类别的概率。在本公开的一些示例性实施例中,所述预训练模型为基于转换器的双向编码器表示。本公开实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的游戏评论的处理方法。本公开实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,配置为存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的游戏评论的处理方法。在本公开的一些实施例所提供的技术方案中,由于预训练模型事先通过大量的未标注的游戏评论进行了预训练,一方面,可以提高训练完成后的网络模型的分类的精准度;另一方面,由于其是基于预训练模型的,在训练阶段,只需要对较少的游戏评论进行标注即可,可以降低数据的标注时间和成本,同时训练时长降低,训练所利用的计算资源减少。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示出了可以应用本公开实施例的游戏评论的处理方法或游戏评论的处理装置的示例性系统架构的示意图;图2示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图;图3示意性示出了根据本公开本文档来自技高网...

【技术保护点】
1.一种游戏评论的处理方法,其特征在于,包括:/n获取对游戏评论进行标注得到的标注数据,所述标注数据包括所述游戏评论及其标注类别;/n通过预训练模型对所述标注数据中的游戏评论进行处理,获得所述游戏评论的语义表示向量;其中,所述预训练模型是通过针对无标注的游戏评论预训练获得的;/n通过全连接层对所述游戏评论的语义表示向量进行处理,获得所述游戏评论的目标类别的概率;/n通过所述游戏评论的目标类别的概率确定所述游戏评论的预测类别;/n根据所述标注类别和所述预测类别对所述预训练模型和所述全连接层进行训练以得到游戏评论分类模型以得到游戏评论分类模型。/n

【技术特征摘要】
1.一种游戏评论的处理方法,其特征在于,包括:
获取对游戏评论进行标注得到的标注数据,所述标注数据包括所述游戏评论及其标注类别;
通过预训练模型对所述标注数据中的游戏评论进行处理,获得所述游戏评论的语义表示向量;其中,所述预训练模型是通过针对无标注的游戏评论预训练获得的;
通过全连接层对所述游戏评论的语义表示向量进行处理,获得所述游戏评论的目标类别的概率;
通过所述游戏评论的目标类别的概率确定所述游戏评论的预测类别;
根据所述标注类别和所述预测类别对所述预训练模型和所述全连接层进行训练以得到游戏评论分类模型以得到游戏评论分类模型。


2.根据权利要求1所述的方法,其特征在于,还包括:
从所述无标注的游戏评论中确定第一预定数量的第一目标词语;
对所述第一目标词语进行遮挡处理;
通过所述预训练模型预测被遮挡的所述第一目标词语。


3.根据权利要求2所述的方法,其特征在于,还包括:
从所述无标注的游戏评论中确定第二预定数量的第二目标词语;
用随机词语替换所述第二目标词语;
通过所述预训练模型预测被替换的所述第二目标词语。


4.根据权利要求3所述的方法,其特征在于,还包括:
从所述无标注的游戏评论中确定第三预定数量的第三目标词语;
通过所述预训练模型预测所述第三目标词语。


5.根据权利要求2至4任一项所述的方法,其特征在于,还包括:
从所述无标注的游戏评论中抽取连续的两个句子,对所述连续的两个句子中的部分词语进行遮挡,将遮挡后的所述连续的两个句子作为正样本;
从所述无标注的游戏评论中抽取非连续的两个句子,对所述非连续的两个句子中的部分词语进行遮挡,将遮挡后的所述非连续的两个句子作为负样本;
将所述正样本输入至所述预训练模型,预测所述正样本中的两个句子之间的上下句关系;
将所述负样本输入至所述预训练模型,预测所述负样本中的两个句子之间的上下句关系。


6.根据权利要求1所述的方法,其特征在于,通过预训练模型对所述标注数据中的游戏评论进行处...

【专利技术属性】
技术研发人员:智绪浩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1