游戏评论的处理方法及相关设备技术

技术编号：24035777 阅读：36 留言：0更新日期：2020-05-07 01:51

本公开实施例提供了一种游戏评论的处理方法及相关设备，属于计算机技术领域。该方法包括：获取对游戏评论进行标注得到的标注数据，标注数据包括游戏评论及其标注类别；通过预训练模型对标注数据中的游戏评论进行处理，获得游戏评论的语义表示向量；其中，预训练模型是通过针对无标注的游戏评论预训练获得的；通过全连接层对游戏评论的语义表示向量进行处理，获得游戏评论的目标类别的概率；通过游戏评论的目标类别的概率确定游戏评论的预测类别；根据标注类别和预测类别对预训练模型和全连接层进行训练以得到游戏评论分类模型。

Game review processing methods and related equipment

全部详细技术资料下载

【技术实现步骤摘要】
游戏评论的处理方法及相关设备
本公开涉及计算机
，具体而言，涉及一种游戏评论的处理方法及装置、电子设备和计算机可读存储介质。
技术介绍
随着互联网技术的发展，越来越多的用户在网上发表各种评论，例如游戏玩家可以针对其玩过的游戏发表评论。游戏平台或者游戏厂商需要从海量的评论数据中找出有价值的信息，获得用户对其推出的游戏的体验和感受，以便其改进。为了从海量的评论数据中提取出有价值的信息，首先需要对海量的评论数据进行分类。相关技术中，采用以下方式来实现分类功能：首先，构建训练集，利用构建好的训练集训练AdaBoost分类器；然后，计算当前待分类的评论语句的文本特征值、情感特征值和有用性特征值；再调用训练好的AdaBoost分类器，将该评论语句的文本特征值、情感特征值和有用性特征值输入至AdaBoost分类器，以实现对评论语句的分类。但是，上述相关技术提供的方案至少存在以下技术问题：需要人工设计特征，构建的特征不够全面。同时，为了提高AdaBoost分类器的预测准确性，需要采用大量的标注数据来生成训练集，由此导致数据标注时间较长、成本较高的问题，此外，训练时间也较长，需要较多的计算资源。如果采用的标注数据不足够，则会导致训练好的AdaBoost分类器的预测准确率较低。因此，需要一种新的游戏评论的处理方法及装置、电子设备和计算机可读存储介质。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解。
技术实现思路
本公开实施例提供一种游戏评论的处理方法及装置、电子设备和计...

【技术保护点】
1.一种游戏评论的处理方法，其特征在于，包括：/n获取对游戏评论进行标注得到的标注数据，所述标注数据包括所述游戏评论及其标注类别；/n通过预训练模型对所述标注数据中的游戏评论进行处理，获得所述游戏评论的语义表示向量；其中，所述预训练模型是通过针对无标注的游戏评论预训练获得的；/n通过全连接层对所述游戏评论的语义表示向量进行处理，获得所述游戏评论的目标类别的概率；/n通过所述游戏评论的目标类别的概率确定所述游戏评论的预测类别；/n根据所述标注类别和所述预测类别对所述预训练模型和所述全连接层进行训练以得到游戏评论分类模型以得到游戏评论分类模型。/n

【技术特征摘要】
1.一种游戏评论的处理方法，其特征在于，包括：
获取对游戏评论进行标注得到的标注数据，所述标注数据包括所述游戏评论及其标注类别；
通过预训练模型对所述标注数据中的游戏评论进行处理，获得所述游戏评论的语义表示向量；其中，所述预训练模型是通过针对无标注的游戏评论预训练获得的；
通过全连接层对所述游戏评论的语义表示向量进行处理，获得所述游戏评论的目标类别的概率；
通过所述游戏评论的目标类别的概率确定所述游戏评论的预测类别；
根据所述标注类别和所述预测类别对所述预训练模型和所述全连接层进行训练以得到游戏评论分类模型以得到游戏评论分类模型。

2.根据权利要求1所述的方法，其特征在于，还包括：
从所述无标注的游戏评论中确定第一预定数量的第一目标词语；
对所述第一目标词语进行遮挡处理；
通过所述预训练模型预测被遮挡的所述第一目标词语。

3.根据权利要求2所述的方法，其特征在于，还包括：
从所述无标注的游戏评论中确定第二预定数量的第二目标词语；
用随机词语替换所述第二目标词语；
通过所述预训练模型预测被替换的所述第二目标词语。

4.根据权利要求3所述的方法，其特征在于，还包括：
从所述无标注的游戏评论中确定第三预定数量的第三目标词语；
通过所述预训练模型预测所述第三目标词语。

5.根据权利要求2至4任一项所述的方法，其特征在于，还包括：
从所述无标注的游戏评论中抽取连续的两个句子，对所述连续的两个句子中的部分词语进行遮挡，将遮挡后的所述连续的两个句子作为正样本；
从所述无标注的游戏评论中抽取非连续的两个句子，对所述非连续的两个句子中的部分词语进行遮挡，将遮挡后的所述非连续的两个句子作为负样本；
将所述正样本输入至所述预训练模型，预测所述正样本中的两个句子之间的上下句关系；
将所述负样本输入至所述预训练模型，预测所述负样本中的两个句子之间的上下句关系。

6.根据权利要求1所述的方法，其特征在于，通过预训练模型对所述标注数据中的游戏评论进行处...

【专利技术属性】
技术研发人员：智绪浩，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人