一种识别方法及装置制造方法及图纸

技术编号:13469125 阅读:36 留言:0更新日期:2016-08-05 01:38
本发明专利技术实施例提供一种识别方法,所述方法包括:确定待识别的符合预设条件的用户评论信息;将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;获取所述第一类用户终端返回的反馈信息;基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用户对用户评论信息评价的可信度。同时,本发明专利技术实施例还提供了一种识别装置。

【技术实现步骤摘要】

本专利技术涉及信息识别技术,具体涉及一种识别方法及装置
技术介绍
随着网络的日益普及,越来越多的用户选择通过在线教育平台进行学习与交流。目前,随着在线教育平台提供的课程数量以及学习论坛使用人数不断增多,用户在在线教育平台上产生的评论也呈爆炸式增长,由于在线教育平台的影响力比较大,出现了很多无效评论,这些无效评论包括涉黄、政治敏感、广告等评论信息,给在线教育平台带来了不好的影响。并且,无效评论的评论特征是日益丰富、变化多样的,图1示出了一种有效评论与无效评论混杂的截图示意图,在图1中所示出的三条评论中,只有第二条是有效评论,第一条与第三条均为无效评论,在第一条与第三条中,用实线框标出的内容均为广告内容,即在评论中隐藏了广告内容。因此,通常判断一条评论是否无效需要做很多判断逻辑才能保证一定精确度的打击,这意味着耗时比较长。但是,在线教育平台上无效评论产生的量和频率都是非常惊人的,因此如何在不影响正常业务的吞吐量和性能的前提下,精确地打击无效评论成为亟待解决的问题。
技术实现思路
有鉴于此,本专利技术实施例为解决现有技术中存在的问题而提供一种识别方法及装置。本专利技术的技术方案是这样实现的:本专利技术实施例提供一种识别方法,所述方法包括:确定待识别的符合预设条件的用户评论信息;将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;获取所述第一类用户终端返回的反馈信息;基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用户对用户评论信息评价的可信度。上述方案中,所述确定待识别的符合预设条件的用户评论信息,包括:获取待处理的用户评论信息;对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉部分不符合所述预设条件的用户评价信息;将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第二级检测处理过滤掉部分不符合所述预设条件的用户评价信息,确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信息并确定待识别的符合预设条件的用户评论信息。上述方案中,所述确定待识别的符合预设条件的用户评论信息,还包括:接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息;将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符合预设条件的用户评论信息中。上述方案中,所述对所述待处理的用户评论信息进行第一级检测处理,包括下述中的至少一种:对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件的账号,则拦截与所述符合第二预设条件的账号相关的评论操作;对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述同一账号在预设时间段内发布的用户评论信息进行拦截;对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。上述方案中,将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理,包括:对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息,利用M个不同的判断策略对每一条用户评论信息进行分析,生成M个判断结果;其中,所述M为正整数,所述M个判断策略均能独立识别用户评论信息所属的类别;在所述M个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结果超出预设比例时,过滤掉所述用户评论信息;在所述M个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。上述方案中,所述将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端,包括:获取第一类用户终端的状态信息以及第一类用户账号的配置信息;基于所述第一类用户终端的状态信息以及所述第一类用户账号的配置信息确定可分发的第一类用户终端的个数;将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类用户终端。上述方案中,所述基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别,包括:对于每一条待识别的符合预设条件的用户评论信息,将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所述第一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息;将第二种反馈信息的计算参数值赋值为第二数值,其中,所述第二数值为负数,所述第二种反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息;计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的置信度参数的乘积进行累加;将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参数的乘积进行累加;当累加值超出第一预设阈值,确定所述待识别的符合预设条件的用户评论信息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第二类别;和/或,当累加值的均值超出第二预设阈值时,确定所述待识别的符合预设条件的用户评论信息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第二类别。上述方案中,所述基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别之后,所述方法还包括:重新计算做出所述反馈信息的第一类用户的置信度参数;基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的置信度参数。上述方案中,计算做出所述反馈信息的第一类用户的置信度参数,包括:获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、评论数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数;获取所述参数对应的权重信息;基于与所述第一类用户相关的参数的数据以及相应参数对应的权重信息计算第一类用户的置信度参数。本专利技术实施例还提供一种识别装置,所述装置包括:确定模块,用于确定待识别的符合预设条件的用户评论信息;分发模块,用于将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;获取模块,用于获取所述第一类用户终端返回的反馈信息;处理模块,用于基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的本文档来自技高网...

【技术保护点】
一种识别方法,其特征在于,所述方法包括:确定待识别的符合预设条件的用户评论信息;将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;获取所述第一类用户终端返回的反馈信息;基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用户对用户评论信息评价的可信度。

【技术特征摘要】
1.一种识别方法,其特征在于,所述方法包括:
确定待识别的符合预设条件的用户评论信息;
将所述待识别的符合预设条件的用户评论信息按照预设策略分发至第一类用户终端;
获取所述第一类用户终端返回的反馈信息;
基于反馈信息、以及做出所述反馈信息的第一类用户的置信度参数确定所述待识别的
符合预设条件的用户评论信息所属的类别;其中,所述置信度参数用于表示第一类用户对
用户评论信息评价的可信度。
2.根据权利要求1所述的方法,其特征在于,所述确定待识别的符合预设条件的用户评
论信息,包括:
获取待处理的用户评论信息;
对所述待处理的用户评论信息进行第一级检测处理,通过第一级检测处理过滤掉部分
不符合所述预设条件的用户评价信息;
将经所述第一级检测处理之后剩余的用户评论信息进行第二级检测处理;通过第二级
检测处理过滤掉部分不符合所述预设条件的用户评价信息,
确定经过所述第一级检测处理和第二检测处理过滤之后,剩余的所述用户评价信息并
确定待识别的符合预设条件的用户评论信息。
3.根据权利要求1所述的方法,其特征在于,所述确定待识别的符合预设条件的用户评
论信息,还包括:
接收第二类用户终端主动反馈的第二类用户认为符合预设条件的用户评论信息;
将第二类用户终端主动反馈的符合预设条件的用户评论信息归入到待识别的符合预
设条件的用户评论信息中。
4.根据权利要求2所述的方法,其特征在于,所述对所述待处理的用户评论信息进行第
一级检测处理,包括下述中的至少一种:
对发布用户评论信息的账号进行账号信息检测,若所述账号为符合第二预设条件的账
号,则拦截与所述符合第二预设条件的账号相关的评论操作;
对同一账号发布用户评论信息的频率进行记录,当超出一定频率时,直接对所述同一
账号在预设时间段内发布的用户评论信息进行拦截;
对用户评论信息进行内容检测,对含有预设特征的用户评论信息进行过滤。
5.根据权利要求2所述的方法,其特征在于,将经所述第一级检测处理之后剩余的用户
评论信息进行第二级检测处理,包括:
对于经所述第一级检测处理之后剩余的用户评论信息中的每一条用户评论信息,
利用M个不同的判断策略对每一条用户评论信息进行分析,生成M个判断结果;其中,所
述M为正整数,所述M个判断策略均能独立识别用户评论信息所属的类别;
在所述M个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结
果超出预设比例时,过滤掉所述用户评论信息;
在所述M个判断结果中,表征用户评论信息为符合预设条件的用户评论信息的判断结
果在预设比例范围内时,确定所述用户评论信息为符合预设条件的用户评论信息。
6.根据权利要求1所述的方法,其特征在于,所述将所述待识别的符合预设条件的用户
评论信息按照预设策略分发至第一类用户终端,包括:
获取第一类用户终端的状态信息以及第一类用户账号的配置信息;
基于所述第一类用户终端的状态信息以及所述第一类用户账号的配置信息确定可分
发的第一类用户终端的个数;
将所述待识别的符合预设条件的用户评论信息均衡分发至所述可分发的第一类用户
终端。
7.根据权利要求1所述的方法,其特征在于,所述基于反馈信息、以及做出所述反馈信
息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类
别,包括:
对于每一条待识别的符合预设条件的用户评论信息,
将第一种反馈信息的计算参数值赋值为第一数值,其中,所述第一数值为正数,所述第
一种反馈信息是用于表征用户评论信息所属类别为第一类别的反馈信息;
将第二种反馈信息的计算参数值赋值为第二数值,其中,第二数值为负数,所述第二种
反馈信息是用于表征用户评论信息所属类别为第二类别的反馈信息;
计算各条所述反馈信息的所述计算参数值及所述反馈信息对应的第一类用户的置信
度参数的乘积进行累加;
将各种反馈信息对应的数值与做出所述相应反馈信息的第一类用户的置信度参数的
乘积进行累加;
当累加值超出第一预设阈值,确定所述待识别的符合预设条件的用户评论信息所属类
别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别为第二类
别;和/或,
当累加值的均值超出第二预设阈值时,确定所述待识别的符合预设条件的用户评论信
息所属类别为第一类别;否则,确定所述待识别的符合预设条件的用户评论信息所属类别
为第二类别。
8.根据权利要求1所述的方法,其特征在于,所述基于反馈信息、以及做出所述反馈信
息的第一类用户的置信度参数确定所述待识别的符合预设条件的用户评论信息所属的类
别之后,所述方法还包括:
重新计算做出所述反馈信息的第一类用户的置信度参数;
基于重新计算得到的第一类用户的置信度参数对应更新所存储的第一类用户的置信
度参数。
9.根据权利要求8所述的方法,其特征在于,计算做出所述反馈信息的第一类用户的置
信度参数,包括:
获取与所述第一类用户相关的参数数据;其中,所述参数至少包括:报名课程数、评论
数、上课时间段、成功证实他人的非法评论数、自身评论被判定为非法评论数;

【专利技术属性】
技术研发人员:黄当武衡阵
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1