【技术实现步骤摘要】
内容数据的处理方法、装置、计算机设备和存储介质
[0001]本申请涉及互联网
,特别是涉及一种内容数据的处理方法、装置、计算机设备和存储介质。
技术介绍
[0002]随着互联网技术的发展,各用户能够通过内容公开社区或者公开平台上发送相关展示内容,而敏感产业信息以及敏感内容发送展示会影响到公共社区以及平台上其他用户的使用体验,因此,需要对各用户所发送的内容进行异常评估。
[0003]目前,可以对社区内容进行随机抽样,对抽样出来的数据通过人工标注的方式构建异常内容数据样本集合,再通过各异常内容数据样本与内容数据的比较确定具有异常的内容数据,然后对内容数据进行删除等处理。然而,抽样误差较大可能会遗漏部分异常数据,且由于人工标注存在一定误差性以及异常内容滞后性,由此会降低对内容数据的异常评估的准确度,通过准确度较低的异常评估结果会降低对内容数据处理的准确度。因此,如何保证对内容数据的处理的准确度是亟需解决的问题。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提升对内容数据的处理 ...
【技术保护点】
【技术特征摘要】
1.一种内容数据的处理方法,其特征在于,包括:获取目标对象所发送的待处理内容数据、以及所述目标对象的对象信息,所述待处理内容数据包括待处理文本内容数据以及待处理图像内容数据,且所述待处理文本内容数据通过文本内容数据以及图像内容数据共同生成的,所述对象信息至少包括:对象标识信息以及历史行为信息;对所述待处理内容数据进行异常检测,得到内容异常参数,所述内容异常参数为评估所述待处理内容数据为异常内容数据的参数;对所述对象信息进行异常判定,得到对象异常参数,所述对象异常参数为评估所述目标对象为异常对象的参数;基于所述内容异常参数与所述对象异常参数,对所述待处理内容数据进行处理。2.根据权利要求1所述的方法,其特征在于,所述获取目标对象所发送的待处理内容数据,包括:获取所述目标对象所发送的初始内容数据,所述初始内容数据包括初始文本内容数据以及初始图像内容数据;对所述初始图像内容数据进行文本识别,获取所述初始图像内容数据中的图像文本内容数据;通过所述初始文本内容数据以及所述图像文本内容数据,生成所述待处理文本内容数据;确定所述初始图像内容数据为所述待处理图像内容数据。3.根据权利要求1所述的方法,其特征在于,所述对所述待处理内容数据进行异常检测,得到内容异常参数,包括:获取历史异常内容数据集合;计算所述历史异常内容数据集合中各所述历史异常内容数据,与所述待处理内容数据之间的内容相似度;通过所述内容相似度确定所述内容异常参数。4.根据权利要求3所述的方法,其特征在于,所述获取历史异常内容数据集合,包括:构建异常内容先进先出队列,所述异常内容先进先出队列的长度由所述历史异常内容数据集合中历史异常内容数据的预设数量设定;获取待列入历史异常内容数据,并识别所述异常内容先进先出队列的队列状态;若所述队列状态为所述异常内容先进先出队列未满,将所述待列入历史异常内容数据记录至所述异常内容先进先出队列中;若所述队列状态为所述异常内容先进先出队列已满,将所述异常内容先进先出队列中处于队列头的历史异常内容数据移除,并将所述待列入历史异常内容数据至所述异常内容先进先出队列中;通过异常内容先进先出队列中所包括的历史异常内容数据,构建所述历史异常内容数据集合。5.根据权利要求1所述的方法,其特征在于,所述对所述对象信息进行异常判定,得到对象异常参数,包括:获取多个历史异常内容数据,并确定发送各所述历史异常内容数据的对象的异常对象
标识信息;将所述对象信息中的对象标识信息与各所述异常对象标识信息进行标识对比,以得到所述对象标识信息的异常标识对比结果;通过所述异常标识比对结果确定对象标识异常参数,所述对象标识异常参数属于所述对象异常参数。6.根据权利要求5所述的方法,其特征在于,所述确定发送各所述历史异常内容数据的对象的异常对象标识信息,包括:构建异常标识先进先出队列,所述异常标识先进先出队列的长度由各所述异常对象标识信息的预设总数量设定;获取待列入异常对象标识信息,并识别所述异常标识先进先出队列的队列状态;若所述队列状态为所述异常标识先进先出队列未满,将所述待列入异常对象标识信息记录至所述异常标识先进先出队列中;若所述队列状态为所述异常标识先进先出队列已满,将所述异常标识先进先出队列中处于队列头的异常对象标识信息移除,并将所述待列入异常对象标识信息至...
【专利技术属性】
技术研发人员:张程,李金洋,余磊,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。