【技术实现步骤摘要】
风险内容识别方法、装置、设备、介质和计算机程序产品
[0001]本公开涉及人工智能
,尤其涉及大数据和自然语言处理技术领 域。具体地,本公开提供了一种风险内容识别方法、装置、电子设备、计算 机可读存储介质和计算机程序产品。
技术介绍
[0002]随着互联网技术的发展,互联网平台所提供的内容越来越多,用户也可 以越来越方便地访问这些内容。因此,需要及时识别存在风险的内容,并进 行相应的处理,以避免存在风险的内容扩散而带来不良后果。
[0003]目前主要采用以下两种方法来识别风险内容:
[0004]1)人工审核:随机抽取内容,供审核员进行审核,以判断内容的质量, 但是,由于人工审核的速度较慢,人工审核效率较低;
[0005]2)词表匹配:对内容的标题或正文进行切词,并且判断该内容是否含有 风险词表中的词汇,但是,由于同一词汇在不同语境中具有不同的含义,使 用词表匹配的误判率较高。
[0006]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另 有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被 认为是现有技术。类似地,除非另有指明,否则此部分中提及的问题不应认 为在任何现有技术中已被公认。
技术实现思路
[0007]本公开提供了一种风险内容识别方法、装置、电子设备、计算机可读存 储介质和计算机程序产品。
[0008]根据本公开的一方面,提供了一种计算机实施的风险内容识别方法,包 括:每间隔第一周期执行如下操作:获取待识别内容在当前周 ...
【技术保护点】
【技术特征摘要】
1.一种计算机实施的风险内容识别方法,包括:每间隔第一周期执行如下操作:获取待识别内容在当前周期内的用户负反馈;对于每条用户负反馈,确定该用户负反馈的反馈类型和用户可信度;至少部分地基于所述在当前周期内的用户负反馈的反馈类型和用户可信度,计算所述待识别内容的当前周期的周期评分;基于所述待识别内容在至少一个第一周期内的周期评分和对应周期衰减系数,计算所述待识别内容的内容评分;以及响应于确定所述待识别内容的内容评分大于评分阈值,识别所述待识别内容为风险内容。2.如权利要求1所述的风险内容识别方法,其中,所述至少部分地基于所述在当前周期内的用户负反馈的反馈类型和用户可信度,计算所述待识别内容的当前周期的周期评分包括:对于每条用户负反馈,将所述反馈类型所对应的权重乘以所述用户可信度,得到该条用户负反馈的部分周期评分;将多条用户负反馈的部分周期评分相加,得到所述待识别内容的当前周期的周期评分。3.如权利要求2所述的风险内容识别方法,还包括:使用已校准的风险内容识别结果,调整所述反馈类型所对应的权重。4.如权利要求1所述的风险内容识别方法,还包括:对所述待识别内容进行内容理解,得到所述待识别内容的内容理解类型和内容理解评分;对所述待识别内容进行切词分析,得到所述待识别内容的切词分析类型和切词分析评分;其中,所述至少部分地基于所述在当前周期内的用户负反馈的反馈类型和用户可信度,计算所述待识别内容的当前周期的周期评分包括:基于所述在当前周期内的用户负反馈的反馈类型和用户可信度、所述内容理解类型、所述内容理解评分、所述切词分析类型和所述切词分析评分,计算所述待识别内容的当前周期的周期评分。5.如权利要求4所述的风险内容识别方法,其中,所述基于所述在当前周期内的用户负反馈的反馈类型和用户可信度、内容理解评分、切词分析类型和切词分析评分,计算所述待识别内容的当前周期的周期评分包括:对于每条用户负反馈,将所述反馈类型所对应的权重乘以所述用户可信度,得到该条用户负反馈的部分周期评分;将所述内容理解评分乘以所述内容理解类型所对应的权重,得到所述内容理解的部分周期评分;将所述切词分析评分乘以所述切词分析类型所对应的权重,得到所述切词分析的部分周期评分;将多条用户负反馈的部分周期评分、所述内容理解的部分周期评分和所述切词分析的
部分周期分析相加,得到所述待识别内容的当前周期的周期评分。6.如权利要求5所述的风险内容识别方法,还包括:使用已校准的风险内容识别结果,调整所述反馈类型、所述内容理解类型和所述切词分析类型所对应的权重。7.如权利要求4所述的风险内容识别方法,在所述至少部分地基于所述在当前周期内的用户负反馈的反馈类型和用户可信度,计算所述待识别内容的当前周期的周期评分之前,还包括:响应于确定所述待识别内容的切词分析评分大于所述切词评分阈值且所述待识别内容的作者属于白名单成员,降低所述待识别内容的切词分析评分。8.如权利要求1
‑
7中任一项所述的风险内容识别方法,其中,所述获取待识别内容在当前周期内的用户负反馈包括:获取所述待识别内容在该当前周期内的用户显式负反馈和用户隐式负反馈;其中,所述用户显式反馈包括用户举报和用户负面评论,所述用户隐式反馈包括用户屏蔽反馈。9.如权利要求1
‑
7中任一项所述的风险内容识别方法,其中,所述基于所述待识别内容在至少一个第一周期内的周期评分和对应...
【专利技术属性】
技术研发人员:杨松艳,陈妍佳,王宇婷,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。