内容审核方法、装置、电子设备及存储介质制造方法及图纸

技术编号:33556923 阅读:15 留言:0更新日期:2022-05-26 22:53
本申请实施例提供了一种内容审核方法、装置、电子设备及存储介质,该方法包括:获取待审核的目标内容工单,其中,所述目标内容工单中包括至少一种类型的内容数据;分别对所述至少一种类型的内容数据进行特征提取处理,获得与所述目标内容工单对应的第一特征数据和第二特征数据;将所述第一特征数据和所述第二特征数据与历史内容工单的特征数据进行相似度匹配,获得匹配结果;根据所述匹配结果,对所述目标内容工单进行审核处理,以获得目标审核结果。该方法可以目标审核结果的准确性以及降低审核系统的系统压力,保障系统稳定运行。保障系统稳定运行。保障系统稳定运行。

【技术实现步骤摘要】
内容审核方法、装置、电子设备及存储介质


[0001]本公开实施例涉及互联网
,更具体地,涉及一种内容审核方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]目前,为避免内容数据的违规发布,通常在对业务系统推送的内容工单进行审核处理时,会将内容工单中内容数据与系统中已经发布的历史内容数据进行相似度计算,以根据相似度匹配结果,确定针对该内容工单的审核结果,其中,在针对内容数据进行相似度计算时,通常或是基于两者的MD5值来进行相似度匹配,或是通过计算两者的余弦相似度(Cosinesimilarity)来进行相似度匹配。
[0003]然而,上述针对内容工单进行审核的方法一方面由于是基于较为单一的方法进行相似度匹配,因此,其一方面存在准确度低的问题,另一方面还存在计算复杂度高以及普适性差的问题。

技术实现思路

[0004]本公开的一个目的是提供一种用于审核内容工单的新的技术方案,以方便、准确的对内容工单进行审核处理。
[0005]本公开的第一方面,提供了一种内容审核方法,所述方法包括:
[0006]获取待审核的目标内容工单,其中,所述目标内容工单中包括至少一种类型的内容数据;
[0007]分别对所述至少一种类型的内容数据进行特征提取处理,获得与所述目标内容工单对应的第一特征数据和第二特征数据;
[0008]将所述第一特征数据和所述第二特征数据与历史内容工单的特征数据进行相似度匹配,获得匹配结果;
[0009]根据所述匹配结果,对所述目标内容工单进行审核处理,以获得目标审核结果。
[0010]本公开的第二方面,提供了一种内容审核装置,所述装置包括:
[0011]获取模块,用于获取待审核的目标内容工单,其中,所述目标内容工单中包括至少一种类型的内容数据;
[0012]特征提取模块,用于分别对所述至少一种类型的内容数据进行特征提取处理,获得与所述目标内容工单对应的第一特征数据和第二特征数据;
[0013]相似度匹配模块,用于将所述第一特征数据和所述第二特征数据与历史内容工单的特征数据进行相似度匹配,获得匹配结果;
[0014]审核处理模块,用于根据所述匹配结果,对所述目标内容工单进行审核处理。
[0015]本公开的第三方面,还提供了一种电子设备,包括:
[0016]存储器,用于存储可执行的指令;
[0017]处理器,用于根据所述指令的控制运行所述电子设备执行本公开的第一方面所述
的内容审核方法。
[0018]本公开的第四方面,还提供了一种计算机可读存储介质的,所述计算机可读存储介质存储有可被计算机读取执行的计算机程序,所述计算机程序用于在被所述计算机读取运行时,执行根据本公开的第一方面所述的内容审核方法。
[0019]本公开实施例的一个有益效果在于,根据本公开的实施例,在获取到目标内容工单之后,通过分别对该目标内容工单中不同类型的内容数据进行特征提取处理,以及,根据获得的第一特征数据和第二特征数据与历史内容工单的特征数据进行相似度匹配,并根据获得的匹配结果对目标内容工单进行审核出来,可以解决现有基于单一的相似度匹配方法以确定审核结果时可能存在的准确度不够以及普适性差的问题,从而提升目标审核结果的准确性以及降低审核系统的系统压力,保障系统稳定运行。
[0020]通过以下参照附图对本说明书的示例性实施例的详细描述,本说明书的其它特征及其优点将会变得清楚。
附图说明
[0021]被结合在说明书中并构成说明书的一部分的附图示出了本说明书的实施例,并且连同其说明一起用于解释本说明书的原理。
[0022]图1是本公开实施例提供的一种内容审核方法的流程示意图。
[0023]图2是本公开实施例提供的内容审核处理的框架示意图。
[0024]图3是本公开实施例提供的内容数据相似度处理的框架示意图。
[0025]图4是本公开实施例提供的内容审核装置的原理框图。
[0026]图5是本公开实施例提供的电子设备的硬件结构示意图。
具体实施方式
[0027]现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本专利技术的范围。
[0028]以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本专利技术及其应用或使用的任何限制。
[0029]对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0030]在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
[0031]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0032]<方法实施例>
[0033]目前,针对用户生产的内容数据,在用户申请发布该内容数据时,响应于用户的发布操作,终端设备会根据用户的用户标识、国际码、语言码等,对应生产包含该内容数据的内容工单,并将该内容工单发送至审核系统进行审核,以避免用户违规发布内容数据。在相关技术中,审核系统在接收到待审核的内容工单之后,一般是计算该内容工单中内容数据
的MD5值,例如,计算内容数据中文字、图像URL、视频URL的MD5值,并基于该MD5值,查询已经发布的历史内容工单中是否包含相同内容数据;或者是使用余弦相似度算法计算内容工单中内容数据与历史内容工单中的内容数据的相似度;若历史内容工单中存在与当前待审核的内容工单相同或相似的内容数据,则将对应历史内容工单的审核结果作为当前内容工单的审核结果。
[0034]然而,在通过比较MD5值以对内容数据进行相似度匹配时,其匹配方法通常较为单一,即,只有完全相同的内容该种方法才会认为两者相同,而对于相似内容该种方法均会认为两者不同。例如,针对文本“hi”和“hi”,两者实际是相似的,但是基于比较MD5值的方式对两者进行相似度匹配,则会判定为两者不同,即,两者不匹配,这明显与实际不符。另外,在基于余弦相似度算法对内容数据进行相似度匹配时,其计算复杂度往往较高,不适合匹配长文本等内容。
[0035]为解决上述问题,本公开的实施例提供了一种内容审核方法,请参看图1,其是本公开实施例提供的内容审核方法的流程示意图。该方法可以由电子设备实施,该电子设备具体可以为服务器,当然,根据需要,也可以将该方法应用于终端设备中,此处不作特殊限定。
[0036]如图1所述,本实施例的方法可以包括如下步骤S1100

S1400,以下予以详细说明。
[0037]步骤S1100,获取待审核的目标内容工单,其中,所述目标内容工单中包括至少一种类型的内容数据。
[003本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内容审核方法,其特征在于,包括:获取待审核的目标内容工单,其中,所述目标内容工单中包括至少一种类型的内容数据;分别对所述至少一种类型的内容数据进行特征提取处理,获得与所述目标内容工单对应的第一特征数据和第二特征数据;将所述第一特征数据和所述第二特征数据与历史内容工单的特征数据进行相似度匹配,获得匹配结果;根据所述匹配结果,对所述目标内容工单进行审核处理,以获得目标审核结果。2.根据权利要求1所述的方法,其特征在于,所述分别对所述至少一种类型的内容数据进行特征提取处理,获得与所述目标内容工单对应的第一特征数据和第二特征数据,包括:对所述至少一种类型的内容数据进行数据清洗处理;基于预设散列算法对所述进行数据清洗处理后的内容数据分别进行散列计算,并将计算得到的至少一个散列值作为所述第一特征数据;以及,分别对所述进行数据清洗处理后的至少一种类型的内容数据进行对应类型的特征提取处理,以获得所述第二特征数据;其中,所述类型包括以下至少一项:文本、图像、视频、音频,所述第二特征数据包括以下至少一项:与文本类型的内容数据对应的simhash值、与图像类型的内容数据和视频类型的内容数据对应的方向梯度直方图特征向量、与音频类型的内容数据对应的梅尔频率倒谱系数特征向量。3.根据权利要求2所述的方法,其特征在于,所述将所述第一特征数据和所述第二特征数据与历史内容工单的特征数据进行相似度匹配,获得匹配结果,包括:通过确定第一数据库中是否存在与所述第一特征数据相同的历史特征数据,获得第一匹配结果,其中,所述第一数据库用于存储历史内容工单的第一特征数据;在所述第一匹配结果表示未匹配成功的情况下,通过确定第二数据库中是否存在与所述第二特征数据相似的历史特征数据,获得第二匹配结果,其中,所述第二数据库用于存储历史内容工单的第二特征数据。4.根据权利要求3所述的方法,其特征在于,所述根据所述匹配结果,对所述目标内容工单进行审核处理,以获得目标审核结果,包括:在所述第一匹配结果或者所述第二匹配结果表示匹配成功的情况下,获取匹配历史内容工单的审核结果作为所述目标审核结果,其中,所述匹配历史内容工...

【专利技术属性】
技术研发人员:张钧辉
申请(专利权)人:百果园技术新加坡有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1