System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 内容审查方法、装置、设备以及存储介质制造方法及图纸_技高网

内容审查方法、装置、设备以及存储介质制造方法及图纸

技术编号:40751179 阅读:6 留言:0更新日期:2024-03-25 20:07
本申请公开了一种内容审查方法、装置、设备以及存储介质,属于内容审查技术领域。该方法包括获取待审查数据;其中,待审查数据包括文本数据、图像数据、视频数据、语音数据和文件数据中的至少一种;将待审查数据转换为文本格式数据和/或图像格式数据;分别对文本格式数据和图像格式数据进行审查,获得内容审查结果。本申请可以提供一种多模态的内容审查方法。

【技术实现步骤摘要】

本申请涉及内容审查,尤其涉及一种内容审查方法、装置、设备以及存储介质


技术介绍

1、在相关技术中,针对财富营销内容等的合规审查的技术应用一般是基于开源深度学习模型进行自动化审核,但开源深度学习模型端到端的识别能力受限于模型结构,往往只能处理文本或者图片中的一种内容形式,不具备多模态内容审核能力。


技术实现思路

1、本申请的主要目的在于提供一种内容审查方法、装置、设备以及存储介质,旨在提供一种多模态的内容审核方法。

2、为实现上述目的,本申请提供一种内容审查方法,所述内容审查方法包括以下步骤:

3、获取待审查数据;其中,待审查数据包括文本数据、图像数据、视频数据、语音数据和文件数据中的至少一种;

4、将待审查数据转换为文本格式数据和/或图像格式数据;

5、分别对文本格式数据和图像格式数据进行审查,获得内容审查结果。

6、可选地,将待审查数据转换为文本格式数据,包括:

7、对文本数据进行预置标准化处理,获得文本格式数据;其中,预置标准化处理包括中文分词、词向量化、繁简转换、拼音转换和符号转义中的至少一种;

8、基于光学字符识别技术提取图像数据中的文字信息,获得文本格式数据;将语音数据转化为文本片段,获得文本格式数据;和/或

9、提取文件数据中的文本信息,获得文本格式数据。

10、可选地,将待审查数据转换为图像格式数据,包括:

11、对图像数据进行标准化处理,获得图像格式数据;

12、基于预设抽取间隔帧数对视频数据的视频帧序列中的视频帧进行抽取,获得抽取帧序列,将抽取帧序列作为图像格式数据;和/或

13、提取文件数据中的图像信息,获得图像格式数据。

14、可选地,对文本格式数据进行审查,获得内容审查结果,包括:

15、通过第一预设通用审核模型对文本格式数据进行违规内容审核,获得第一文本审核结果;

16、通过第一预设行业定制模型对文本格式数据进行行业违规内容审核,获得第二文本审核结果;

17、通过第一预设业务需求模型对文本格式数据进行业务规则违规审核,获得第三文本审核结果;

18、基于第一文本审核结果、第二文本审核结果和第三文本审核结果,获得文本格式数据的内容审查结果。

19、可选地,通过第一预设业务需求模型对文本格式数据进行业务规则违规审核,获得第三文本审核结果,包括:

20、通过机器规则对文本格式数据进行审查,获得第一业务规则审查结果;其中,第一业务规则审查结果包括黑白名单、用户策略和业务豁免审查结果;

21、通过机器规则和深度学习模型对文本数据进行审查,获得第二业务规则审查结果;其中,第二业务规则审查结果包括广告法、消保策略和营销话术审查结果;

22、基于第一业务规则审查结果和第二业务规则审查结果,获得第三文本审核结果。

23、可选地,对图像格式数据进行审查,获得内容审查结果,包括:

24、通过第二预设通用审核模型对图像格式数据进行违规内容审核,获得第一图像审核结果;

25、通过第二预设行业定制模型对图像格式数据进行行业违规内容审核,获得第二图像审核结果;

26、通过第二预设业务需求模型对图像格式数据进行业务规则违规审核,获得第三图像审核结果;

27、基于第一图像审核结果、第二图像审核结果和第三图像审核结果,获得图像格式数据的内容审查结果。

28、可选地,将待审查数据转换为文本格式数据和/或图像格式数据之后,该方法还包括:

29、将文本数据或图像数据转化为特征向量;

30、将特征向量与预设特征向量进行相似度匹配,获得匹配结果;其中,预设特征向量由不可规范化预设业务规则转化得到;

31、基于匹配结果,获得内容审查结果。

32、此外,为实现上述目的,本申请还提出一种内容审查装置,该内容审查装置包括:

33、获取模块,用于获取待审查数据;

34、转换模块,用于待审查数据转换为文本格式数据和/或图像格式数据;

35、审查模块,用于分别对文本格式数据和图像格式数据进行审查,获得内容审查结果。

36、此外,为实现上述目的,本申请还提出一种内容审查设备,该内容审查设备包括:处理器,存储器以及存储在所述存储器中的计算机程序,所述计算机程序被所述处理器运行时实现所述内容审查方法的步骤。

37、此外,为实现上述目的,本申请还提出一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现所述的内容审查方法。

38、本申请提供的内容审查方法中,可以获取待审查数据;其中,该待审查数据包括文本数据、图像数据、视频数据、语音数据和文件数据中的至少一种;将待审查数据转换为文本格式数据和/或图像格式数据;再分别对文本格式数据和图像格式数据进行审查,从而可以获得内容审查结果。本方法可以将文本、图像、视频、语音和文件等多模态的数据转换为特定输入的文本格式数据和图像格式数据,再对转化后的文本格式数据和图像格式数据分别进行审查处理,从而可以实现多模态数据形式的内容审核。

本文档来自技高网...

【技术保护点】

1.一种内容审查方法,其特征在于,所述方法包括:

2.根据权利要求1所述的内容审查方法,其特征在于,所述将所述待审查数据转换为文本格式数据,包括:

3.根据权利要求1或2所述的内容审查方法,其特征在于,所述将所述待审查数据转换为图像格式数据,包括:

4.根据权利要求1所述的内容审查方法,其特征在于,所述对所述文本格式数据进行审查,获得内容审查结果,包括:

5.根据权利要求4所述的内容审查方法,其特征在于,所述通过第一预设业务需求模型对所述文本格式数据进行业务规则违规审核,获得第三文本审核结果,包括:

6.根据权利要求1所述的内容审查方法,其特征在于,所述对所述图像格式数据进行审查,获得内容审查结果,包括:

7.根据权利要求1所述的内容审查方法,其特征在于,所述将所述待审查数据转换为文本格式数据和/或图像格式数据之后,所述方法还包括:

8.一种内容审查装置,其特征在于,所述装置包括:

9.一种内容审查设备,其特征在于,包括:处理器,存储器以及存储在所述存储器中的计算机程序,所述计算机程序被所述处理器运行时实现如权利要求1至7中任一项所述内容审查方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的内容审查方法。

...

【技术特征摘要】

1.一种内容审查方法,其特征在于,所述方法包括:

2.根据权利要求1所述的内容审查方法,其特征在于,所述将所述待审查数据转换为文本格式数据,包括:

3.根据权利要求1或2所述的内容审查方法,其特征在于,所述将所述待审查数据转换为图像格式数据,包括:

4.根据权利要求1所述的内容审查方法,其特征在于,所述对所述文本格式数据进行审查,获得内容审查结果,包括:

5.根据权利要求4所述的内容审查方法,其特征在于,所述通过第一预设业务需求模型对所述文本格式数据进行业务规则违规审核,获得第三文本审核结果,包括:

6.根据权利要求1所述的内容审查方法,其特征在于,所...

【专利技术属性】
技术研发人员:柳畅陈礼和郑海伦
申请(专利权)人:招商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1