多模态数据的敏感词过滤方法、装置、设备及介质制造方法及图纸

技术编号:45859673 阅读:14 留言:0更新日期:2025-07-19 11:17
本发明专利技术提供一种多模态数据的敏感词过滤方法、装置、设备及介质,涉及敏感词过滤技术领域,所述方法包括:获取包括文本数据及多种非文本数据的多模态数据;采用预设转换方法分别对各非文本数据进行文本转换,得到目标文本数据;将各目标文本数据及文本数据分别确定为待脱敏数据;获取敏感词库,基于敏感词库,采用预设脱敏算法分别对各待脱敏数据进行脱敏处理,得到对应的目标数据。本发明专利技术实现了脱敏多模态数据,有效减少了敏感信息的传播,提升了多媒体数据的监管力度。

【技术实现步骤摘要】

本专利技术涉及敏感词过滤,尤其涉及一种多模态数据的敏感词过滤方法、装置、设备及介质


技术介绍

1、多模态数据是指结合了多种不同类型的数据信息,其涉及的数据类型包括但不限于文本、图像、视频、音频等。敏感词过滤技术作为网络安全领域中用于识别和过滤特定信息的重要技术手段,其目的是为了防止不良信息的传播。现有技术缺乏对多模态数据的敏感词过滤方法。


技术实现思路

1、有鉴于此,本专利技术的目的是为了克服现有技术中的不足,提供一种多模态数据的敏感词过滤方法、装置、设备及介质。本专利技术提供如下技术方案:

2、第一方面,本专利技术提供一种多模态数据的敏感词过滤方法,所述方法包括:获取多模态数据,所述多模态数据包括:文本数据及多种非文本数据;采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据;将所述文本数据及各所述目标文本数据分别确定为待脱敏数据;获取敏感词库,基于所述敏感词库,采用预设脱敏算法分别对各所述待脱敏数据进行脱敏处理,得到对应的目标数据。

3、在一实施方式中,多种所述非本文档来自技高网...

【技术保护点】

1.一种多模态数据的敏感词过滤方法,其特征在于,所述方法包括:

2.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:图像数据,所述图像数据包括:至少一张待识别图像,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:

3.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:音频数据,所述音频数据包括:至少一个音频文件,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:

4.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在...

【技术特征摘要】

1.一种多模态数据的敏感词过滤方法,其特征在于,所述方法包括:

2.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:图像数据,所述图像数据包括:至少一张待识别图像,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:

3.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:音频数据,所述音频数据包括:至少一个音频文件,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:

4.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:视频数据,所述视频数据包括:至少一个视频文件,所述采用预设转换方法进行文本转换处理,得到目标文本数据,包括:

5.根据权利要求2或4所述的多模态数据的敏感词过滤方法,其特征在于,所...

【专利技术属性】
技术研发人员:侯小阳朱旭芳张晓胡献君胡秋月刘树衎梁镇彬柯翰键
申请(专利权)人:中国人民解放军海军工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1