【技术实现步骤摘要】
本专利技术涉及敏感词过滤,尤其涉及一种多模态数据的敏感词过滤方法、装置、设备及介质。
技术介绍
1、多模态数据是指结合了多种不同类型的数据信息,其涉及的数据类型包括但不限于文本、图像、视频、音频等。敏感词过滤技术作为网络安全领域中用于识别和过滤特定信息的重要技术手段,其目的是为了防止不良信息的传播。现有技术缺乏对多模态数据的敏感词过滤方法。
技术实现思路
1、有鉴于此,本专利技术的目的是为了克服现有技术中的不足,提供一种多模态数据的敏感词过滤方法、装置、设备及介质。本专利技术提供如下技术方案:
2、第一方面,本专利技术提供一种多模态数据的敏感词过滤方法,所述方法包括:获取多模态数据,所述多模态数据包括:文本数据及多种非文本数据;采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据;将所述文本数据及各所述目标文本数据分别确定为待脱敏数据;获取敏感词库,基于所述敏感词库,采用预设脱敏算法分别对各所述待脱敏数据进行脱敏处理,得到对应的目标数据。
3、在一实
...【技术保护点】
1.一种多模态数据的敏感词过滤方法,其特征在于,所述方法包括:
2.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:图像数据,所述图像数据包括:至少一张待识别图像,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:
3.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:音频数据,所述音频数据包括:至少一个音频文件,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:
4.根据权利要求1所述的多模态数据的敏感
...【技术特征摘要】
1.一种多模态数据的敏感词过滤方法,其特征在于,所述方法包括:
2.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:图像数据,所述图像数据包括:至少一张待识别图像,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:
3.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:音频数据,所述音频数据包括:至少一个音频文件,所述采用预设转换方法分别对各所述非文本数据进行文本转换,得到目标文本数据,包括:
4.根据权利要求1所述的多模态数据的敏感词过滤方法,其特征在于,多种所述非文本数据包括:视频数据,所述视频数据包括:至少一个视频文件,所述采用预设转换方法进行文本转换处理,得到目标文本数据,包括:
5.根据权利要求2或4所述的多模态数据的敏感词过滤方法,其特征在于,所...
【专利技术属性】
技术研发人员:侯小阳,朱旭芳,张晓,胡献君,胡秋月,刘树衎,梁镇彬,柯翰键,
申请(专利权)人:中国人民解放军海军工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。