【技术实现步骤摘要】
多源多模态数据的处理系统及应用该系统的方法
本专利技术涉及网络安全与隐私保护领域的数据安全领域,具体涉及多源多模态数据的处理系统及应用该系统的方法。
技术介绍
随着移动互联网和人工智能技术的发展,企业收集和使用的数据来源越来越多样化,其中也涉及敏感的个人信息。这些个人信息以不同的数据格式或模态存储,例如文本格式的手机号码、图像格式的身份证件、音频格式的聊天记录、视频格式的监控记录。针对这些不同的数据格式及不同的业务应用场景,企业可能会采用不同的数据管理系统。多源多模态数据给敏感信息的识别、分类和保护带来了挑战。单一数据源或单模态的数据可能不是敏感信息,但多个不同数据源或数据格式的数据关联在一起时,则有可能重识别到敏感信息。现有技术采用单一数据源或数据格式的敏感信息,没有考虑对多源多模态数据进行融合来识别、分类和保护敏感信息。
技术实现思路
为了解决上述问题,本专利技术提供一种多源多模态数据的处理系统,解决现有技术中对多源多模态数据中个人信息漏识别或误识别、个人信息未脱敏或脱敏不充分的问题。 ...
【技术保护点】
1.多源多模态数据的处理系统,其特征在于,所述处理系统包括:多源多模态数据存储模块,策略控制模块,风险度量模块,数据发现引擎模块,数据脱敏引擎模块,多模态敏感数据分类算法库模块,多模态数据脱敏算法库模块和多源多模态数据访问总线模块;/n策略控制模块是用于实现敏感数据发现、风险度量和控制、数据脱敏的策略配置和自适应控制的模块;/n风险度量模块是基于敏感数据重识别风险模型,定量分析数据的重识别风险,为敏感数据发现和分类、数据脱敏提供风险度量和控制策略支持的模块;/n数据发现引擎模块是通过静态扫描或动态监测的方式,发现多源多模态数据存储模块中的或业务使用过程中访问的信息的模块;/ ...
【技术特征摘要】
1.多源多模态数据的处理系统,其特征在于,所述处理系统包括:多源多模态数据存储模块,策略控制模块,风险度量模块,数据发现引擎模块,数据脱敏引擎模块,多模态敏感数据分类算法库模块,多模态数据脱敏算法库模块和多源多模态数据访问总线模块;
策略控制模块是用于实现敏感数据发现、风险度量和控制、数据脱敏的策略配置和自适应控制的模块;
风险度量模块是基于敏感数据重识别风险模型,定量分析数据的重识别风险,为敏感数据发现和分类、数据脱敏提供风险度量和控制策略支持的模块;
数据发现引擎模块是通过静态扫描或动态监测的方式,发现多源多模态数据存储模块中的或业务使用过程中访问的信息的模块;
数据脱敏引擎模块是通过静态脱敏或动态脱敏的方式,实现对多源多模态数据存储模块中的敏感数据进行脱敏或在业务使用过程中对访问的敏感数据进行实时脱敏或拦截的模块;
多模态敏感数据分类算法库模块是为不同模态数据提供敏感数据识别和分类的核心算法的模块;
多源多模态数据存储模块实现不同格式的数据存储和索引的模块;和
多源多模态数据访问总线模块为上述其它模块提供了访问多源多模态数据存储模块的接口,实现多源多模态数据的读取、解析和写入。
2.根据权利要求1所述的处理系统,其特征在于,所述多源多模态数据是与自然人相关的个人信息数据、与企业生产经营和内部管理相关的知识产权及商业秘密信息数据、与国计民生及公共利益相关的重要数据、关系国家安全及重大利益的国家秘密信息数据。
3.根据权利要求1所述的处理系统,其特征在于,所述多源多模态数据是存储在多种类型的数据库或数据源中的数据。
4.根据权利要求1所述的处理系统,其特征在于,所述多源多模态数据是文本、音频和/或图像单模态数据组合形成的视频多模态数据,或者是文本和图像单模态数据组合形成条形码多模态数据。
5.根据权利要求1所述的处理系统,其特征在于,各个模块集中部署在同一台主机上,或者分布式部署在不同的主机上。
6.应用根据权利要求1-5任一所述的处理...
【专利技术属性】
技术研发人员:丁晓强,张仁卓,
申请(专利权)人:北京尚隐科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。