【技术实现步骤摘要】
基于语义分析的敏感数据识别方法和系统
[0001]本申请涉及网络多媒体领域,尤其涉及一种基于语义分析的敏感数据识别的方法和系统。
技术介绍
[0002]数据安全越来越得到企业的重视,其中敏感数据的保护尤其重要。现有技术主要使用关键字和正则表达式来匹配敏感数据,但是却无法匹配无固定格式的信息,需要引入语义分析辅助识别。
[0003]同时,随着网络视频多媒体的快速发展,敏感数据的范畴也突破了传统的定义范畴,也开始包括视频等多媒体数据类型。
[0004]因此,急需一种针对性的基于语义分析的敏感数据识别的方法和系统。
技术实现思路
[0005]本专利技术的目的在于提供一种基于语义分析的敏感数据识别的方法和系统,通过计算每一帧的直方图在梯度方向的特征值,得到特征值跳跃点,使用标签进行标注,将标签后一时刻的帧并行输入语义分析模型和图形分析模型,判断多媒体数据流是否涉及敏感,进而限制敏感数据的使用。
[0006]第一方面,本申请提供一种基于语义分析的敏感数据识别的方法,所述方法包括:
[00 ...
【技术保护点】
【技术特征摘要】
1.一种基于语义分析的敏感数据识别方法,其特征在于,所述方法包括:获取多媒体数据流,计算每一帧的直方图在梯度方向的特征值,当所述帧与帧之间的所述特征值之差大于预设的阈值时,判定该帧与帧之间出现特征值跳跃,并在该帧与帧之间插入标签,所述标签用于标注特征值跳跃的点;根据所述标签,提取标签后一时刻的帧,将其输入语义分析模型,分析该帧中包含的文字信息,获取文本字符的字段值,调用分词器将所述字段值分解为单词和单词属性,将所述单词和单词属性与词库进行匹配,判定出字段值是否为地址、姓名或公司名称,得出第一判断结果;将所述标签后一时刻的帧,并行输入图形分析模型,识别该帧中包含的物体信息,获取关键物体特征,判断该帧是否包括敏感的图形内容、以及所述物体信息是否与所述第一判断结果匹配,得出第二判断结果;根据所述第一判断结果和第二判断结果,确定所述标签后一时刻的帧是否涉及敏感,如果是则将当前标签与下一个标签之间的一段多媒体数据流判定为敏感数据;反之则判定当前标签与下一个标签之间的一段多媒体数据流不涉及敏感数据,允许...
【专利技术属性】
技术研发人员:苏长君,曾祥禄,
申请(专利权)人:北京智美互联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。