当前位置: 首页 > 专利查询>中山大学专利>正文

一种物联网设备敏感数据的识别方法、装置及电子设备制造方法及图纸

技术编号:36191903 阅读:46 留言:0更新日期:2022-12-31 21:09
本发明专利技术公开了一种物联网设备敏感数据的识别方法、装置及电子设备,方法包括:从物联网设备的描述文本信息中提取多个物联网敏感数据项并构建物联网敏感语义词典;根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,物联网代码块与物联网设备在语义上相关;根据物联网敏感语义词典识别出各物联网代码块中包含的若干物联网敏感数据点,物联网敏感数据点是与物联网设备语义相关的文本标签;从物联网应用程序的源代码中查找到与各物联网敏感数据点对应的别名标签组,将所有别名标签和所有物联网敏感数据点关联的程序变量作为物联网设备敏感数据。本发明专利技术能够支持大规模、自动化、高效准确地识别出物联网设备所包含的敏感数据。含的敏感数据。含的敏感数据。

【技术实现步骤摘要】
一种物联网设备敏感数据的识别方法、装置及电子设备


[0001]本专利技术涉及数据处理
,尤其是涉及一种物联网设备敏感数据的识别方法、装置及电子设备。

技术介绍

[0002]伴随着移动互联网的快速发展,移动终端如智能手机成为各类智能设备的管理终端。物联网设备借助移动应用,实现配对、连接、管理等功能。在与智能手机交互的过程中,涉及了大量的物联网设备敏感数据。
[0003]现有分析物联网设备敏感数据的方法中,研究者往往采用动态运行的方式,收集物联网设备的通信流量,分析物联网设备所涉及的敏感数据。这类方法主要缺点在于:物联网设备硬件获取成本高昂,难以进行大规模的分析;数据交互行为依赖于特定场景触发,难以覆盖全面;数据加密,难以解析敏感数据。

技术实现思路

[0004]本专利技术的目的是提供一种物联网设备敏感数据的识别方法、装置及电子设备,以解决现有技术在识别物联网设备敏感数据的过程中难以自动化、大规模进行的技术问题。
[0005]本专利技术的目的,可以通过如下技术方案实现:
[0006]一种物联网设备敏感数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种物联网设备敏感数据的识别方法,其特征在于,包括:从物联网设备的描述文本信息中提取多个物联网敏感数据项,根据所述多个物联网敏感数据项构建物联网敏感语义词典;根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块,所述物联网代码块与所述物联网设备在语义上相关;根据所述物联网敏感语义词典识别出各所述物联网代码块中包含的若干物联网敏感数据点,所述物联网敏感数据点是与所述物联网设备语义相关的文本标签;从所述物联网应用程序的源代码中查找到与各所述物联网敏感数据点对应的别名标签组,将所有所述物联网敏感数据点对应的别名标签组和所述若干物联网敏感数据点关联的程序变量作为物联网设备敏感数据,所述别名标签组是所述物联网敏感数据点在所述物联网应用程序的源代码中的多个副本和/或多个引用。2.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,从物联网设备的描述文本信息中提取多个物联网敏感数据项包括:利用命名实体识别模型从物联网设备的描述文本信息中提取多个物联网敏感数据项,所述描述文本信息至少包含物联网设备的新闻报道、物联网应用程序的代码描述及开发者文档。3.根据权利要求1所述的物联网设备敏感数据的识别方法,其特征在于,根据语义信息从物联网应用程序的源代码中筛选出若干物联网代码块包括:将物联网应用程序的源代码切分为多个语义代码块,各所述语义代码块中包含至少一个文本标签,所述文本标签具有语义信息;根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块。4.根据权利要求3所述的物联网设备敏感数据的识别方法,其特征在于,根据各所述语义代码块中包含的文本标签筛选出与物联网设备语义相关的物联网代码块包括:提取各所述语义代码块中的所有文本标签;将与各所述文本标签有语义关联的的文本标签扩展到各所述语义代码中,以丰富各所述语义代码块的语义;将各所述语义代码块中的所有文本标签构成一个文本标签列表,对所述文本标签列表进行预处理;将预处理后的所述文本标签列表转化为数值向量,将所述数值向量输入到训练好的文本分类模型中得到物联网代码块。5.根据权利要求1所述...

【专利技术属性】
技术研发人员:南雨宏杨培福黄佳颖张玉亮郑子彬
申请(专利权)人:中山大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1