基于手机取证数据的机主特征属性挖掘方法及其系统技术方案

技术编号:13609230 阅读:80 留言:0更新日期:2016-08-29 02:25
本发明专利技术公开了一种基于手机取证数据的机主特征属性挖掘方法及其系统,方法包括:获取手机的原始证据数据库;预设特征属性对应其来源数据表的初始权重;在不同来源数据表中获取与特征属性对应的数据库字段;关联特征属性、来源数据表和数据库字段,得到映射规则;获取数据库字段下的参考信息;依据正则表达式在通讯内容中进行匹配,得到对应特征属性的参考信息;提取关键字匹配成功的通讯记录;获取通讯记录中对应特征属性的参考信息;获取各个所述参考信息对应的初始权重;合并相同的参考信息的初始权重,得到各个所述参考信息的权重;根据权重,将参考信息进行排序。可有效降低取证工作人员的负担,提高取证效率和取证效果。

【技术实现步骤摘要】

本专利技术涉及数据挖掘领域,尤其涉及一种基于手机取证数据的机主特征属性挖掘方法及其系统
技术介绍
在当前的手机取证产品中,主要功能为罗列展示手机中的原始数据,包括但不限于通讯录、短信、通话、即时通讯、邮件、浏览记录等等诸多信息,没有进一步的挖掘分析。工作人员需要通过自己人工数据查看,才能对机主有一个总体了解。在公开号为CN105488029A的中国专利公开文件中,公开了一种基于KNN的智能手机即时通讯工具取证方法,包括:对即时通讯工具会话进行分类之前,先计算会话间的相似度;首先对训练集中的所有会话进行特征选择,选取出特征词,统计出特征词的权重;然后利用基于同义词词林的词语相似度计算得出特征词间的相似度,相似度大于设定阈值的词语视为同义词,权重较大者为代表特征词,权重较小者取其权重与相似度之积为其权重;最后用向量表示会话。但该方案只能对安卓手机的即时通讯内容进行信息提取,且是根据词语相似度计算会话距离,适用范围小,且计算较为复杂。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于手机取证数据的机主特征属性挖掘方法及其系统,可在原始证据中挖掘出机主的属性特征。为了解决上述技术问题,本专利技术采用的技术方案为:一种基于手机取证数据的机主特征属性挖掘方法,包括:获取手机的原始证据数据库,所述原始证据数据库中存储有包括账号信息表和通讯记录表的数据表;根据预设的特征属性及其来源数据表,预设所述特征属性对应其来源数据
表的初始权重;在所述账号信息表的不同来源数据表中获取与所述特征属性对应的数据库字段;关联所述特征属性、来源数据表和所述数据库字段,得到映射规则;获取所述数据库字段下的参考信息;遍历所述通讯记录表中的通讯记录;预设对应所述特征属性的正则表达式,依据所述正则表达式在所述通讯记录的通讯内容中进行匹配,得到对应所述特征属性的参考信息;根据通讯记录的发送号码或发送方进行筛选,获取与所述特征属性对应的所述通讯记录;对获取到的通讯记录进行关键字匹配,提取匹配成功的通讯记录;获取通讯记录中对应所述特征属性的参考信息;根据特征属性对应的来源数据表,获取各个所述参考信息对应的初始权重;合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重;根据所述权重,将对应所述特征属性的参考信息进行排序。本专利技术还涉及一种基于手机取证数据的机主特征属性挖掘系统,包括:第一获取模块,用于获取手机的原始证据数据库,所述原始证据数据库中存储有包括账号信息表和通讯记录表的数据表;第一预设模块,用于根据预设的特征属性及其来源数据表,预设所述特征属性对应其来源数据表的初始权重;第二获取模块,用于在所述账号信息表的不同来源数据表中获取与所述特征属性对应的数据库字段;第一得到模块,用于关联所述特征属性、来源数据表和所述数据库字段,得到映射规则;第三获取模块,用于获取所述数据库字段下的参考信息;遍历模块,用于遍历所述通讯记录表中的通讯记录;第一匹配模块,用于预设对应所述特征属性的正则表达式,依据所述正则
表达式在所述通讯记录的通讯内容中进行匹配,得到对应所述特征属性的参考信息;第四获取模块,用于根据通讯记录的发送号码或发送方进行筛选,获取与所述特征属性对应的所述通讯记录;第二匹配模块,用于对获取到的通讯记录进行关键字匹配,提取匹配成功的通讯记录;第五获取模块,用于获取通讯记录中对应所述特征属性的参考信息;第六获取模块,用于根据特征属性对应的来源数据表,获取各个所述参考信息对应的初始权重;第二得到模块,用于合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重;排序模块,用于根据所述权重,将对应所述特征属性的参考信息进行排序。本专利技术的有益效果在于:对于特征属性可以对应原始证据的数据库字段的情况,则通过将特征属性与数据库字段进行关联,根据映射规则直接获取数据库字段下的参考信息;而对于通讯内容,则通过正则匹配和自然语言处理技术提取参考信息;最后根据初始权重,将各个特征属性中相同的参考信息进行合并排序,使用户可以直观地了解各个特征属性中不同的参考信息的可信度;本专利技术可自动提取手机机主的相关特征属性信息,有效降低取证工作人员的负担,提高取证效率和取证效果,也可为之后的取证分析提供相关数据和方向。附图说明图1为本专利技术一种基于手机取证数据的机主特征属性挖掘方法的流程图;图2为本专利技术实施例一的方法流程图;图3为本专利技术实施例一的参考信息的展示界面图;图4为本专利技术一种基于手机取证数据的机主特征属性挖掘系统的结构示意图;图5为本专利技术实施例二的系统结构示意图。标号说明:1、第一获取模块;2、第一预设模块;3、第二获取模块;4、第一得到模块;5、第三获取模块;6、遍历模块;7、第一匹配模块;8、第四获取模块;9、第二匹配模块;10、第五获取模块;11、第六获取模块;12、第二得到模块;13、排序模块;14、校验模块;15、转化模块;16、筛选模块;17、分析模块;18、增加模块。具体实施方式为详细说明本专利技术的
技术实现思路
、所实现目的及效果,以下结合实施方式并配合附图详予说明。本专利技术最关键的构思在于:通过特征属性与数据库字段的关联获取已在数据库字段下的特征属性,通过正则匹配和自然语言处理技术获取在通讯内容中的特征属性。请参阅图1,一种基于手机取证数据的机主特征属性挖掘方法,包括:获取手机的原始证据数据库,所述原始证据数据库中存储有包括账号信息表和通讯记录表的数据表;根据预设的特征属性及其来源数据表,预设所述特征属性对应其来源数据表的初始权重;在所述账号信息表的不同来源数据表中获取与所述特征属性对应的数据库字段;关联所述特征属性、来源数据表和所述数据库字段,得到映射规则;获取所述数据库字段下的参考信息;遍历所述通讯记录表中的通讯记录;预设对应所述特征属性的正则表达式,依据所述正则表达式在所述通讯记录的通讯内容中进行匹配,得到对应所述特征属性的参考信息;根据通讯记录的发送号码或发送方进行筛选,获取与所述特征属性对应的所述通讯记录;对获取到的通讯记录进行关键字匹配,提取匹配成功的通讯记录;获取通讯记录中对应所述特征属性的参考信息;根据特征属性对应的来源数据表,获取各个所述参考信息对应的初始权重;合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重;根据所述权重,将对应所述特征属性的参考信息进行排序。从上述描述可知,本专利技术的有益效果在于:可自动提取手机机主的相关特征属性信息,有效降低取证工作人员的负担,提高取证效率和取证效果,也可为之后的取证分析提供相关数据和方向。进一步地,所述“合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重”之前,进一步包括:依据所述特征属性,对所述参考信息进行合法性校验;依据所述特征属性,将所述参考信息转化为预设的标准化格式;依据所述特征属性,对所述参考信息进行筛选过滤。由上述描述可知,通过合法性校验和筛选过滤,可提高参考信息的正确性,提高整体分析准确性,通过转化为预设的标准化格式,方便后续分析和管理。进一步地,所述“合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重”之前,进一本文档来自技高网
...

【技术保护点】
一种基于手机取证数据的机主特征属性挖掘方法,其特征在于,包括:获取手机的原始证据数据库,所述原始证据数据库中存储有包括账号信息表和通讯记录表的数据表;根据预设的特征属性及其来源数据表,预设所述特征属性对应其来源数据表的初始权重;在所述账号信息表的不同来源数据表中获取与所述特征属性对应的数据库字段;关联所述特征属性、来源数据表和所述数据库字段,得到映射规则;获取所述数据库字段下的参考信息;遍历所述通讯记录表中的通讯记录;预设对应所述特征属性的正则表达式,依据所述正则表达式在所述通讯记录的通讯内容中进行匹配,得到对应所述特征属性的参考信息;根据通讯记录的发送号码或发送方进行筛选,获取与所述特征属性对应的所述通讯记录;对获取到的通讯记录进行关键字匹配,提取匹配成功的通讯记录;获取通讯记录中对应所述特征属性的参考信息;根据特征属性对应的来源数据表,获取各个所述参考信息对应的初始权重;合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重;根据所述权重,将对应所述特征属性的参考信息进行排序。

【技术特征摘要】
1.一种基于手机取证数据的机主特征属性挖掘方法,其特征在于,包括:获取手机的原始证据数据库,所述原始证据数据库中存储有包括账号信息表和通讯记录表的数据表;根据预设的特征属性及其来源数据表,预设所述特征属性对应其来源数据表的初始权重;在所述账号信息表的不同来源数据表中获取与所述特征属性对应的数据库字段;关联所述特征属性、来源数据表和所述数据库字段,得到映射规则;获取所述数据库字段下的参考信息;遍历所述通讯记录表中的通讯记录;预设对应所述特征属性的正则表达式,依据所述正则表达式在所述通讯记录的通讯内容中进行匹配,得到对应所述特征属性的参考信息;根据通讯记录的发送号码或发送方进行筛选,获取与所述特征属性对应的所述通讯记录;对获取到的通讯记录进行关键字匹配,提取匹配成功的通讯记录;获取通讯记录中对应所述特征属性的参考信息;根据特征属性对应的来源数据表,获取各个所述参考信息对应的初始权重;合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重;根据所述权重,将对应所述特征属性的参考信息进行排序。2.根据权利要求1所述的基于手机取证数据的机主特征属性挖掘方法,其特征在于,所述“合并对应所述特征属性的参考信息中相同的参考信息的初始权重,得到各个所述参考信息的权重”之前,进一步包括:依据所述特征属性,对所述参考信息进行合法性校验;依据所述特征属性,将所述参考信息转化为预设的标准化格式;依据所述特征属性,对所述参考信息进行筛选过滤。3.根据权利要求1所述的基于手机取证数据的机主特征属性挖掘方法,其特征在于,所述“合并对应所述特征属性的参考信息中相同的参考信息的初始
\t权重,得到各个所述参考信息的权重”之前,进一步包括:对各个所述参考信息进行关联性分析;若多个参考信息存在关联,则增加所述多个参考信息的初始权重。4.根据权利要求1所述的基于手机取证数据的机主特征属性挖掘方法,其特征在于,所述账号信息表包括即时通讯类账号表、微博类账号表、电子支付类账号表和邮箱账号表;所述通讯记录表包括短信表、彩信表和即时通讯聊天内容表。5.一种基于手机取证数据的机主特征属性挖...

【专利技术属性】
技术研发人员:邱俊源江汉祥孙奕林艺滨
申请(专利权)人:厦门市美亚柏科信息股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1