一种基于文件自动标记信息的社会关系挖掘分析方法技术

技术编号：16837599 阅读：68 留言：0更新日期：2017-12-19 20:02

本发明专利技术公开了一种基于文件自动标记信息的社会关系挖掘分析方法，所述方法包括：从被分析对象的载体中收集具有标记信息的文件；从收集的文件中解析出标记信息并存储到数据库中；从数据中选择能够作为社交关联分析的关联字段；建立黑名单库，基于黑名单库进行过滤；从标记信息将选择出的关联字段的值读取出来，并两两关联；基于关联后的文档利用辅助字段的相似度信息，计算关联的可靠性信息；将关联信息输入可视化控件生成社会关系图；通过本申请中的方法能够显著提高取证过程中拓展线索的效率和效果。

An analysis method of social relation mining based on automatic file marking information

The invention discloses a method for automatic file marker information mining and analysis of social relations based on the analysis of the collected information is tagged with the file object carrier; from parsing out the tag information and stored in the database to collect the file; select the associated field can be used as a social relation analysis from the data; establish a blacklist database, filter the list based on related fields from the marker information; the selected value is read out, and 22 Association; the document by using the auxiliary field correlation similarity information based on information reliability calculation of correlation; related information input visual control to generate social graph; through the method of application in can significantly improve the development efficiency and the effect of clues and evidence collection process.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于文件自动标记信息的社会关系挖掘分析方法
本专利技术涉及取证分析研究领域，具体地，涉及一种基于文件自动标记信息的社会关系挖掘分析方法。
技术介绍
传统的取证分析中的社会关系挖掘分析方法往往是依赖于互联网产品，如基于电子邮件的社会关系挖掘、基于社交软件的社会关系挖掘。现有的电子取证分析中的社会关系挖掘分析方法普遍需要互联网。如基予电子邮件的社会关系挖掘需要搜集目标对象的来往邮件来进行社会关系关联；基予社交软件如QQ微信的社会关系挖掘需要目标对象的账号密码。此类分析方法有2个问题：1、严重依赖互联网，无法对不联网的计算机进行有效分析。2、无论是电子邮件还是QQ微信都需要目标对象的账号密码信息，这在实际取证过程中难度很大，往往无法有效开展。
技术实现思路
本专利技术提供了一种基于文件自动标记信息的社会关系挖掘分析方法，解决了现有的分析存在依赖互联网且分析难度大的技术问题，通过本申请中的方法能够显著提高取证过程中拓展线索的效率和效果。传统的方法针对于文件的取证分析方法一般只注重于文件的时间属性和内容上面的分析，往往忽略了文件的自动标记属性产生的巨大价值。为实现上述专利技术目的，本申请提供了一种基于文件自动标记信息的社会关系挖掘分析方法，所述方法包括：从被分析对象的载体中收集具有标记信息的文件；从收集的文件中解析出标记信息并存储到数据库中；从数据中选择能够作为社交关联分析的关联字段；建立黑名单库，基于黑名单库进行过滤；从标记信息将选择出的关联字段的值读取出来，并两两关联；基于关联后的文档利用辅助字段的相似度信息，计算关联的可靠性信息；将关联信息输入可视化控件生成社...
一种基于文件自动标记信息的社会关系挖掘分析方法

【技术保护点】
一种基于文件自动标记信息的社会关系挖掘分析方法，其特征在于，所述方法包括：从被分析对象的载体中收集具有标记信息的文件；从收集的文件中解析出标记信息并存储到数据库中；从数据中选择能够作为社交关联分析的关联字段；建立黑名单库，基于黑名单库进行过滤；从标记信息将选择出的关联字段的值读取出来，并两两关联；基于关联后的文档利用辅助字段的相似度信息，计算关联的可靠性信息；将关联信息输入可视化控件生成社会关系图。

【技术特征摘要】
1.一种基于文件自动标记信息的社会关系挖掘分析方法，其特征在于，所述方法包括：从被分析对象的载体中收集具有标记信息的文件；从收集的文件中解析出标记信息并存储到数据库中；从数据中选择能够作为社交关联分析的关联字段；建立黑名单库，基于黑名单库进行过滤；从标记信息将选择出的关联字段的值读取出来，并两两关联；基于关联后的文档利用辅助字段的相似度信息，计算关联的可靠性信息；将关联信息输入可视化控件生成社会关系图。2.根据权利要求1所述的基于文件自动标记信息的社会关系挖掘分析方法，其特征在于，所述基于黑名单库进行过滤具体包括：将收集到的标记信息与存在于黑名单库中的标记信息进行比对，如果比对结果显示存在于黑名单库中，则进行丢弃。3.根据权利要求1所述的基于文件自动标记信息的社会关系挖掘分析方法，其特征在于，具有自动标记信息的文件包括但不限于：word文档、excel文档、演示文稿文档、project文档、visio文档、PDF文档。4.根据权利要求1所述的基于文件自动标记信息的社会关系挖掘分析方法，其特征在于，文件自带标记信息，根据不同文件类型的各自内部结构进行解析；标记信息由键值对组成。5.根据权利要求1所述的基于文件自动标记信息的社会关系挖掘分析方法，其特征在于，所述方法还包括：从数据库中把携带标记信息的字段读取到分析平台，在分析平台中选择能够...

【专利技术属性】
技术研发人员：陈虹宇，罗阳，
申请(专利权)人：四川神琥科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人