一种图谱构建方法、装置、存储介质和计算机设备制造方法及图纸

技术编号:28837885 阅读:18 留言:0更新日期:2021-06-11 23:35
本发明专利技术实施例提供了一种图谱构建方法、装置、存储介质和计算机设备。本发明专利技术实施例的方案中,将有效域名系统日志数据中的每条有效数据记录中的第一个域名确定为查询域名;将每条有效数据记录中的除查询域名之外的域名确定为规范名字;根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图;根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图;根据第一调度图和第二调度图,构建规范名字图谱,采用构建规范名字图谱的方法对有效域名系统日志数据进行分析,保证了数据的全面性、准确性和及时性,并且可以洞察到有效域名系统日志数据的迭代过程。

【技术实现步骤摘要】
一种图谱构建方法、装置、存储介质和计算机设备
本专利技术涉及数据处理
,尤其涉及一种图谱构建方法、装置、存储介质和计算机设备。
技术介绍
目前常见的对内容分发网络(ContentDeliveryNetwork,简称:CDN)调度分析方法,主要是通过构建网际互连协议(InternetProtocol,简称:IP)地址和CDN节点之间的映射关系,对业务IP翻译对应的CDN归属,此分析方法难以保证IP地址和CDN节点之间的映射关系的数据全面性、准确性和及时性,而且仅能做到分析最终结果,无法洞察调度过程中的域名的迭代过程。
技术实现思路
有鉴于此,本专利技术实施例提供了一种图谱构建方法、装置、存储介质和计算机设备,可以。一方面,本专利技术实施例提供了一种图谱构建方法,所述方法包括:获取有效域名系统日志数据,有效域名系统日志数据包括多条有效数据记录,每条有效数据记录包括多个域名以及相邻域名之间的有向路径;将每条有效数据记录中的第一个域名确定为查询域名;将每条有效数据记录中的除查询域名之外的域名确定为规范名字;根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图;根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图;根据第一调度图和第二调度图,构建规范名字图谱。可选地,获取域名系统有效日志数据,具体包括:获取域名系统日志数据;对域名系统日志数据进行清洗,生成有效域名系统日志数据。可选地,第一调度图包括两个顶点和所述两个顶点之间的有向边;根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图,包括:将查询域名确定为所述第一调度图的一个顶点;将第1个规范名字的有向路径确定为第一调度图的另一个顶点;将从查询域名至第1个规范名字的有向路径确定为第一调度图中的两个顶点之间的有向边。可选地,第二调度图包括多个顶点和多条有向边;根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图,包括:按照从查询域名至第1个规范名字的有向路径、从第1个规范名字至第N个规范名字的有向路径,将查询域名、第1个规范名字至第N个规范名字拆分成多个域名对,每个域名对包括两个域名和两个域名之间的有向路径,N包括正整数;将查询域名、第1个规范名字至第N个规范名字确定为第二调度图中的顶点;将两个域名之间的有向路径确定为第二调度图中相应的顶点之间的有向边。可选地,根据第一调度图和第二调度图,构建规范名字图谱,包括:对第一调度图进行标准化预处理,生成第一有向图,第一有向图包括多个顶点和多条有向边;对第二调度图进行标准化预处理,生成第二有向图,第二有向图包括多个顶点和多条有向边;将第一有向图和第二有向图进行整合,构建规范名字图谱。可选地,有向边包括出向边或入向边;在根据第一调度图和第二调度图,构建规范名字图谱之后,还包括:从规范名字图谱中任意选取一个顶点类型不为查询域名类型的顶点;将顶点类型不为查询域名类型的顶点确定为根节点;从根节点的域名中,提取根节点的域;根据根节点的域,从规范名字图谱中提取出所有出向边指向域的顶点;将所有出向边指向域的顶点确定为子节点;根据根节点和子节点,生成入向连通子图。可选地,在根据规范名字图谱,生成连通子图之后,还包括:按照数据可视化框架,根据规范名字图谱,生成力导向图。另一方面,本专利技术实施例提供了一种图谱构建装置,包括:获取单元,用于获取有效域名系统日志数据,有效域名系统日志数据包括多条有效数据记录,每条有效数据记录包括多个域名以及相邻域名之间的有向路径;第一确定单元,用于将每条有效数据记录中的第一个域名确定为查询域名;第二确定单元,用于将每条有效数据记录中的除查询域名之外的域名确定为规范名字;第一生成单元,用于根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图;第二生成单元,用于根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图;构建单元,用于根据第一调度图和第二调度图,构建规范名字图谱。另一方面,本专利技术实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述图谱构建方法。另一方面,本专利技术实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,其特征在于,所述程序指令被处理器加载并执行时实现上述图谱构建方法的步骤。本专利技术实施例的方案中,获取有效域名系统日志数据,有效域名系统日志数据包括多条有效数据记录,每条有效数据记录包括多个域名以及相邻域名之间的有向路径;将每条有效数据记录中的第一个域名确定为查询域名;将每条有效数据记录中的除查询域名之外的域名确定为规范名字;根据查询域名、第1个规范名字和从查询域名至第1个规范名字的有向路径,生成第一调度图;根据查询域名、规范名字和相邻域名之间的有向路径,生成第二调度图;根据第一调度图和第二调度图,构建规范名字图谱,采用构建规范名字图谱的方法对有效域名系统日志数据进行分析,保证了数据的全面性、准确性和及时性,并且可以洞察到有效域名系统日志数据的迭代过程。【附图说明】图1为本专利技术实施例提供的一种图谱构建方法的结构示意图;图2为本专利技术实施例提供的又一种图谱构建方法的流程图;图3为本专利技术实施例提供的一种CNAME图谱的示例图;图4为本专利技术实施例提供的一种根据图3提供的CNAME图谱生成的入向连通子图的示例图;图5为本专利技术实施例提供的一种根据图3提供的CNAME图谱生成的出向连通子图的示例图;图6为本专利技术实施例提供的一种根据图3提供的CNAME图谱生成的弱连通子图的示例图;图7为本专利技术实施例提供的一种根据图3提供的CNAME图谱生成的力导向图的示例图;图8为本专利技术实施例提供的一种图谱构建装置的结构示意图;图9为本专利技术实施例提供的一种计算机设备的示意图。【具体实施方式】为了更好的理解本专利技术的技术方案,下面结合附图对本专利技术实施例进行详细描述。应当明确,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本专利技术保护的范围。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存本文档来自技高网...

【技术保护点】
1.一种图谱构建方法,其特征在于,所述方法包括:/n获取有效域名系统日志数据,所述有效域名系统日志数据包括多条有效数据记录,每条有效数据记录包括多个域名以及相邻域名之间的有向路径;/n将所述每条有效数据记录中的第一个域名确定为查询域名;/n将所述每条有效数据记录中的除所述查询域名之外的域名确定为规范名字;/n根据所述查询域名、第1个规范名字和从所述查询域名至所述第1个规范名字的有向路径,生成第一调度图;/n根据所述查询域名、所述规范名字和所述相邻域名之间的有向路径,生成第二调度图;/n根据所述第一调度图和第二调度图,构建规范名字图谱。/n

【技术特征摘要】
1.一种图谱构建方法,其特征在于,所述方法包括:
获取有效域名系统日志数据,所述有效域名系统日志数据包括多条有效数据记录,每条有效数据记录包括多个域名以及相邻域名之间的有向路径;
将所述每条有效数据记录中的第一个域名确定为查询域名;
将所述每条有效数据记录中的除所述查询域名之外的域名确定为规范名字;
根据所述查询域名、第1个规范名字和从所述查询域名至所述第1个规范名字的有向路径,生成第一调度图;
根据所述查询域名、所述规范名字和所述相邻域名之间的有向路径,生成第二调度图;
根据所述第一调度图和第二调度图,构建规范名字图谱。


2.根据权利要求1所述的图谱构建方法,其特征在于,所述获取域名系统有效日志数据,具体包括:
获取域名系统日志数据;
对所述域名系统日志数据进行清洗,生成有效域名系统日志数据。


3.根据权利要求1所述的图谱构建方法,其特征在于,所述第一调度图包括两个顶点和所述两个顶点之间的有向边;所述根据所述查询域名、第1个规范名字和从所述查询域名至所述第1个规范名字的有向路径,生成第一调度图,包括:
将所述查询域名确定为所述第一调度图的一个顶点;
将所述第1个规范名字的有向路径确定为所述第一调度图的另一个顶点;
将从所述查询域名至所述第1个规范名字的有向路径确定为所述第一调度图中的两个顶点之间的有向边。


4.根据权利要求1所述的图谱构建方法,其特征在于,所述第二调度图包括多个顶点和多条有向边;
所述根据所述查询域名、所述规范名字和所述相邻域名之间的有向路径,生成第二调度图,包括:
按照所述从查询域名至第1个规范名字的有向路径、从第1个规范名字至第N个规范名字的有向路径,将所述查询域名、第1个规范名字至第N个规范名字拆分成多个域名对,每个域名对包括两个域名和两个域名之间的有向路径,N包括正整数;
将所述查询域名、第1个规范名字至第N个规范名字确定为所述第二调度图中的顶点;
将所述两个域名之间的有向路径确定为所述第二调度图中相应的顶点之间的有向边。


5.根据权利要求1所述的图谱构建方法,其特征在于,所述根据所述第一调度图和第二调度图,构建规范名字图谱,包括:
对所述第一调度图进行标准化预处理,生成第一有向图,...

【专利技术属性】
技术研发人员:肖书俊吴晨花李铭学陈达陈海霞
申请(专利权)人:中国移动通信集团海南有限公司中国移动通信集团有限公司
类型:发明
国别省市:海南;46

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1