一种通用亲缘关系信息库遍历完善方法技术

技术编号:9618371 阅读:77 留言:0更新日期:2014-01-30 06:13
本发明专利技术公开了一种通用亲缘关系信息库遍历完善方法,首先确定要推导的具体亲缘关系种类范围和检查规则,然后执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理,如果不设置任何检查规则,那么遍历完善的主要流程是对信息库中每一个记录与其它记录一一进行关系推导,关系推导包括两种,通过确定未知关系人来推导亲缘关系和通过确定未知关系种类来推导亲缘关系,从已有的信息中推导出常见的但尚未明知的信息,从而有利于更好的分析检索。也可在关系推导前根据确定的检查规则加入相应的检查步骤,从而满足消除某些数据冗余和数据冲突的需求,使信息库更加优化。

A general traversal method of genetic relationship information base

The invention discloses a universal relationship database traversal improvement methods, first determine the derivation of specific relationship range and check rules, and then execute the traversal process improvement process, according to the first step of the derivation of specific genetic relationship in the range and check rules are deduced according to the first step to determine the inspection process, if you do not set any check rules, then the main process is to improve the ergodic information database in each record and other records of the relationship is deduced including two, by determining the unknown relationship between man to derive the genetic relationship and genetic relationship is derived by determining the unknown type, but not knowing information from existing information derived in common, which is conducive to better retrieval analysis. Before the relation is deduced, relevant checking steps can be added according to the checking rules, so as to satisfy the needs of eliminating some data redundancy and data conflict, and optimize the information base.

【技术实现步骤摘要】

本专利技术属于计算机信息处理领域,尤其涉及。
技术介绍
专利技术专利申请一种通用亲缘关系信息库存储组织方法,专利技术专利申请一种亲缘关系信息库构建方法,仅解决已识别亲缘关系信息的直接存储,而仅有已识别亲缘关系信息对于分析检索还是不够的,因为在通用亲缘关系信息库中相关的亲缘信息很难形成一个关系链,这就给查询分析带来很多困难。要提高分析检索的效率,应当尽量填满为空的属性或弥补关系链中缺失的环节,这就需要通过亲缘关系推导。而专利技术专利申请一种过确定未知关系人来推导亲缘关系方法、一种通过确定未知关系种类来推导亲缘关系方等方法及关系路径的概念等为弥补关系链中缺失的环节、进而提高分析检索效率提供了有效的途径。
技术实现思路
本专利技术要解决构建通用亲缘关系信息库时由于信息不完善而分析检索效率不高的问题,为解决上述问题,本专利技术的目的在于提供,使通用亲缘关系信息库能够得到尽可能的完善,从而提高其分析检索效率。本专利技术提出的通用亲缘关系信息库遍历完善方法,是对信息库全库的一种检查完善,主要利用已有的亲缘关系推导方法,从已有亲缘关系信息推导出新的亲缘关系从而使信息库更加完善,另外还可根据需要进行相应的检查,消除数据冲突和数据冗余,进一步提升信息库的性能,遍历完善主要包括以下步骤: 第一步是确定要推导的具体亲缘关系种类范围和检查规则;由于通用亲缘关系信息库中存储的具体亲缘关系种类不受限制,如果对于推导结果也不做限制的话,那么其推导结果集将可能很大,而且对于提高分析检索效率也没有什么作用,因此应当限定为有利于提高分析检索效率的具体亲缘关系种类,一般应为两人之间最直接的亲缘关系,即关系路径长度为I的那些具体亲缘关系种类,由于通用亲缘关系信息库的分析检索有时不采取类似于指针的技术,为了分析检索更加快捷,有时也可将某些关系路径长度为2的那些具体亲缘关系种类等也纳入要推导的具体亲缘关系种类范围;检查规则主要包括消除数据冲突和数据冗余的规则,为了不至于在检查方面耗费过多,一般来说只有比较明显的数据冲突和不必要的数据冗余才消除,比较明显的数据冲突如不符合亲缘关系的相互性的数据,一个亲缘关系信息甲是乙的父亲和另一个亲缘关系信息乙是丙(男性)的儿子就是不符合亲缘关系的相互性的数据,不必要的数据冗余包括完全相同的两条信息、互为相互反向的等价的两条信息以及可以由其它两条或以上信息直接拼接而成的信息等,当然也可以根据需要确定更为严格或更为宽松的检查规则;此处假设不做任何检查,不对任何数据冲突和数据冗余进行检查和处理; 第二步:执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理。主要流程是对信息库中每一个记录与其它记录一一进行关系推导,关系推导包括两种,通过确定未知关系人来推导亲缘关系和通过确定未知关系种类来推导亲缘关系,从已有的信息中推导出常见的但尚未明知的信息,从而有利于更好的分析检索。为了实现遍历,这里用了两个定位器,第一个定位器用于定位在遍历信息库时当前访问的记录,第二个定位器用于定位配合进行推导的记录,由于第一步已确定不做任何检查,所以不包括任何对任何数据冲突和数据冗余进行检查和处理的步骤,具体包括以下步骤: 第I步:第一个定位器定位到信息库中第一个记录(外循环置初值),如果已经到达信息库末则执行第25步结束,否则执行下步; 第3步:第二个定位器定位到第一个定位器定位当前记录的后一记录(内循环置初值),如果已经到达信息库末则执行第25步结束,否则执行第8步(即开始执行循环体); 第8步:判断两个定位器定位的记录是否可以唯一匹配部分关系路径,用关系路径长度短的去匹配长的,如果长度相等则执行第11步,也可继续进行匹配但肯定是不能唯一匹配;假如第二个定位器定位的记录所描述的亲缘关系关系路径短,则看该记录是否可以唯一匹配第一个定位器定位的记录所描述的亲缘关系的部分关系路径,如果可以唯一匹配,按通过确定未知关系人来推导亲缘关系方法进行关系推导(结果集是第一步限定的,不在结果集的推导结果均属不可推导的范围,相关的推导规则中可只有推导结果属于第一步确定的推导的具体亲缘关系种类范围的规则),上述过程可统称为通过确定未知关系人来推导亲缘关系的过程;如果不可推导,那么执行第11步;若推导出另一组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理; 第11步:判断第二个定位器定位的记录所描述的亲缘关系是否可以拟合第一个定位器定位的记录所描述的亲缘关系的部分关系路径,如果可以部分拟合,按通过确定未知关系种类来推导亲缘关系方法进行关系推导,上述过程可统称为通过确定未知关系种类来推导亲缘关系的过程;如果不可推导,那么执行第20步;若推导出另一组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理; 第14步:将推导结果插入信息库末,完成推导结果的入库工作,然后执行第20步; 第20步:将第二个定位器定位到原定位记录的下一记录(内循环下移一条记录),如果已经到达信息库末则执行第22步(内循环全部结束),否则执行第5步; 第22步:将第一个定位器定位到原定位记录的下一记录(外循环下移一条记录),如果已经到达信息库末则执行第25步结束(外循环全部结束),否则执行第3步; 第25步:整个遍历完善的过程结束。上述遍历完善方法中因为在第一步没有设置任何检查规则,因此在第二步遍历完善过程中没有进行任何检查,如果在检查规则中设置消除数据冗余的规则去掉完全相同的两条信息、互为相互反向的等价的两条信息这两种等价重复信息,那么应在上述步骤的基础上做如下调整: 第一步中增加确定不允许出现完全相同的两条信息、互为相互反向的等价的两条信息的检查规则; 第二步执行遍历完善过程中,应增加和调整有关步骤,具体如下: 增加第5步以检查原有记录中是否有相互等价记录:判断第二个定位器定位的记录与第一个定位器定位的记录是否等价,如果等价,则删除第一个定位器定位的记录,然后那么执行第22步(外循环下移一条记录),否则执行第8步继续判断; 修改第14步以检查所有记录中是否有与推导结果等价的记录:判断信息库是否已有与推导结果等价的记录,如果有则将该推导结果抛弃,没有则将推导结果插入信息库末如果没有设置插入标志则设置插入标志并记录插入位置,然后执行第20步; 也可以修改第20步以避免重复处理新推导的亲缘关系信息:将第二个定位器定位到原定位记录的下一记录(内循环下移一条记录),如果已经到达信息库末或在设置插入标志的情况下到达新插入位置,则取消插入标志,然后执行第22步(内循环全部结束),否则执行第5步。上述遍历完善方法还可以是否存在可以由其它两条信息直接拼接而成的信息的情况,这种情况也是一种数据冗余,如果把这种冗余也作为不必要的冗余,那么继续对第14步进行修改;判断信息库是否已有与推导结果等价的记录,在如果有等价记录则将该推导结果抛弃的同时还删除第一个定位器定位的记录,然后执行第22步。上述遍历完善方法中还可设置有关数据冲突的检查规则,设置最简单的数据冲突检查即不符合亲缘关系的相互性的数据的检查及处理,那么应在上述步骤的基础上做如下调整: 在第8步前且在第3步(如果有第5步则在第本文档来自技高网...

【技术保护点】
一种通用亲缘关系信息库遍历完善方法,其特征在于包括以下步骤:第一步:确定要推导的具体亲缘关系种类范围和检查规则;第二步:执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理。

【技术特征摘要】
1.一种通用亲缘关系信息库遍历完善方法,其特征在于包括以下步骤: 第一步:确定要推导的具体亲缘关系种类范围和检查规则; 第二步:执行遍历完善过程,过程中按第一步所确定的要推导的具体亲缘关系种类范围进行关系推导以及按第一步所确定的检查规则进行检查处理。2.根据权利要求1所述的一种通用亲缘关系信息库遍历完善方法,其特征在于: 第一步中不设置任何检查规则; 第二步的执行遍历完善过程具体包括以下步骤: 第I步:第一个定位器定位到信息库中第一个记录,如果已经到达信息库末则执行第25步结束,否则执行下步; 第3步:第二个定位器定位到第一个定位器定位当前记录的后一记录,如果已经到达信息库末则执行第25步结束,否则执行第8步; 第8步:执行通过确定未知关系人来推导亲缘关系的过程,如果不可推导,那么执行第11步;若推导出另一组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理; 第11步:执行通过确定未知关系种类来推导亲缘关系的过程,如果不可推导,那么执行第20步;若推导出另一 组可直接描述或不可直接描述的两人之间亲缘关系信息,执行第14步进行处理; 第14步:将推导结果插入信息库末,完成推导结果的入库工作,然后执行第20步; 第20步:将第二个定位器定位到原定位记录的下一记录,如果已经到达信息库末则执行第22步,否则执行第5步; 第22步:将第一个定位器定位到原定位记录的下一记录,如果已经到达信息库末则执行第25步结束,否则执行第3步; 第25步:整个遍历完善的过程结束。3.根据权利要求2所述的一种通用亲缘关系信息库遍历完善方法,其特征在于: 第一步中增加确定不允许出现完全相同的两条信息、互为相互反向的等价的两条信息的检查规则; 第二步执行遍历完善过程中应增加和调整有关步骤,...

【专利技术属性】
技术研发人员:倪龙
申请(专利权)人:宁波芝立软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1