一种基于社会人口家族关系自动绘制家系图谱的算法制造技术

技术编号:25396662 阅读:22 留言:0更新日期:2020-08-25 23:01
本发明专利技术公开了一种基于社会人口家族关系自动绘制家系图谱的算法,包括:步骤1:将相同行政村进行聚合;步骤2:为每个姓氏生成一条家系信息;步骤3:获取所有的户号集合;步骤4:以户主为起点,算法中通过穷尽人员关系进行家系图谱的连接;步骤5:所有户主均归并至当前家系中的第一层级;步骤6:按照穷尽顺序进行查找最相近的关系作为本家庭的第一层级进行处理;步骤7:将当前人员及所在后辈家系关系统一关联至父亲家系中;步骤8:为所有人自动关联一个家系信息。本发明专利技术算法通过深度分析特定范围的社会人口数据,进行多维度挖掘建模,以户系为单位进行归并,递归式的穷尽人员关系分支,自动将具有家族遗传特性的群体归并到同一个家系。

【技术实现步骤摘要】
一种基于社会人口家族关系自动绘制家系图谱的算法
本专利技术涉及社会人口家族关系绘制
,具体为一种基于社会人口家族关系自动绘制家系图谱的算法。
技术介绍
现有技术对于社会人口家族关系绘制家系图谱,采用技术手段均为“人工登记造册->手绘标注->计算机誊抄”,以“人海”战术进行地毯式排查登记,通过问询、登记基本情况,再由人工绘制图谱,最后汇总再次录入计算机归档。大多数场景下使用的具体方法为,如图1所示:1、划定待分析的人口群体所在的地域范围,分出最小的地域单位;2、以最小的地域单位进行逐一排查,逐个家庭或群体进行问询调查,同时将了解到的情况登记造册;3、通过问询的人口家族关系在纸质文件中进行手工绘图,标注直接关系和人员基本信息(姓名、身份证);4、每完成一个地域单位的排查,将纸质记录逐一录入到电脑中,再次记录和绘制,作为电子存档记录。此过程中,大量的人工记录难以避免出现疏漏、错误、字迹识别等问题,很大程度影响了工作成果的准确性,并且效率低、周期过长。现有技术的缺陷有以下方面:1、对排查范围内数据概况不了解,无法合理评估工作周期;2、没有标准数据作为参照,完全依赖被排查对象的表述,难以把控数据准确性;3、排查地域范围越大,需投入人工、周期、成本越高;4、人工记录、绘制,错误概率偏高,难以追溯和及时纠错;5、二次录入存在再次误差的可能,很可能为后期的数据利用做出错误指引;6、缺少科学的社会学关系分析,“落笔为实”没有充分的数据考证,应用到相关领域时不具备严谨的科学说服力。>
技术实现思路
本专利技术的目的在于提供一种基于社会人口家族关系自动绘制家系图谱的算法,解决了原有的纯人工登记、录入、摸排、手绘的方式,规避了人为因素的不确定性,填补了缺少规范和标准的基础数据空白,通过统一标准的数据分析和挖掘,实现精准、快速的自动归并和图谱绘制,有效地提升了数据的利用价值和工作效率,有效利用数据资源进行数据分析,体现数据价值。为了解决上述技术问题,本专利技术提供如下技术方案:一种基于社会人口家族关系自动绘制家系图谱的算法,包括以下步骤:步骤1:在指定区域内,将相同行政村进行聚合,以行政村以基准进行遍历,声明为:村列表villageList;步骤2:遍历村列表villageList,通过行政村主键进行筛选,获取当前行政村下所有的人员姓氏信息,将姓氏进行聚合,声明为surnameList;同时为每个姓氏生成一条家系信息,家系命名规则设定为“行政区划名称+姓氏+家系”,每个姓氏自动对应一个家系;步骤3:以行政村和姓氏筛查当前条件下的全部人员户口信息,获取所有的户号集合,声明为familyNoList;步骤4:遍历familgyNoList,对当前户号中的所有人员关系进行分析,以户主为起点,算法中通过穷尽人员关系进行家系图谱的连接,穷尽顺序为1.户主本人->2.户主父亲->3.户主爷爷->4.户主叔伯->5.户主兄弟->6.户主堂兄弟->7.主儿子->户主侄子->9.户主孙子->10.其他亲属->11.无户主人员;首先通过户主关系向上辈遍历,上辈至少包括父亲、爷爷、叔伯;,其次向同辈延伸,同辈至少包括兄弟、堂兄弟;再向子孙辈穷尽,孙辈至少包括儿子、侄子、孙子;最后处理无亲属关系和无户主关系人员;步骤5:默认情况下,所有户主均归并至当前家系中的第一层级,如果当前家庭关系中存在户主父亲的关系,则变更当前户主为第二层级,将户主父亲设定为第一层级,同理,如果存在户主爷爷的关系,则变更户主父亲为第二层级;步骤6:当家庭关系中不存在户主关系时,则按照穷尽顺序进行查找最相近的关系作为本家庭的第一层级进行处理;步骤7:当穷尽全部人员关系后,以社会人口关系即非户籍关系中的父亲信息或监护人信息进行再次分析,当查找到父亲信息时,如果父亲存在已知家系,则将当前人员及所在后辈家系关系统一关联至父亲家系中,实现自动关联;步骤8:以上步骤全部处理完成后,判断是否仍存在未归并至家系的人员,如果存在,为所有人自动关联一个家系信息,作为独立的家系存在。上述中,所述步骤1中的将相同行政村进行聚合:是指以最小的行政单位“村/社区”进行聚合,将指定区域范围聚合出N个“村/社区”集合,每个地域集合中包含N个姓氏集合。上述中,所述步骤2中的姓氏进行聚合:是通过挖掘社会人口数据关系,建立全方位的数据模型,覆盖人员基本信息,如姓氏、姓名、别名、性别、身份证号、年龄、出生地、籍贯地;人员户口信息,如户口类型、户号、与户主关系、户籍地址;父母配偶信息,如父亲姓名身份证号,母亲姓名身份证号,配偶姓名身份证号;地域地址信息,如现住址、户籍地址、出生地址;迁移变更信息,如迁入迁出、婚姻变更、新生儿上户、家族迁移;政府行政机构管理信息,如归属地单位、管辖单位、治安、民政;通过分析挖掘每个数据变量之间的直接和间接关系,将数据主体进行聚合计算,最终以家系主题将所有关联数据进行串联,并归并出此主线上以户主为单位的N个分支,形成家系数据链条。上述中,所述步骤2中的姓氏进行聚合还包括:在地域聚合的“村/社区”集合中,以“姓氏”进行聚合,将相同姓氏的群体自动聚合为N个“姓氏”集合,每个姓氏集合中包含N个家庭集合。上述中,所述步骤2中迁移变更信息进一步还包括:迁移信息聚合,基于人口迁移信息进行聚合,获取迁移变更前的信息,与家庭聚合后的集合进行再次聚合,形成数据链条进行关联。上述中,所述步骤4中当前户号:是指在每个姓氏集合中,以家庭“户号”进行再次聚合,实现每个姓氏中自动聚合出N个家庭集合,每个家庭集合中包含独立的人员个体。上述中,所述步骤8之后还包括:基于聚合计算的每个子集,从最小集合中的人员个体为主题,通过户号、与户主关系、父亲信息、变更/迁移前信息等逐项进行计算,通过两个人员个体的关系联结家庭-姓氏-地域不同大小的聚合数据,穷举、递归式的分析,实现每个集合之间最大限度的归并整合。与现有技术相比,本专利技术所达到的有益效果是:1、本专利技术算法通过深度分析特定范围的社会人口数据,参照地理信息、姓氏信息、家庭户口信息、人员迁移变更信息、婚姻登记信息等进行多维度挖掘建模,以户系为单位进行归并,递归式的穷尽人员关系分支,自动将具有家族遗传特性的群体归并到同一个家系;2、该算法在每一个户系单位中,以户主为中心进行全方位分析,包括直系亲属关系(如父母、兄弟、子女、孙)、配偶关系、同宗族关系(叔伯、堂兄弟)等,通过”父-子”连线的形式自动绘制出树形结构的家系图谱;3、本专利技术算法参考生物遗传学特性,自动标记出同一家系出不符合生物遗传学关系的人员,如外姓入赘、收养、抱养、随母入、外来迁入等,为群体生物遗传学研究提供更全面的数据变量;4、本算法中对不同家系中存在已知关系的人员,提供了快速合并的方法,以已知关系点,分别向上、向下进行人员家族关系分析,实现“以点带面”的家系快速合并;5、本算法中将特定地域范围的人口以社会关系为纽带进行多维度的本文档来自技高网...

【技术保护点】
1.一种基于社会人口家族关系自动绘制家系图谱的算法,其特征在于,包括以下步骤:/n步骤1:在指定区域内,将相同行政村进行聚合,以行政村以基准进行遍历,声明为:村列表villageList;/n步骤2:遍历村列表villageList,通过行政村主键进行筛选,获取当前行政村下所有的人员姓氏信息,将姓氏进行聚合,声明为surnameList;同时为每个姓氏生成一条家系信息,家系命名规则设定为“行政区划名称+姓氏+家系”,每个姓氏自动对应一个家系;/n步骤3:以行政村和姓氏筛查当前条件下的全部人员户口信息,获取所有的户号集合,声明为familyNoList;/n步骤4:遍历familgyNoList,对当前户号中的所有人员关系进行分析,以户主为起点,算法中通过穷尽人员关系进行家系图谱的连接,穷尽顺序为1.户主本人->2.户主父亲->3.户主爷爷->4.户主叔伯->5.户主兄弟->6.户主堂兄弟->7.主儿子->户主侄子->9.户主孙子->10.其他亲属->11.无户主人员;首先通过户主关系向上辈遍历,上辈至少包括父亲、爷爷、叔伯;,其次向同辈延伸,同辈至少包括兄弟、堂兄弟;再向子孙辈穷尽,孙辈至少包括儿子、侄子、孙子;最后处理无亲属关系和无户主关系人员;/n步骤5:默认情况下,所有户主均归并至当前家系中的第一层级,如果当前家庭关系中存在户主父亲的关系,则变更当前户主为第二层级,将户主父亲设定为第一层级,同理,如果存在户主爷爷的关系,则变更户主父亲为第二层级;/n步骤6:当家庭关系中不存在户主关系时,则按照穷尽顺序进行查找最相近的关系作为本家庭的第一层级进行处理;/n步骤7:当穷尽全部人员关系后,以社会人口关系即非户籍关系中的父亲信息或监护人信息进行再次分析,当查找到父亲信息时,如果父亲存在已知家系,则将当前人员及所在后辈家系关系统一关联至父亲家系中,实现自动关联;/n步骤8:以上步骤全部处理完成后,判断是否仍存在未归并至家系的人员,如果存在,为所有人自动关联一个家系信息,作为独立的家系存在。/n...

【技术特征摘要】
1.一种基于社会人口家族关系自动绘制家系图谱的算法,其特征在于,包括以下步骤:
步骤1:在指定区域内,将相同行政村进行聚合,以行政村以基准进行遍历,声明为:村列表villageList;
步骤2:遍历村列表villageList,通过行政村主键进行筛选,获取当前行政村下所有的人员姓氏信息,将姓氏进行聚合,声明为surnameList;同时为每个姓氏生成一条家系信息,家系命名规则设定为“行政区划名称+姓氏+家系”,每个姓氏自动对应一个家系;
步骤3:以行政村和姓氏筛查当前条件下的全部人员户口信息,获取所有的户号集合,声明为familyNoList;
步骤4:遍历familgyNoList,对当前户号中的所有人员关系进行分析,以户主为起点,算法中通过穷尽人员关系进行家系图谱的连接,穷尽顺序为1.户主本人->2.户主父亲->3.户主爷爷->4.户主叔伯->5.户主兄弟->6.户主堂兄弟->7.主儿子->户主侄子->9.户主孙子->10.其他亲属->11.无户主人员;首先通过户主关系向上辈遍历,上辈至少包括父亲、爷爷、叔伯;,其次向同辈延伸,同辈至少包括兄弟、堂兄弟;再向子孙辈穷尽,孙辈至少包括儿子、侄子、孙子;最后处理无亲属关系和无户主关系人员;
步骤5:默认情况下,所有户主均归并至当前家系中的第一层级,如果当前家庭关系中存在户主父亲的关系,则变更当前户主为第二层级,将户主父亲设定为第一层级,同理,如果存在户主爷爷的关系,则变更户主父亲为第二层级;
步骤6:当家庭关系中不存在户主关系时,则按照穷尽顺序进行查找最相近的关系作为本家庭的第一层级进行处理;
步骤7:当穷尽全部人员关系后,以社会人口关系即非户籍关系中的父亲信息或监护人信息进行再次分析,当查找到父亲信息时,如果父亲存在已知家系,则将当前人员及所在后辈家系关系统一关联至父亲家系中,实现自动关联;
步骤8:以上步骤全部处理完成后,判断是否仍存在未归并至家系的人员,如果存在,为所有人自动关联一个家系信息,作为独立的家系存在。


2...

【专利技术属性】
技术研发人员:李志华秦叶
申请(专利权)人:北京博安智联科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1