一种基于户籍信息数据的亲属关系分析方法技术

技术编号:13505287 阅读:220 留言:0更新日期:2016-08-10 12:09
本发明专利技术提供一种基于户籍信息数据的亲属关系分析方法,包括以下步骤:步骤S1:将亲属关系中的基础类关系用字母和数字字符进行编码,获得基础类关系的字符编码集;步骤S2:约定连接符号,其是连接所述基础类关系对应的字符编码的符号;以及约定正向关系及逆向关系,将已知的亲属关系定义为正向关系,与正向关系相对的另一个关系定义为逆向关系;步骤S3:根据待分析亲属关系的数据,通过所述字符编码和所述连接符号、逆向关系获得表示所述待分析亲属关系的字符串;步骤S4:根据化简规则对所述字符串化简,获得长度小于等于原字符串的新字符串;以及步骤S5:根据匹配规则对化简后的新字符串进行字符串匹配,获得待分析亲属关系的分析结果。

【技术实现步骤摘要】

本专利技术涉及智能信息处理技术,特别涉及基于户籍信息数据的亲属关系的编码和分析方法。
技术介绍
对家庭关系网的数据挖掘技术应用在案件侦破、银行征信、反欺诈分析、金融风险评估等关系公共安全和经济民生的诸多领域。户籍信息数据主要由居民家庭信息、居民个人信息以及与户籍变动记录几部分组成,为家庭关系网络分析提供了优质数据。居民户籍信息数据(以下简称户籍数据)的内容示意图如表1所示,包括了:家庭识别编号(以下简称“户号ID”)是居民所在家庭的标识;居民个人身份识别编号(简称“人员ID”)是个体识别标识,个人信息包括姓名、性别、出生日期、人员ID与户主人员ID的亲属关系(以下简称“与户主关系”)等。为了便于记录关系数据,户籍信息系统中对90余类关系用2~99的整数进行数字化编码,如表2所示。表1.户籍数据表2.户籍数据关系数字化编码表(部分内容)目前,户籍数据记录了以户主人员为中心,其他家庭成员与户主的单向的关系数据。但是,当需要调查户主与其他成员、非户主成员彼此间的相互关系时,超出了户籍数据记录内容,无法根据户籍数据获得。以表1为例,户籍数据中记录的关系信息包括:【张妻】与【张户主】的亲属关系为【妻】,即【张妻】是【张户主】的【妻】;【张子】与【张户主】的亲属关系为【子】,即【张子】是【张户主】的【子】;表1隐含的潜在关系信息包括:1.户主与其他成员关系,比如:【张户主】与【张妻】的亲属关系为【夫】;【张户主】与【张子】的亲属关系为【父】;2.非户主成员之间的关系,比如:【张子】与【张妻】的亲属关系为【子】;【张妻】与【张子】的亲属关系为【母】;但是,上述潜在的关系无法根据户籍数据直接查询。如表2所示,为了描述关系类数据,称谓所使用的数字化编码超过了90个,即便如此仍然只能表示有限的常用称谓,超出的部分无法登记。增加称谓以及对应的数字编码,充实亲属关系称谓表内容,无论在设计还是使用都会更加不方便。
技术实现思路
本专利技术的目的是改进现有户籍数据中户籍信息中描述亲属关系类数据的数字编码方法,针对目前使用的户籍信息中亲属关系类数据可计算性差,无法发掘潜在亲属关系的问题,提供一种基于户籍信息数据亲属关系的字符编码,通过字符串操作实现化简和匹配,分析潜在亲属关系的方法。本专利技术的一种基于户籍信息数据的亲属关系分析方法,包括如下步骤:步骤S1:将亲属关系中的基础类关系用字母和数字字符进行编码,获得基础类关系的字符编码集;步骤S2:约定连接符号,其是连接所述基础类关系对应的字符编码的符号;以及约定正向关系及逆向
关系,将已知的亲属关系定义为正向关系,与正向关系相对的另一个关系定义为逆向关系;步骤S3:根据待分析亲属关系的数据,通过所述字符编码和所述连接符号、逆向关系获得表示所述待分析亲属关系的字符串;步骤S4:根据化简规则对所述字符串化简,获得长度小于等于原字符串的新字符串;以及步骤S5:根据匹配规则对化简后的新字符串进行字符串匹配,获得待分析亲属关系的分析结果。本专利技术的有益效果在于:通过本专利技术的方法,基于户籍数据的亲属关系类型数据的单向关系数据,实现关系数据的累加和分析,可计算性好,能够快速、有效地发掘和获得潜在的亲属关系的关系网络。附图说明图1是根据本专利技术的基于户籍信息数据的亲属关系分析方法的流程图。图2是正向关系、逆向关系示意图(以表1中数据为例)。具体实施方式以下结合附图对本专利技术进行详细说明。以下实施例并不是对本专利技术的限制。在不背离专利技术构思的精神和范围下,本领域技术人员能够想到的变化和优点都被包括在本专利技术中。图1是本专利技术的一种基于户籍信息数据的亲属关系分析方法的流程图。如图1所示,本专利技术通过亲属关系累加计算,可以实现计算机处理亲属类数据关系的目的,包括以下具体步骤:首先是对将亲属关系中的基础类关系用字母和数字字符进行编码,获得基础类关系的字符编码集(步骤S1)。类似于数字可以用0-9的阿拉伯数字来表示,将亲属关系中的基础类关系的集合用字母和数字字符进行编码。组成基础类关系的元素称为基础类关系元素。为了方便用户使用和计算机处理,将基础类关系元素“父”用F标识、“母”用M标识。以分析户籍数据应用场景为例,基础类关系集以及其对应字符编码集如表3所示:表3.基础类关系集以及对应字符编码集字符编码集可以根据应用场景增加所用编码字符的个数或者改变编码具体符号。接下来,约定连接符号以及约定正向关系及逆向关系(步骤S2)。连接符号是用于连接所述基础类关系对应的字符编码的符号,体现相邻关系字符的某种逻辑关系,也是编码字符串的切分标识。连接符号包括:关系累加符号、关系并列符号和关系等价符号。以分析户籍数据为例:关系累加符号(用“+”表示),表示相邻字符是累加的关系。(字符1)+(字符2)表示(基础类关系1)的(基础类关系2)。例如:父亲的父亲,记成F+F。关系编码字符并列符号(用“&”表示),表示相邻字符是并列的关系。(字符1)&(字符2)表示(基础类关系1)或(基础类关系2)。例如:姐姐或妹妹,记成j&m。关系字符串并列符号(用“;”表示),表示相邻字符串是并列关系,与上述&区别在于分号“;”表示字符串并列,“&”表示字符并列。关系等价符号(用“=”表示),表示两端亲属关系逻辑是相互等价的。比如父=F,祖父=F+F。可以根据需要增加或者替换关系字符集所使用字符以及关系连接符号。通常户籍信息中记录的关系数据是单向的,亲属关系(或称谓)总是成对出现,为了方便表示相互关系,约定正向关系及逆向关系,即将已知的亲属关系定义为正向关系,与正向关系相对的另一个关系定义为逆向关系。例如:已知【张子】指向【张户主】的关系是【子】,按照上述人为约定将【张子】指向【张户主】的关系视为正向关系,【张户主】指向【张子】视为逆向关系。根据即的起点人员(正向关系中被指向人员)的性别,逆向关系进一步分成“逆向男”和“逆向女”两类。例如逆向关系起点人员【张户主】为男性,则【张户主】指向【张子】的关系是【父】;如果【张户主】是女性,则【张户主】指向【张子】的关系是【母】。下一步,根据待分析亲属关系的数据,通过前述步骤S1和步骤S2定义的字符编码和连接符号、逆向关系获得表示该待分析亲属关系的字符串(步骤S3)。该字符串通过连接符号将待分析亲属关系路径中相邻节点之间关系对应的字符编码依次连接而获得。例如,字符串“F+F”作为字符编码表达式表示父亲的父亲,即祖父。如何获得待分析亲属关系的字符串将在下文的具体实施方式中进一步详细说明。接下来,根据化简规则对所述字符串化简,获得长度小于等于原字符串的新字符串(步骤S4)。原字符串和新字符串表示的亲属逻辑关系不变。例如:M+H表示母亲的丈夫等价于父亲F,新编码F字符长度小于M+H字符串长度。编码化简是等价的亲属关系编码字符串之间的映射关系。这里的化简规则是根据步骤S1和步骤S2定义的字符编码和连接符号、关系而设定的。具体地,在字符编码集合中选择两个编码字符用+连接,如果累加结果(步骤S3获得的字符串)能够被化简,将该组合与其化简结果对应。例如表5所示:表达式化简结果…………H+zzH+nnF+WMF+zx&dF+nj&mM+HFM+zx&dM+nj&am本文档来自技高网
...

【技术保护点】
一种基于户籍信息数据的亲属关系分析方法,其特征在于,包括如下步骤:步骤S1:将亲属关系中的基础类关系用字母和数字字符进行编码,获得基础类关系的字符编码集;步骤S2:约定连接符号,其是连接所述基础类关系对应的字符编码的符号;以及约定正向关系及逆向关系,将已知的亲属关系定义为正向关系,与正向关系相对的另一个关系定义为逆向关系;步骤S3:根据待分析亲属关系的数据,通过步骤S1和步骤S2中的所述字符编码和所述连接符号、正向关系、逆向关系形成表示所述待分析亲属关系的字符串;步骤S4:根据化简规则对所述字符串化简,获得长度小于等于原字符串的新字符串;以及步骤S5:根据匹配规则对化简后的新字符串进行字符串匹配,获得待分析亲属关系的分析结果。

【技术特征摘要】
1.一种基于户籍信息数据的亲属关系分析方法,其特征在于,包括如下步骤:步骤S1:将亲属关系中的基础类关系用字母和数字字符进行编码,获得基础类关系的字符编码集;步骤S2:约定连接符号,其是连接所述基础类关系对应的字符编码的符号;以及约定正向关系及逆向关系,将已知的亲属关系定义为正向关系,与正向关系相对的另一个关系定义为逆向关系;步骤S3:根据待分析亲属关系的数据,通过步骤S1和步骤S2中的所述字符编码和所述连接符号、正向关系、逆向关系形成表示所述待分析亲属关系的字符串;步骤S4:根据化简规则对所述字符串化简,获得长度小于等于原字符串的新字符串;以及步骤S5:根据匹配规则对化简后的新字符串进行字符串匹配,获得待分析亲属关系的分析结果。2.根据权利要求1所述的方法,其特征在于,步骤S2中,所述连接符号包括:关系累加符号、关系编码字符并列符号、关系字符串并列符号和关系等价符号。3.根据权利要求2所述的方法,其特征在于,步骤S2中,逆向关系进一步包括“逆向男”和“逆向女”两类关系。4.根据权利要求3所述的方法,其特征在于,根据前述步骤S1和步骤S2定义和约定的字符编码和连接符号、关系进一步建立映射关系表,即数字编码至字符编码的映射关系,并根据所述映射关系创建字典,包括编码规则字典、化简规则字典和匹配规则字典。5.根据权利要求4所述的方法,其特征在于,步骤S3中,所述字符串利用所述编码规则字典通过所述...

【专利技术属性】
技术研发人员:郝明瑞张如高彭莉张伟虞正华
申请(专利权)人:博康智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1