知识库构建方法及装置制造方法及图纸

技术编号:20842310 阅读:25 留言:0更新日期:2019-04-13 08:43
本申请公开了一种知识库构建方法及装置。方法包括对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。从而可以确定各个待关联金融数据之间的相互关联性,从而便于对金融数据进行统计或归类。此外,还能在使关联金融数据存储进知识库之后彼此间能够产生时间上的联系。

【技术实现步骤摘要】
知识库构建方法及装置
本申请涉及知识库数据处理
,具体而言,涉及一种适用于金融数据的知识库构建方法及装置。
技术介绍
随着金融数据模式的多样化,原本只基于文本金融数据的KBC(知识库构建)技术已经逐渐落后。在金融领域中,需要对许多金融数据进行关联,以便对金融数据进行统计或归类,但是由于金融数据的来源不同,从而导致具有关联关系的金融数据的记录方式不同,例如,对于金融数据的名称,有些金融数据记录的是全称,有些金融数据记录的是简称,还有一些金融数据记录的是英文简写,从而导致金融数据不能进行有效关联,上述问题目前尚未提出有效的解决方法。此外,金融数据在生成候选集的时候,候选关系的生成没有考虑时效性,有的候选关系可能随着时间的推移而不再存在,但是知识库中并没有更新。针对相关技术中存在的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种将金融数据进行准确有效关联,且将其进行存储时有效考虑时效性的知识库构建方法及装置,以解决相关技术中存在的问题。为了实现上述目的,根据本申请的一个方面,提供了一种知识库构建方法。根据本申请的知识库构建方法包括:对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。进一步的,如前述的知识库构建方法,所述对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性,包括:预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;分别确定所述进行比对的待关联金融数据的属性的语义和语法;根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。进一步的,如前述的知识库构建方法,所述将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据,包括:利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。进一步的,如前述的知识库构建方法,还包括:预先确定从知识库中匹配数据的匹配函数库;在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。进一步的,如前述的知识库构建方法,还包括:接收对所述知识库中的关联金融数据的进行编辑的编辑指令;根据所述编辑指令对所述关联金融数据的进行编辑,并更新所述关联金融数据的时间属性。为了实现上述目的,根据本申请的另一方面,提供了一种知识库构建装置。根据本申请的知识库构建装置包括:比对单元,用于对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;关联单元,用于将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;时间属性确定单元,用于将关联金融数据写入知识库时,实时确定每个关联金融数据写入知识库的时间,以根据所述时间生成对应的时间属性;时间属性添加单元,用于对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。进一步的,如前述的知识库构建装置,所述比对单元,包括:相似度阈值设定模块,用于预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;属性比对模块,用于分别确定所述进行比对的待关联金融数据的属性的语义和语法;相似度确定模块,用于根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;判定模块,用于当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。进一步的,如前述的知识库构建装置,所述关联单元,包括:筛选模块,用于利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;相同属性确定模块,用于将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;关联金融数据获取模块,用于将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。进一步的,如前述的知识库构建装置,还包括:匹配函数单元;所述匹配函数单元包括:匹配函数库确定模块,用于预先确定从知识库中匹配数据的匹配函数库;匹配函数添加模块,用于在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。进一步的,如前述的知识库构建装置,还包括:编辑单元;所述编辑单元包括:编辑指令接收模块,用于接收对所述知识库中的关联金融数据的进行编辑的编辑指令;时间属性更新模块,用于根据所述编辑指令对所述关联金融数据的进行编辑,并更新所述关联金融数据的时间属性。在本申请实施例中,通过对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。从而可以确定出各个待关联金融数据之间的相互关联性,从而便于对金融数据进行统计或归类。此外,通过对加入所述知识库中的每个关联金融数据添加对应的所述时间属性,使得关联金融数据存储进知识库之后彼此间能够产生时间上的联系。如果金融数据出现变化,就将已经更新过的金融数据重新输入并加上了新的时间,这样原本的候选关系集也就得到了更新,最后产生的知识库便也可以更新。达到了知识库便可以根据金融数据的更新而更新,知识库也就有了时效性的目的。附图说明构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:图1是根据本申请一种实施例的知识库构建方法流程示意图;图2是根据图1所示步骤S1的一种实施例的方法流程示意图;图3是根据图1所示步骤S2的一种实施例的方法流程示意图;图4是根据本申请一种实施例的对知识库中的关联金融数据进行编辑的方法流程示意图;图5是根据本申请一种实施例的对知识库中的关联金融数据进行排序的方法流程示意图;以及图6是根据本申请一种实施例的知识库构建装置的功能模块结构示意图。具体实施方式为了使本
的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实本文档来自技高网
...

【技术保护点】
1.一种知识库构建方法,其特征在于,包括:对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。

【技术特征摘要】
1.一种知识库构建方法,其特征在于,包括:对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性;其中,所述待关联金融数据包括两个或两个以上;将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据;将关联金融数据写入知识库时,实时确定每个关联金融数据写入所述知识库的时间,以根据所述时间生成对应的时间属性;对加入所述知识库中的每个关联金融数据添加对应的所述时间属性;并得到数据更新后的知识库。2.根据权利要求1所述的知识库构建方法,其特征在于,所述对所有待关联金融数据进行两两比对,以确定进行比对的待关联金融数据之间是否存在相关联的属性,包括:预先设定用于判断进行比对的待关联金融数据之间是否相似的相似度阈值;分别确定所述进行比对的待关联金融数据的属性的语义和语法;根据所述进行比对的待关联金融数据的属性的语义和语法,确定所述进行比对的待关联金融数据之间的相似度;当所述相似度大于或等于所述相似度阈值时,判定所述进行比对的待关联金融数据之间存在相关联的属性。3.根据权利要求1所述的知识库构建方法,其特征在于,所述将两两之间具有相关联属性的待关联金融数据进行关联,以得到关联金融数据,包括:利用度量学习得到的模型,对所述存在相关联的属性的待关联金融数据进行筛选;将符合所述模型的要求的待关联金融数据确定为具有相同属性的待关联金融数据;将具有相同属性的待关联金融数据进行关联,以得到关联金融数据。4.根据权利要求1所述的知识库构建方法,其特征在于,还包括:预先确定从知识库中匹配数据的匹配函数库;在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。5.根据权利要求1所述的知识库构建方法,其特征在于,还包括:接收对所述知识库中的关联金融数据的进行编辑的编辑指令;根据所述编辑指令对所述关联金融数据的进行编辑,并更新所述关联金融数据的时间属性。6.一种知识库构建装置,其特征在于,包括:比对单元,用于对所有待关联金融数据进行两两比对,以确定进行比对的待关...

【专利技术属性】
技术研发人员:郑博叶天生梁栋王宏志
申请(专利权)人:北京松鼠山科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1