一种足球球队数据的关联方法及数据校验方法技术

技术编号:24168877 阅读:34 留言:0更新日期:2020-05-16 02:18
本发明专利技术公开了一种足球球队数据的关联方法及数据校验方法,该关联方法包括:先对待匹配的数据源进行预处理,再以第一数据源为基准,选择一球队作为待关联球队,然后根据待关联球队的任一比赛的开赛时间,查询第二数据库中的比赛数据,将满足查询要求的对战双方球队唯一标识组成一个集合,再选取另一场比赛,根据同样的方法组成另一个集合,两个集合进行交集运算,不断重复上述步骤,使得交集运算的结果中只有一个元素或为空集,最后根据交集运算结果,对待关联球队进行关联或标记为特殊球队,结束本次关联。采用本发明专利技术技术方案能够提高自动化关联效率,减少人力介入的人工成本。

A method of football team data association and data verification

【技术实现步骤摘要】
一种足球球队数据的关联方法及数据校验方法
本专利技术涉及计算机
,尤其涉及一种足球球队数据的关联方法及数据校验方法。
技术介绍
在足球体育数据领域,采集多家比赛数据进行校对或者做数据观察前,需要提前对所有数据源中的所有球队进行关联,而同一支球队,在24小时内将不会进行两场以上的比赛。所以即使是不同的数据源,只有将每个数据源中的球队进行相互关联,才能完成后续其他数据(如比赛数据)的自动化关联。而现有技术对于球队的自动化关联方式,是针对未来的比赛赛程,采用双方数据源球队名称字串匹配的方式进行自动化匹配。但是这种自动化匹配方法要求文字完全匹配才能关联成功,对于不同语种数据无法进行关联,即使是同个语种下,单词或翻译不同也会造成关联失败,需要依靠人工介入,手动关联,自动化关联效果极低。如果所需关联的数据库为多个时,关联过程更是繁琐且浪费人力,时间跨度长且较难后续校验。
技术实现思路
本专利技术实施例提供一种足球球队数据的关联方法及数据校验方法,提高自动化关联效率,减少人力介入的人工成本。本专利技术一实施例提供一种足球球队数据的关联方法,包括:步骤1:获取待匹配的第一数据源和第二数据源,分别对所述第一数据源和所述第二数据源的球队数据进行预处理,以使所述第一数据源和所述第二数据源中所记录的所有比赛数据均在同一预设时间间隔内,且所述比赛数据均处于同一时区;其中,一个比赛数据包括:开赛时间和对战双方的球队唯一标识;步骤2:从所述第一数据源中选取一球队作为待关联球队;步骤3:从所述第一数据源中获取所述待关联球队的任一比赛的比赛数据,并根据其开赛时间,查询第二数据源中的所有比赛数据,将满足预设查询要求的比赛数据对应的对战双方球队唯一标识组成一个集合S;步骤4:从所述第一数据源中获取所述待关联球队的任一比赛的比赛数据,并根据其开赛时间,查询第二数据源中的所有比赛数据,将满足预设查询要求的比赛数据对应的对战双方球队唯一标识组成一个集合S2;步骤5:将集合S和集合S2进行交集运算,并将运算结果赋予集合S,返回步骤4,直至所述运算结果中只有一个元素或为空集;步骤6:若所述运算结果为只有一个元素,且在所述元素通过校验后,将所述待关联球队与所述元素进行关联;若所述运算结果为空集,则将所述待关联球队标记为特殊球队,结束本次关联。进一步的,所述步骤1具体为:获取待匹配的第一数据源和第二数据源,分别从所述第一数据源和所述第二数据源中提取K年内的所有比赛数据,并对提取的比赛数据进行时区校准,以使所有比赛数据均处于同一时区内;其中,K为正数。进一步的,所述步骤3和4中的预设查询要求具体为:若所述开赛时间为T,则所述预设查询要求为:比赛的开赛时间必须在时间段[T-D,T+D]内;其中,D为预设的时间间隔。进一步的,在所述步骤6中,若所述运算结果为只有一个元素,通过以下方法校验所述元素,具体为:单独执行N次步骤4,分别获得N个集合,并分别将所述集合S与所述N个集合进行交集运算,判断交集结果是否一直保持只有所述元素;其中,N为正整数;若是,则所述元素通过校验;否则,所述元素不通过校验。进一步的,若所述元素不通过校验,则将所述待关联球队标记为特殊球队,结束本次关联。进一步的,被标记为特殊球队的球队通过字符串匹配方法或人工关联方法完成数据关联。本专利技术另一实施例对应提供了一种足球球队数据关联后的数据校验方法,包括:根据本专利技术所述的足球球队数据的关联方法,分别获得第一数据源在顺序处理下的第一关联结果、所述第一数据源在逆序处理下的第二关联结果、所述第二数据源在顺序处理下的第三关联结果、所述第二数据源在逆序处理下的第四关联结果;将所述第一关联结果、所述第二关联结果、所述第三关联结果和所述第四关联结果进行比较验证;将在四个关联结果中均相同的关联关系,判定为通过本次数据校验;将在四个关联结果中不全相同的关联关系,判定为不通过本次数据校验。进一步的,所述顺序处理具体为:按照球队排列顺序,依次抽取球队作为待关联球队。进一步的,所述逆序处理具体为:按照球队排列逆序,依次抽取球队作为待关联球队。有益效果本专利技术提供了一种足球球队数据的关联方法,先对待匹配的数据源进行预处理,再以第一数据源为基准,选择一球队作为待关联球队,然后根据待关联球队的任一比赛的开赛时间,查询第二数据库中的比赛数据,将满足查询要求的对战双方球队唯一标识组成一个集合,再选取另一场比赛,根据同样的方法组成另一个集合,两个集合进行交集运算,不断重复上述步骤,使得交集运算的结果中只有一个元素或为空集,最后根据交集运算结果,对待关联球队进行关联或标记为特殊球队,结束本次关联。与现有技术相比,本专利技术打破字串匹配的约束,让不同语言的数据源也能轻易匹配,提高自动化关联效率,减少人力介入的人工成本。此外,本专利技术可以一次性完成两个数据源选定时间段内的所有球队的关联工作,选择的时间段更长,完成的球队关联数量更多。另一方面,本专利技术提供了足球球队数据关联后的数据校验方法,根据本专利技术的关联方法,分别获得两个数据源在顺序、逆序处理下的四个关联结果,通过比较验证四个关联结果中所有关联关系,校验关联的准确性。相比于现有技术校验难度大、校验工作繁琐,本专利技术的校验方法能简化校验流程,减少校验工作量,从而提高校验的准确率。附图说明图1是本专利技术提供的足球球队数据的关联方法的一种实施例的流程示意图;图2是本专利技术提供的足球球队数据关联后的数据校验方法的一种实施例的流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术提供的足球球队数据的关联方法的一种实施例的流程示意图,包括步骤1至6,各步骤具体如下:步骤1:获取待匹配的第一数据源和第二数据源,分别对第一数据源和第二数据源的球队数据进行预处理,以使第一数据源和第二数据源中所记录的所有比赛数据均在同一预设时间间隔内,且比赛数据均处于同一时区;其中,一个比赛数据包括:开赛时间和对战双方的球队唯一标识。在本实施例中,步骤1具体为:获取待匹配的第一数据源和第二数据源,分别从所述第一数据源和所述第二数据源中提取K年内的所有比赛数据,并对提取的比赛数据进行时区校准,以使所有比赛数据均处于同一时区内;其中,K为正数。K可以有数据源的实际情况确定。在本实施例中,一个数据源包含多个球队的多个比赛数据,一个比赛数据对应一个比赛。比赛数据包含开赛时间和对战双方的球队唯一标识,两家数据源的球队标识分别记为Ai,(i=1,…,nA),Bj,(j=1,…,nB)。在本实施例中,对数据源的比赛数据进行时区校本文档来自技高网...

【技术保护点】
1.一种足球球队数据的关联方法,其特征在于,包括:/n步骤1:获取待匹配的第一数据源和第二数据源,分别对所述第一数据源和所述第二数据源的球队数据进行预处理,以使所述第一数据源和所述第二数据源中所记录的所有比赛数据均在同一预设时间间隔内,且所述比赛数据均处于同一时区;其中,一个比赛数据包括:开赛时间和对战双方的球队唯一标识;/n步骤2:从所述第一数据源中选取一球队作为待关联球队;/n步骤3:从所述第一数据源中获取所述待关联球队的任一比赛的比赛数据,并根据其开赛时间,查询第二数据源中的所有比赛数据,将满足预设查询要求的比赛数据对应的对战双方球队唯一标识组成一个集合S;/n步骤4:从所述第一数据源中获取所述待关联球队的任一比赛的比赛数据,并根据其开赛时间,查询第二数据源中的所有比赛数据,将满足预设查询要求的比赛数据对应的对战双方球队唯一标识组成一个集合S

【技术特征摘要】
1.一种足球球队数据的关联方法,其特征在于,包括:
步骤1:获取待匹配的第一数据源和第二数据源,分别对所述第一数据源和所述第二数据源的球队数据进行预处理,以使所述第一数据源和所述第二数据源中所记录的所有比赛数据均在同一预设时间间隔内,且所述比赛数据均处于同一时区;其中,一个比赛数据包括:开赛时间和对战双方的球队唯一标识;
步骤2:从所述第一数据源中选取一球队作为待关联球队;
步骤3:从所述第一数据源中获取所述待关联球队的任一比赛的比赛数据,并根据其开赛时间,查询第二数据源中的所有比赛数据,将满足预设查询要求的比赛数据对应的对战双方球队唯一标识组成一个集合S;
步骤4:从所述第一数据源中获取所述待关联球队的任一比赛的比赛数据,并根据其开赛时间,查询第二数据源中的所有比赛数据,将满足预设查询要求的比赛数据对应的对战双方球队唯一标识组成一个集合S2;
步骤5:将集合S和集合S2进行交集运算,并将运算结果赋予集合S,返回步骤4,直至所述运算结果中只有一个元素或为空集;
步骤6:若所述运算结果为只有一个元素,且在所述元素通过校验后,将所述待关联球队与所述元素进行关联;若所述运算结果为空集,则将所述待关联球队标记为特殊球队,结束本次关联。


2.根据权利要求1所述的足球球队数据的关联方法,其特征在于,所述步骤1具体为:
获取待匹配的第一数据源和第二数据源,分别从所述第一数据源和所述第二数据源中提取K年内的所有比赛数据,并对提取的比赛数据进行时区校准,以使所有比赛数据均处于同一时区内;其中,K为正数。


3.根据权利要求1所述的足球球队数据的关联方法,其特征在于,所述步骤3和4中的预设查询要求具体为:
若所述开赛时间为T,则所述预设查询要求为:比赛的开赛时间必须在时间段[T-D,T+D]内;其...

【专利技术属性】
技术研发人员:姚名峰陈岳强张斌陈佳立
申请(专利权)人:汕头市同行网络科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1