【技术实现步骤摘要】
一种快递信息补全方法和系统
[0001]本专利技术涉及知识图谱
,具体涉及一种快递信息补全方法和系统。
技术介绍
[0002]给定模糊信息,对其进行信息匹配并进一步补全需要用到知识图谱实体抽取技术,包含知识库中的实体、归类和链接。实体消歧和实体链接是一个统一的任务,通过将具有歧义的实体指称项链接到给定的知识库中从而实现实体歧义的消除,能够较好解决一词多义问题。
[0003]现存在脱敏的快递数据,公共安全系统无法精准分析使用,需要对现有脱敏快递数据进行反脱敏补齐,方便公共安全系统基于反脱敏数据精准业务分析。
技术实现思路
[0004]为解决上述技术问题,本专利技术提供一种快递信息补全方法和系统。
[0005]为解决上述技术问题,本专利技术采用如下技术方案:
[0006]一种快递信息补全方法,包括以下步骤:
[0007]步骤A:将脱敏的快递信息M以特定格式作为参数在大数据平台中进行数据碰撞,数据碰撞所用的基础库包括手机号码专题库、手机号码置信度库和地址专题库;数据碰撞具体包括 ...
【技术保护点】
【技术特征摘要】
1.一种快递信息补全方法,包括以下步骤:步骤A:将脱敏的快递信息M以特定格式作为参数在大数据平台中进行数据碰撞,数据碰撞所用的基础库包括手机号码专题库、手机号码置信度库和地址专题库;数据碰撞具体包括:步骤A1:基于特定地区H的常住人口库数据进行数据碰撞,如果碰撞失败则进行步骤A2,如果碰撞成功则得到碰撞结果数据集C1,通过步骤B将快递信息M与碰撞结果数据集C1进行匹配;步骤A2:基于特定地区H的健康码出入库数据进行数据碰撞,如果碰撞失败则进行步骤A3,如果碰撞成功则得到碰撞结果数据集C2,通过步骤B将快递信息M与碰撞结果数据集C2进行匹配;步骤A3:基于特定地区H的实有人口库数据进行数据碰撞,如果碰撞成功则得到碰撞结果数据集C3,通过步骤B将快递信息M与碰撞结果数据集C3进行匹配;步骤B:快递信息M与碰撞结果数据集C1、或与碰撞结果数据集C2、或与碰撞结果数据集C3进行匹配,在碰撞结果数据集C1、C2或C3中找到与快递信息M最接近的数据Z;步骤C:通过数据Z对快递信息M进行信息补全,实现快递信息M的反脱敏。2.根据权利要求1所述的快递信息补全方法,其特征在于,步骤B中,在碰撞结果数据集C1、C2或C3中匹配与快递信息M最接近的数据Z时,当满足以下条件之一时,得到数据Z:将快递信息M与碰撞结果数据集的常住地址名称进行相似度匹配或者进行文本向量对比,相似度匹配结果或者向量...
【专利技术属性】
技术研发人员:郭庆浪,刘跃,吴曼青,廖勇,蒋能莹,
申请(专利权)人:中国科学技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。