System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 公司名称库更新方法、装置、计算机设备及存储介质制造方法及图纸_技高网

公司名称库更新方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:42026276 阅读:18 留言:0更新日期:2024-07-16 23:16
本申请提供一种公司名称库更新方法、装置、计算机设备及存储介质,方法包括:获取物流寄递数据;基于预设的公司名地址筛选算法,对物流寄递数据进行地址筛选,得到公司名地址信息;获取公司名地址信息中包含的公司名称信息;基于预存的公司名称数据库,分析公司名称信息的切词结果,以对公司名称数据库进行更新。采用本方法,通过结合人工智能技术高效地从物流信息中提取出公司名称信息用以更新公司名称数据库,即可利用更新后的公司名称数据库提升用户物流体验度。

【技术实现步骤摘要】

本申请实施例涉及物流,特别是涉及一种公司名称库更新方法、装置、计算机设备及存储介质


技术介绍

1、随着物流产业的不断发展,物流服务越来越趋向于专业化与精细化;与此同时,物流企业虽然也在快速成长中,但由于其覆盖范围日益扩张,致使客户类型及数量越来越多,数据管理难度越来越大。

2、目前,由于用户在填写物流信息时普遍会将地址、收件人、电话、公司名等信息进行一次性粘贴,不仅会使系统计算物流费用的难度增加,也不利于差异化的用户管理,尤其是存在特殊物流需求的公司类型用户。因此,需对每个部分的物流信息进行切分,如切分抽取出物流信息中包含的公司名称,一方面可获取该公司物流要求,从而基于该公司名称对应的行政区域进行费用计算,另一方面也可将用户所填信息进行标准化完善,避免后续分拣及派件时出现因名称不统一而影响物流周期的情况出现。然而,由于目前大量物流信息填写的格式不统一,无法用简单的规则准确的抽取出公司名称信息,而且公司名称的写法多样,若用人工抽取和迭代,则效率低下,严重影响了用户使用体验。

3、因此,现有从地址中提取公司名称的方式存在着信息提取效率低,导致用户物流体验度不佳的技术问题。


技术实现思路

1、本申请的目的在于提供一种公司名称库更新方法、装置、计算机设备及存储介质,用以通过结合人工智能技术高效地从物流信息中提取出公司名称信息用以更新公司名称数据库,以便利用更新优化后的公司名称数据库改善用户的物流体验。

2、第一方面,本申请提供一种公司名称库更新方法,包括:

3、获取物流寄递数据;

4、基于预设的公司名地址筛选算法,对物流寄递数据进行地址筛选,得到公司名地址信息;

5、获取公司名地址信息中包含的公司名称信息;

6、基于预存的公司名称数据库,分析公司名称信息的切词结果,以对公司名称数据库进行更新。

7、在本申请一些实施例中,物流寄递数据包括地址信息和地址兴趣点,公司名地址筛选算法包括关键词筛选算法、画像筛选算法以及属性筛选算法中的至少一个;其中,基于预设的公司名地址筛选算法,对物流寄递数据进行地址筛选,得到公司名地址信息,包括:基于关键词筛选算法,从物流寄递数据中筛选出包含有预设关键词的地址信息,作为公司名地址信息;和/或基于画像筛选算法,对物流寄递数据中的地址信息进行信息聚合,统计得到各地址信息对应的收寄件量数据和目标物品占比之后,从物流寄递数据中筛选出收寄件量数据满足预设变化形态,以及目标物品占比满足预设占比条件的地址信息,作为公司名地址信息;和/或基于属性筛选算法,从物流寄递数据中筛选出对应地址兴趣点为预设兴趣点的地址信息,作为公司名地址信息。

8、在本申请一些实施例中,获取所述公司名地址信息中包含的公司名称信息,包括:将公司名地址信息输入至已训练的实体识别模型中进行实体识别,得到标注有公司名属性信息和地址分级信息的公司名地址信息;其中,公司名属性信息包括区域属性、品牌属性、行业属性以及组织属性中的至少一个;分析公司名属性信息和地址分级信息,得到公司名地址信息中的目标实体信息;其中,目标实体信息包括目标区域信息、目标品牌信息、目标行业信息以及目标组织信息中的至少一个;解析目标实体信息,得到公司名称信息。

9、在本申请一些实施例中,在将公司名地址信息输入至已训练的实体识别模型中进行实体识别,得到标注有公司名属性信息和地址分级信息的公司名地址信息之前,还包括:构建初始的实体识别模型;其中,初始的实体识别模型是由bert模型、lstm模型以及crf模型组合构成的;获取公司名地址数据集;其中,公司名地址数据集包括多个已标注有公司名属性信息和地址分级信息的历史公司名地址;使用公司名地址数据集对初始的实体识别模型进行训练,得到已训练的实体识别模型。

10、在本申请一些实施例中,获取公司名地址数据集,包括:获取历史寄递数据;基于预设的公司名地址筛选算法,对历史寄递数据进行地址筛选,得到历史公司名地址;对历史公司名地址进行公司名切词、公司名语义归一以及公司名标注处理,得到公司名地址数据集。

11、在本申请一些实施例中,历史公司名地址包括加密电话信息,对历史公司名地址进行公司名切词、公司名语义归一以及公司名标注处理,得到公司名地址数据集,包括:对历史公司名地址进行切词处理,得到历史区域信息、历史品牌信息、历史行业信息以及历史组织信息中的至少一个,作为公司名称元素;基于加密电话信息,对历史公司名地址进行聚合处理,以统计与加密电话信息关联的各历史公司名地址所含公司名称的公司名称元素数量;基于公司名称元素数量,确定与加密电话信息关联的标准公司名称,并对标准公司名称进行公司名属性标注及地址分级标注,得到公司名地址数据集。

12、在本申请一些实施例中,公司名称数据库中存储有历史公司名地址包含的公司名称、公司名称对应的标准公司名称以及标准公司名称对应的区域信息、品牌信息、行业信息以及组织信息;其中,基于预存的公司名称数据库,分析公司名称信息的切词结果,以对公司名称数据库进行更新,包括:获取公司名称信息的切词结果,得到目标区域信息、目标品牌信息、目标行业信息以及目标组织信息中的至少一个;若切词结果包含目标区域信息,则从公司名称数据库中筛选出与目标区域信息相匹配的公司名称或标准公司名称,作为候选公司名称;若候选公司名称的品牌信息与目标品牌信息之间存在匹配结果,且候选公司名称的行业信息与目标行业信息之间存在匹配结果,则将公司名称信息存入至公司名称数据库中,并与候选公司名称关联映射,以对公司名称数据库进行更新。

13、在本申请一些实施例中,物流寄递数据还包括加密电话信息,公司名称库更新方法还包括:若候选公司名称的品牌信息与目标品牌信息之间不存在匹配结果,则获取候选公司名称对应的加密电话信息作为第一加密电话,并获取公司名称信息对应的加密电话信息作为第二加密电话;若第一加密电话与第二加密电话匹配一致,则基于预设的文本相似度算法,计算候选公司名称与公司名称信息之间的文本相似度;若文本相似度大于或等于预设的相似度阈值,则将公司名称信息存入至公司名称数据库中,并与候选公司名称关联映射,以对公司名称数据库进行更新。

14、在本申请一些实施例中,在从公司名称数据库中筛选出与目标区域信息相匹配的公司名称或标准公司名称,作为候选公司名称之后,还包括:将候选公司名称的品牌信息与目标品牌信息进行最大正向匹配,判断品牌信息与目标品牌信息是否存在匹配结果;若品牌信息与目标品牌信息之间按序存在相同字符,则判定品牌信息与目标品牌信息之间存在匹配结果。

15、第二方面,本申请提供一种公司名称库更新装置,包括:

16、数据获取模块,用于获取物流寄递数据;

17、地址筛选模块,用于基于预设的公司名地址筛选算法,对物流寄递数据进行地址筛选,得到公司名地址信息;

18、地址处理模块,用于获取公司名地址信息中包含的公司名称信息;

19、名库优化模块,用于基本文档来自技高网...

【技术保护点】

1.一种公司名称库更新方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述物流寄递数据包括地址信息和地址兴趣点,所述公司名地址筛选算法包括关键词筛选算法、画像筛选算法以及属性筛选算法中的至少一个;

3.如权利要求1所述的方法,其特征在于,所述获取所述公司名地址信息中包含的公司名称信息,包括:

4.如权利要求3所述的方法,其特征在于,在所述将所述公司名地址信息输入至已训练的实体识别模型中进行实体识别,得到标注有公司名属性信息和地址分级信息的公司名地址信息之前,还包括:

5.如权利要求4所述的方法,其特征在于,所述获取公司名地址数据集,包括:

6.如权利要求5所述的方法,其特征在于,所述历史公司名地址包括加密电话信息,所述对所述历史公司名进行公司名切词、公司名语义归一以及公司名标注处理,得到所述公司名地址数据集,包括:

7.如权利要求1至6中任一项所述的方法,其特征在于,所述公司名称数5据库中存储有历史公司名地址包含的公司名称、所述公司名称对应的标准公司名称以及所述标准公司名称对应的区域信息、品牌信息、行业信息以及组织信息;

8.如权利要求7所述的方法,其特征在于,所述物流寄递数据还包括加密电话信息,所述方法还包括:

9.如权利要求7或8所述的方法,其特征在于,在所述从所述公司名称数据库中筛选出与所述目标区域信息相匹配的公司名称或标准公司名称,作为候选公司名称之后,还包括:

10.一种公司名称库更新装置,其特征在于,包括:

11.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至9中任一项所述公司名称库更新方法中的步骤。

...

【技术特征摘要】

1.一种公司名称库更新方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,所述物流寄递数据包括地址信息和地址兴趣点,所述公司名地址筛选算法包括关键词筛选算法、画像筛选算法以及属性筛选算法中的至少一个;

3.如权利要求1所述的方法,其特征在于,所述获取所述公司名地址信息中包含的公司名称信息,包括:

4.如权利要求3所述的方法,其特征在于,在所述将所述公司名地址信息输入至已训练的实体识别模型中进行实体识别,得到标注有公司名属性信息和地址分级信息的公司名地址信息之前,还包括:

5.如权利要求4所述的方法,其特征在于,所述获取公司名地址数据集,包括:

6.如权利要求5所述的方法,其特征在于,所述历史公司名地址包括加密电话信息,所述对所述历史公司名进行公司名切词、公司名语义归一以及公司名标注处理...

【专利技术属性】
技术研发人员:陈晓安张定棋
申请(专利权)人:丰图科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1