一种基于AC自动机的地址标准化方法、装置及设备制造方法及图纸

技术编号:44629510 阅读:21 留言:0更新日期:2025-03-17 18:25
本申请公开了一种基于AC自动机的地址标准化方法、装置及设备,包括:在AC自动机的构建过程中,将地址标准库中的汉字形式的地址作为树节点,确定汉字的树节点间的级别关系,构建汉字树结构;将地址标准库中的拼音形式的地址作为树节点,确定拼音的树节点间的级别关系,构建拼音树结构;响应于地址标准化指令,获取输入到AC自动机的待标准化地址;利用AC自动机对待标准化地址,基于所述汉字树结构及拼音树结构,采用多模态的匹配算法进行地址匹配,根据匹配结果得到标准化地址。以此解决传统的深度学习算法受限于资源的限制、传统匹配算法都是根据字符串匹配进行搜索,然而使用这些算法不能很好的处理地址中存在音同字不同等问题。

【技术实现步骤摘要】

所属的技术人员能够理解,本申请的各个方面可以实现为系统、方法或程序产品。因此,本申请的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。在一些可能的实施方式中,根据本申请的电子设备可以至少包括至少一个处理器、以及至少一个存储器。其中,存储器存储有程序代码,当程序代码被处理器执行时,使得处理器执行本说明书上述描述的根据本申请各种示例性实施方式的监控节点的搜索方法中的步骤。例如,处理器可以执行如监控节点的搜索方法中的步骤。下面参照图4来描述根据本申请的这种实施方式的基于ac自动机的地址标准化设备140。图4显示的基于ac自动机的地址标准化设备140仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。如图4所示,基于ac自动机的地址标准化设备140以通用电子设备的形式表现。基于ac自动机的地址标准化设备140的组件可以包括但不限于:上述至少一个处理器141、上述至少一个存储器142、连接不同系统组件(包括存储器142和处理器141)的总线143。总线1本文档来自技高网...

【技术保护点】

1.一种基于AC自动机的地址标准化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在构建所述汉字树结构/拼音树结构的过程中,还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述多模态的匹配算法包括如下任多种:

4.根据权利要求1或2所述的方法,其特征在于,采用多模态的匹配算法进行地址匹配时,任一模态的匹配算法采用如下方式进行地址匹配:

5.根据权利要求1或2所述的方法,其特征在于,采用多模态的匹配算法进行地址匹配时,任一模态的匹配算法采用如下方式进行地址匹配:

6.根据权利要求1或2所述的方法...

【技术特征摘要】

1.一种基于ac自动机的地址标准化方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,在构建所述汉字树结构/拼音树结构的过程中,还包括:

3.根据权利要求1或2所述的方法,其特征在于,所述多模态的匹配算法包括如下任多种:

4.根据权利要求1或2所述的方法,其特征在于,采用多模态的匹配算法进行地址匹配时,任一模态的匹配算法采用如下方式进行地址匹配:

5.根据权利要求1或2所述的方法,其特征在于,采用多模态的匹配算法进行地址匹配时,任一模态的匹配算法采用如下方式进行地址匹配:

6.根据权利要求1或2所述的方法,其特征在于,基于所述汉字树结构及拼音树结构,采用多...

【专利技术属性】
技术研发人员:王云冲李明达庞江川孙会首
申请(专利权)人:曙光云计算集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1