System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及计算机,特别是涉及一种数据处理方法、数据处理装置、计算机设备、计算机可读存储介质和计算机程序产品。
技术介绍
1、近年来,随着智慧城市的建设发展,城市信息化由数字城市转变到智慧城市,时空数据在智慧城市建设中发挥重要的作用。房屋地址数据是一种地理空间表达方式,其是城市管理中位置信息的重要参照物,也是向用户展示房屋资源信息的核心数据,因此这对房屋地址的检索匹配技术提出了新的要求。
2、在当前的房屋地址匹配的过程中,常常存在用户输入的原始房屋地址的错误或者关键地址信息的缺失的问题,导致房屋地址的匹配率和正确率并不高,从而使得后续基于房屋地址所确定的房屋资源信息的数据也不够准确,这给房屋地址的精准匹配带来了一定的不便。
技术实现思路
1、针对上述问题,本公开提供一种数据处理方法、数据处理装置、计算机设备、计算机可读存储介质和计算机程序产品。本公开的技术方案如下:
2、根据本公开实施例的第一方面,提供一种数据处理方法,包括:
3、获取用户账户输入的文字信息和所述用户账户的账户信息;所述文字信息为所述用户账户以自然语言形式表达的房屋地址,所述文字信息和所述账户信息均属于大数据范畴的信息数据;
4、对所述文字信息进行结构化处理,得到对应标准化结构的用户地址词组;所述标准化结构基于房屋所在的省份名称-城市名称-楼盘名称-门牌地址-楼栋编号-单元编号-房间编号表征;其中,所述用户地址词组基于所述“省份名称”、所述“城市名称”、所述“楼盘名称”
5、在预设的数据库中,基于所述账户信息索引出匹配于所述用户地址词组的目标地址词组;
6、在预设的房屋资源信息表中,索引出关联于所述目标地址词组的房屋资源信息,并将所述房屋资源信息进行展示。
7、在一示例性实施例中,在所述数据库中包括历史匹配记录表;所述历史匹配记录表用于记录已匹配成功的历史词组;
8、所述在预设的数据库中,基于所述账户信息索引出匹配于所述用户地址词组的目标地址词组,包括:
9、从所述数据库中提取出所述历史匹配记录表;
10、在所述历史匹配记录表中,对所述用户地址词组进行相同词组匹配,得到目标地址词组。
11、在一示例性实施例中,在所述数据库中包括标准词组库;所述标准词组库用于存储多条标准化结构的地址词组;
12、所述在预设的数据库中,基于所述账户信息索引出匹配于所述用户地址词组的目标地址词组,包括:
13、在所述历史匹配记录表中不存在匹配于所述用户地址词组的目标地址词组的情况下,在所述标准词组库中,对所述用户地址词组进行相同词组匹配,得到目标地址词组。
14、在一示例性实施例中,所述方法还包括:
15、在所述标准词组库中,对所述用户地址词组中的各个地址单词进行同义词匹配和/或近义词匹配,得到针对所述用户地址词组的多个扩展单词;
16、基于所述多个扩展单词,对所述用户地址词组中的地址单词进行替换,得到对应的至少一组拓展地址词组;
17、在所述历史匹配记录表和/或所述标准词组库中,对所述至少一组拓展地址词组分别进行相同词组匹配,得到目标地址词组。
18、在一示例性实施例中,所述标准词组库中所存储的各条地址词组均携带有对应的坐标区域;所述方法还包括:
19、在所述历史匹配记录表和/或所述标准词组库中不存在匹配于所述用户地址词组的目标地址词组的情况下,基于预设的地图导航平台对所述房屋地址进行导航定位,确定针对所述房屋地址的坐标区域;
20、将所述房屋地址的坐标区域与所述标准词组库中各地址词组所对应的坐标区域进行区域匹配,确定所述房屋地址所属的第一区域地址;所述第一区域地址基于省份名称-城市名称-楼盘名称/门牌地址的结构表征;
21、从所述用户地址词组中提取出针对所述房屋地址所属的第二区域地址;所述第二区域地址基于楼栋编号-单元编号-房间编号的结构表征;
22、在所述历史匹配记录表和/或所述标准词组库中对所述房屋地址进行词组匹配,确定同时满足所述第一区域地址和所述第二区域地址的目标地址词组。
23、在一示例性实施例中,所述方法还包括:
24、在所述历史匹配记录表和/或所述标准词组库中不存在匹配于所述用户地址词组的目标地址词组的情况下,从所述用户地址词组中提取出关于所述“省份名称”、所述“城市名称”、所述“楼盘名称”和所述“门牌地址”的第一类目标地址单词,以及关于所述“楼栋编号”、所述“单元编号”和所述“房间编号”的第二类目标地址单词;
25、基于所述第一类目标地址单词,生成第一子类用户地址词组;所述第一子类用户地址词组基于省份名称-城市名称-楼盘名称/门牌地址的结构表征;
26、在所述标准词组库中,对所述第一子类用户地址词组进行词组匹配,得到满足于所述第一子类用户地址词组的第一类候选词组;
27、在所述第一类候选词组中,索引出满足至少一个所述第二类目标地址单词的目标候选词组;
28、在所述房屋资源信息表中,索引出关联于所述目标候选词组的房屋资源信息,并将所述房屋资源信息进行展示。
29、在一示例性实施例中,所述账户信息包括所述用户账户的位置信息;所述方法还包括:
30、在所述标准词组库中不存在匹配于所述第一类候选词组的情况下,确定出与所述位置信息距离最近的第二子类用户地址词组;所述第二子类用户地址词组基于省份名称-城市名称-楼盘名称/门牌地址的结构表征;
31、在所述标准词组库中,对所述第二子类用户地址词组进行词组匹配,得到满足于所述第二子类用户地址词组的第二类候选词组;
32、在所述第二类候选词组中,索引出满足至少一个所述第二类目标地址单词的目标候选词组;
33、在所述房屋资源信息表中,索引出关联于所述目标候选词组的房屋资源信息,并将所述房屋资源信息进行展示。
34、在一示例性实施例中,所述方法还包括:
35、在所述第一类候选词组或者所述第二类候选词组中,不存在满足至少一个所述第二类目标地址单词的目标候选词组的情况下,从所述数据库的历史匹配记录表中提取出满足预设约束规则的目标历史词组;所述目标历史词组基于楼栋编号-单元编号-房间编号的结构表征;其中,满足预设约束规则的所述目标历史词组包括所述用户账户最近一次匹配成功的历史词组,或者,由所述用户账户对应匹配成功次数最多的地址单词组成的历史词组;
36、在所述第一类候选词组或者所述第二类候选词组中,索引出满足所述目标历史词组的目标候选词组;
37、在所述房屋资源信息表中,索引出关联于所述目标候选词组的房屋资源信息,并将所述房屋资源信息进行展示。
38、根据本公开实施例的第二方面,提供一本文档来自技高网...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述数据库中包括历史匹配记录表;所述历史匹配记录表用于记录已匹配成功的历史词组;
3.根据权利要求2所述的方法,其特征在于,在所述数据库中包括标准词组库;所述标准词组库用于存储多条标准化结构的地址词组;
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述标准词组库中所存储的各条地址词组均携带有对应的坐标区域;所述方法还包括:
6.根据权利要求4所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述账户信息包括所述用户账户的位置信息;所述方法还包括:
8.一种数据处理装置,其特征在于,所述装置包括:
9.一种计算机设备,其特征在于,包括:
10.一种计算机可读存储介质,所述计算机可读存储介质中包括程序数据,其特征在于,当所述程序数据由计算机设备的处理器执行时,使得所述计算机设备能够执行如权利要求
...【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,在所述数据库中包括历史匹配记录表;所述历史匹配记录表用于记录已匹配成功的历史词组;
3.根据权利要求2所述的方法,其特征在于,在所述数据库中包括标准词组库;所述标准词组库用于存储多条标准化结构的地址词组;
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述标准词组库中所存储的各条地址词组均携带有对应的坐标区域;所述方...
【专利技术属性】
技术研发人员:孙红富,徐子然,谢廷凯,
申请(专利权)人:广东中思拓大数据研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。