地址信息的处理方法、终端设备及计算机可读存储介质技术

技术编号：20448690 阅读：24 留言：0更新日期：2019-02-27 02:52

本发明专利技术适用于计算机应用技术领域，提供了地址信息的处理方法、终端设备及计算机可读存储介质，包括：接收待处理的原地址信息，将原地址信息通过预设的数据清洗模型进行数据，清洗生成原地址信息的文本摘要，将文本摘要输入到预设的地图信息网站中得到备选地址；根据文本摘要和备选地址识别与原地址信息匹配的备选地址为目标地址。通过将获取到的原地址信息进行数据清理得到文本摘要，再将文本摘要通过至少一个地图信息网站得到备选地址，并识别与原地址信息最匹配的备选地址作为目标地址，提高了地址信息规范化过程的效率，实现了地址信息的模板化和统一化。

Processing Method of Address Information, Terminal Equipment and Computer Readable Storage Media

The invention is applicable to the field of computer application technology, and provides the processing method of address information, terminal equipment and computer readable storage medium, including receiving the original address information to be processed, cleaning the original address information through the preset data cleaning model, generating the text summary of the original address information, and inputting the text summary into the preset map information website to obtain it. Alternative addresses; identify alternative addresses that match the original address information as target addresses based on text summaries and alternative addresses. By clearing up the original address information to get the text summary, and then getting the alternative address through at least one map information website, and identifying the alternative address that matches the original address information as the target address, the efficiency of the standardization process of address information is improved, and the template and unification of address information are realized.

全部详细技术资料下载

【技术实现步骤摘要】
地址信息的处理方法、终端设备及计算机可读存储介质
本专利技术属于计算机应用
，尤其涉及地址信息的处理方法、终端设备及计算机可读存储介质。
技术介绍
在很多项目进行过程中，需要获取到全面、精确、格式统一的企业信息或者用户信息，例如公司名称、统一社会信用代码、公司地址、法定代表人以及用户地址等信息。而在获取一些企业的单位地址或者用户的住址的时候，很多情况下获取到的地址信息都不够规范，不能清楚、明确的通过这些获取到的信息确定目标对象的实际地址。现有技术中为了保证地址信息的精确性，都是人为上门或者实际查询进行排查和修改地址，这种在地址信息较多的情况下，增大了工作量和处理时间，不能保证地址信息的处理效率。
技术实现思路
有鉴于此，本专利技术实施例提供了地址信息的处理方法、终端设备及计算机可读存储介质，以解决现有技术中在地址信息较多的情况下，增大了工作量和处理时间，不能保证地址信息的处理效率的问题。本专利技术实施例的第一方面提供了一种地址信息的处理方法，包括：接收待处理的原地址信息；将所述原地址信息通过预设的数据清洗模型进行数据清洗，生成所述原地址信息的文本摘要；所述清洗模型为基于预设的语料库进行训练得到；将所述文本摘要输入到预设的地图信息网站中，得到至少一个备选地址；根据所述文本摘要和所述备选地址，识别与所述原地址信息匹配的备选地址为目标地址。本专利技术实施例的第二方面提供了一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现以下步骤：接收待处理的原地址信息；将所述原地址信息通过预设的数据清洗...

【技术保护点】
1.一种地址信息的处理方法，其特征在于，包括：接收待处理的原地址信息；将所述原地址信息通过预设的数据清洗模型进行数据清洗，生成所述原地址信息的文本摘要；所述清洗模型为基于预设的语料库进行训练得到；将所述文本摘要输入到预设的地图信息网站中，得到至少一个备选地址；根据所述文本摘要和所述备选地址，识别与所述原地址信息匹配的备选地址为目标地址。

【技术特征摘要】
1.一种地址信息的处理方法，其特征在于，包括：接收待处理的原地址信息；将所述原地址信息通过预设的数据清洗模型进行数据清洗，生成所述原地址信息的文本摘要；所述清洗模型为基于预设的语料库进行训练得到；将所述文本摘要输入到预设的地图信息网站中，得到至少一个备选地址；根据所述文本摘要和所述备选地址，识别与所述原地址信息匹配的备选地址为目标地址。2.如权利要求1所述的地址信息的处理方法，其特征在于，所述将所述原地址信息通过预设的数据清洗模型进行数据清洗，生成所述原地址信息的文本摘要之前，还包括：基于预设的条件随机场算法模型、预设的注意力模型和预设的文本摘要生成模型，对所述语料库进行训练，得到数据清洗模型；所述数据清洗模型用于对所述原地址信息进行数据清洗，得到文本摘要；所述文本摘要包括至少一个用于表示所述原地址信息的关键词。3.如权利要求1所述的地址信息的处理方法，其特征在于，所述将所述文本摘要输入到预设的地图信息网站中，得到至少一个备选地址，包括：通过至少一个所述地图信息网站对所述文本摘要进行搜索，从每个所述地图信息网站中获取所述文本摘要的备选地址信息；所述备选地址信息中包括：地图供应商、地图提供的兴趣点名称以及与所述原地址信息对应的详细地址。4.如权利要求2所述的地址信息的处理方法，其特征在于，所述根据所述文本摘要和所述备选地址，识别与所述原地址信息匹配的备选地址为目标地址，包括：统计每个所述备选地址中所包含的关键词；根据所述每个所述备选地址中所包含的关键词、所述文本摘要中关键词的总个数，计算每个所述备选地址与所述文本摘要的匹配度；识别匹配度最高的备选地址为所述目标地址。5.如权利要求4所述的地址信息的处理方法，其特征在于，所述根据所述每个所述备选地址中所包含的关键词、所述文本摘要中关键词的总个数，计算每个所述备选地址与所述文本摘要的匹配度，包括：通过公式计算所述备选地址与所述文本摘要的匹配度；其中，word_1,word_2,...,word_n用于表示每个所述关键词；N用于表示所述文本摘要中的关键词总个数；矩阵Dev_n＝(dev_1,dev_2,…,dev_n)用于表示每个类型的关键词的贡...

【专利技术属性】
技术研发人员：吴壮伟，钟宇，凌羽，赵小梅，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人