一种数据处理方法和系统技术方案

技术编号:26890717 阅读:56 留言:0更新日期:2020-12-29 16:07
本申请实施例公开了一种数据处理方法和系统。该数据处理方法包括:获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;对所述结构化数据库中一条或多条记录中的每一条进行:获取该记录的兴趣点字段内容,判断所述兴趣点字段内容是否为非品牌数据;若是,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点;若否,则将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准。

【技术实现步骤摘要】
一种数据处理方法和系统
本申请涉及数据库处理
,特别涉及一种数据处理方法和系统。
技术介绍
随着互联网的发展,出租车服务等在线服务开始在日常生活中发挥重要作用。乘客在服务平台下单时经常将品牌类的商家(例如,品牌酒店、品牌美食、品牌商场等)名称作为始发地或目的地名称,目前品牌类兴趣点(如起始地或目的地)检索由于品牌数据的覆盖率不够高而导致有些与品牌相关的兴趣点无法被召回。另外用户输入的兴趣点是品牌的英文名或别名时,也无法召回对应的品牌商家。基于上述问题,本申请提供一种对数据处理方法和系统。
技术实现思路
本申请实施例之一提供一种数据处理方法。该数据处理方法包括:获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;对所述结构化数据库中一条或多条记录中的每一条进行:获取该记录的兴趣点字段内容,判断所述兴趣点字段内容是否为非品牌数据;若是,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点;若否,则将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;/n对所述结构化数据库中一条或多条记录中的每一条进行:/n获取该记录的兴趣点字段内容,判断所述兴趣点字段内容是否为非品牌数据;/n若是,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点;/n若否,则将该记录的兴趣点字段内容与品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;
对所述结构化数据库中一条或多条记录中的每一条进行:
获取该记录的兴趣点字段内容,判断所述兴趣点字段内容是否为非品牌数据;
若是,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点;
若否,则将该记录的兴趣点字段内容与品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准。


2.如权利要求1所述的方法,其特征在于,所述结构化数据库用于基于品牌关键词的兴趣点检索。


3.如权利要求1所述的方法,其特征在于,所述判断所述兴趣点字段内容是否为非品牌数据,包括:
检测所述兴趣点字段内容是否包含预设的一个或多个非品牌标识词;
若包含,确定所述兴趣点字段内容为非品牌数据。


4.如权利要求1所述的方法,其特征在于,所述品牌数据表包括以下字段中的一种或多种的组合:品牌名称、品牌别名、品牌类型、品牌编码以及品牌疑似名称。


5.如权利要求4所述的方法,其特征在于,所述将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准,包括:
对该记录的兴趣点字段内容进行归一化,得到其对应的归一化表达;
将所述归一化表达与所述品牌数据表中品牌疑似名称字段的数据进行匹配,若所述归一化表达与品牌疑似名称字段的数据中的至少一个相同,则设置该记录的品牌属性字段内容以便将该记录标记为非品牌兴趣点。


6.如权利要求5所述的方法,其特征在于,所述将该记录的兴趣点字段内容与所述品牌数据表中的数据进行匹配,根据匹配结果,对该记录的品牌属性字段内容进行校准,包括:
将所述归一化表达与所述品牌数据表中品牌名称字段或品牌别名字段的数据进行匹配;
若未匹配上品牌名称字段或品牌别名字段的数据,则将该记录输出,以便人工校准其品牌属性字段内容,否则获取来自品牌名称字段或品牌别名字段的数据中的至少一个匹配数据及其匹配程度;
将所述至少一个匹配数据中匹配程度最大的匹配数据所对应的品牌名称作为该记录的品牌属性字段内容。


7.如权利要求6所述的方法,其特征在于,所述匹配程度包括从大到小排列的以下内容:相同,以及头部相同或者尾部相同。


8.如权利要求6所述的方法,其特征在于,未匹配上品牌名称字段或品牌别名字段的数据的情形包括:
所述归一化表达不被所述品牌数据表中品牌名称字段或品牌别名字段的数据中的任一个包含;或者,所述归一化表达被所述品牌数据表中品牌名称字段或品牌别名字段的数据中的最多一个非头尾相同的包含。


9.一种数据处理系统,其特征在于,包括获取模块和处理模块;
所述获取模块用于获取结构化数据库,所述结构化数据库包括兴趣点字段以及品牌属性字段;
所述处理模块对所述结构化数据库中...

【专利技术属性】
技术研发人员:陈志明胡泊刘佳
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1