数据处理方法及装置、电子设备、计算机可读介质制造方法及图纸

技术编号：18525864 阅读：34 留言：0更新日期：2018-07-25 12:43

本公开涉及一种数据处理方法及装置、电子设备和计算机可读介质。属于互联网技术领域，该数据处理方法包括：统计历史用户行为数据获取训练数据，其中所述训练数据包括训练门店的基础信息及其相应的训练用户信息，所述训练门店的基础信息中包括训练门店的地理位置信息；根据所述训练数据训练神经网络模型；根据候选门店的基础信息及训练好的神经网络模型进行预测，获得相应的候选用户信息，其中所述候选门店的基础信息中包括候选门店的地理位置信息。本公开能够实现地理位置约束的搜索结果召回。

全部详细技术资料下载

【技术实现步骤摘要】
数据处理方法及装置、电子设备、计算机可读介质
本公开涉及互联网
，具体而言，涉及一种数据处理方法及装置、电子设备、计算机可读介质。
技术介绍
关键词广告是搜索广告中非常重要的一种形态，用户在给定搜索查询(query)之后，返回相关的一些排序广告结果内容。整个关键词广告中最重要的一环是广告的召回，也就是确定满足相关性的广告候选，在此之后才会进行结果排序等过程。召回结果的相关性和数量都对整个广告结果质量有着至关重要的作用。在O2O(OnlineToOffline，在线离线/线上到线下)场景下的搜索广告召回环节有独特的相关性要求，对地理位置是非常敏感的。搜索广告召回阶段，目前常用的方法为：1.文本语义匹配召回在电子商务和搜索的场景下，搜索广告的召回方法通常是，根据用户请求query和候选广告的语义等匹配度，匹配和召回满足相关性的广告结果。但是，这种文本语义匹配召回方式只基于文本语义相似度进行召回，一方面，无法满足O2O这种位置限定条件下的约束，从而部分召回结果相关性比较差；另一方面，因为没有条件约束，召回结果的量会比较多，结果排序阶段的性能压力比较大。2.条件门槛截断召回对于O2O等有特殊限定的广告场景，通常按照正常的query分词和语义匹配等方法，从广告库中找出符合要求的广告，再基于其余限定条件(比如在O2O场景下，会有不同的品类等)去设定不同的门槛(例如距离)，满足门槛要求的结果作为满足地理位置相关的结果召回。其中距离门槛的设定会和非常多的因素有关系，通常的做法是根据历史数据做统计分析，设定平均门槛进行截断和准入。在O2O场景下会有距离约束条件，但是绝...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：统计历史用户行为数据获取训练数据，其中所述训练数据包括训练门店的基础信息及其相应的训练用户信息，所述训练门店的基础信息中包括训练门店的地理位置信息；根据所述训练数据训练神经网络模型；根据候选门店的基础信息及训练好的神经网络模型进行预测，获得相应的候选用户信息，其中所述候选门店的基础信息中包括候选门店的地理位置信息。

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：统计历史用户行为数据获取训练数据，其中所述训练数据包括训练门店的基础信息及其相应的训练用户信息，所述训练门店的基础信息中包括训练门店的地理位置信息；根据所述训练数据训练神经网络模型；根据候选门店的基础信息及训练好的神经网络模型进行预测，获得相应的候选用户信息，其中所述候选门店的基础信息中包括候选门店的地理位置信息。2.根据权利要求1所述的数据处理方法，其特征在于，所述统计历史用户行为数据获取训练数据包括：对所述历史用户行为数据进行统计，将点击频次超过预设阈值的训练门店的基础信息及其相应的训练用户信息组成数据对；将数据对中的训练门店的基础信息分词后获得训练输入序列，并将数据对中的训练用户信息分词后获得训练输出序列。3.根据权利要求1所述的数据处理方法，其特征在于，所述根据候选门店的基础信息及训练好的神经网络模型进行预测，获得相应的候选用户信息包括：将所述候选门店的基础信息分词后获得候选输入序列；将所述候选输入序列输入至训练好的序列到序列的神经网络模型中，获得相应的候选用户信息。4.根据权利要求2所述的数据处理方法，其特征在于，所述训练数据还包括训练门店的经纬度、训练用户与相应的训练门店之间的距离。5.根据权利要求4所述的数据处理方法，其特征在于，所述统计历史用户行为数据获取训练数据还包括：根据训练门店的经纬度获得训练门店的geohash序列；对所述训练用户与相应的训练门店之间的距离进行离散化处理获得离散距离值；将训练门店的geohash序列增加...

【专利技术属性】
技术研发人员：姚强，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人