居民区入住率的计算方法技术

技术编号:20074955 阅读:101 留言:0更新日期:2019-01-15 00:36
本发明专利技术提供一种居民区入住率的计算方法,包括:选取居民区周边一定范围内的若干个用户,根据每个用户的互联网数据和运营商数据,获得对应的用户画像和用户入住特征;将获得的所有用户画像和用户入住特征输入至预先训练的居民区入住模型中,获知各用户是否居住在所述居民区中,根据居住在所述居民区中的用户的比例获知居民区入住率。本发明专利技术通过采集用户的互联网数据和运营商数据的方式,达到了速度更快、可动态更新采集数据的优势;其次通过根据互联网数据和运营商数据构建用户的用户画像,能够将用户标签化,达到高度精炼准确的目的,进而为后续计算居民区入住率提供了坚实准确的基础。

Method for calculating occupancy rate in residential areas

The invention provides a method for calculating residential occupancy rate, which includes: selecting several users in a certain range around the residential area, obtaining corresponding user portraits and user occupancy characteristics according to each user's Internet data and operator data; inputting all user portraits and user occupancy characteristics into the pre-trained residential occupancy model to know each user. Whether to live in the residential area or not, the occupancy rate of the residential area is known according to the proportion of the users living in the residential area. By collecting users'Internet data and operators' data, the invention achieves the advantages of faster speed and dynamic updating of collected data; secondly, by constructing user portraits based on Internet data and operators'data, users can be tagged to achieve highly refined and accurate purposes, thereby providing a solid and accurate basis for subsequent calculation of residential occupancy rate. Foundation.

【技术实现步骤摘要】
居民区入住率的计算方法
本专利技术涉及互联网应用
,更具体地,涉及居民入住率的计算方法。
技术介绍
传统居民区入住率统计主要采用夜晚开灯情况或者上门调查等手段,需要依赖大量人力和时间。现有的手段无法有效感知入住的流动情况,同时投入产出不匹配,结果数据价值单一。随着云计算、大数据、人工智能的不断发展,数据成为重要资产,因此以问题为导向,对传统手段和效果存在的诸多壁垒积极分析研究,探索构建互联网环境下的居民区入住模型具有重要的意义。用户画像即用户信息标签化,就是通过收集和分析用户的社会属性、生活习惯、消费行为等数据后,抽象出一个用户全貌,用户画像是支撑个性化推荐、自动化营销等大数据应用的基本方式。通常帮助企业快速找到用户需求等更广泛的信息。但现有的用户画像构建过程中对用户的数据分析不全面、不准确,导致构建的用户画像并不能很好地体现用户全貌。
技术实现思路
本专利技术提供一种克服上述问题或者至少部分地解决上述问题的居民入住率的计算方法。根据本专利技术的一个方面,提供一种居民区入住率的计算方法,包括:选取居民区周边一定范围内的若干个用户,根据每个用户的互联网数据和运营商数据,获得对应的用户画像和用户入住特征;将获得的所有用户画像和用户入住特征输入至预先训练的居民区入住模型中,获知各用户是否居住在所述居民区中,根据居住在所述居民区中的用户的比例获知居民区入住率。优选地,所述居民区入住模型的训练方法,具体为:获取种子用户的入住信息,所述入住信息包括用户画像和用户入住特征,所述用户入住特征为与用户居住行为相关的信息;获取种子用户所住的居民区,将所述种子用户所住的居民区作为所述入住信息对应的标注结果;将所述种子用户的入住信息和标注结果作为居民区入住模型的训练样本,训练所述居民区入住模型。优选地,所述根据每个用户的互联网数据和运营商数据,获得对应的用户画像,具体为:对于选取的任意一个用户,获取该用户的互联网数据和运营商数据并进行数据清洗;对数据清洗后的所述互联网数据和运营商数据进行特征提取,得到所述用户的属性特征;基于预先创建的多维特征库训练的标签分类,根据所述用户的属性特征在所述多维特征库中进行匹配,获得所述用户的多维度属性标签;根据所述多维度属性标签构建对应该用户的用户画像。优选地,所述对数据清洗后的所述互联网数据和运营商数据进行特征提取,得到所述用户的属性特征,具体为:分别通过离线和在线方式对预处理后的所述互联网数据和运营商数据进行分析处理,获得所述用户的属性特征。优选地,所述多维度属性标签至少包括行为习惯属性标签、兴趣属性标签、收入属性标签以及社会属性标签。优选地,所述以预先创建的多维特征库包括运营商基础信息库、终端类型基础库、访问网站及行为规律统计特征库、用户群体分类库、生活行为规律统计特征库。优选地,所述基于预先创建的多维特征库训练的标签分类之前,还包括创建所述多维特征库,其中:建立所述运营商基础信息库包括:对所有用户的所属运营商、网络类型、归属地、漫游地、通信套餐、宽带数据中的至少一种进行提取分析,累积得到所述运营商基础信息库;建立所述终端类型基础库包括:对用户的终端型号、品牌类型、终端操作系统中的至少一个信息进行提取分析,累积得到所述终端类型基础库;建立所述访问网站及行为规律统计特征库包括:对用户常去访问的网站以及行为进行提取分析,累积得到访问网站及行为规律统计特征库;建立所述用户群体分类库包括:对具有相同特征标签或者相同属性或者相同业务特征的用户进行特征合并,对用户群体进行分类,形成所述用户群体分类库;建立生活行为规律统计特征库包括:对用户的作息时间、饮食特定、消费偏好进行提取分析,累积得到生活行为规律统计特征库。优选地,所述用户入住特征包括用户的快递地址、移动支付缴费地址、出行目的地和出发地。根据本专利技术的另一个方面,还提供一种居民入住率的计算装置,包括:用户画像模块,用于选取居民区周边一定范围内的若干个用户,根据每个用户的互联网数据和运营商数据,获得对应的用户画像和用户入住特征;入住率计算模块,用于将获得的所有用户画像和用户入住特征输入至预先训练的居民区入住模型中,获知各用户是否居住在所述居民区中,根据居住在所述居民区中的用户的比例获知居民区入住率。根据本专利技术的另一个方面,还提供一种计算设备,包括:至少一个处理器;以及与所述处理器通信连接的至少一个存储器,其中:所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行本专利技术实施例的居民区入住率的计算方法及其所有可选实施例的方法。本专利技术提出的居民区入住率的计算方法,首先改变了传统由人工统计小区用电/开灯情况或者上门调查的采集方式,通过采集用户的互联网数据和运营商数据的方式,达到了速度更快、可动态更新采集数据的优势;其次改变了传统单纯通过统计学方法计算入住率的分析方式,通过根据互联网数据和运营商数据构建用户的用户画像,能够将用户标签化,达到高度精炼准确的目的,进而为后续计算居民区入住率提供了坚实准确的基础;再次通过构建居民区入住模型达到了将用户画像和用户所住小区相匹配的效果,这样通过输入用户画像,即可获知用户是否住在居民区中,通过统计居住在小区的用户的比例可以知道居民区的入住率,效率更高。附图说明图1为根据本专利技术实施例的居民入住率的计算方法的流程示意图;图2为根据本专利技术实施例的获得用户画像的流程示意图;图3为根据本专利技术实施例的居民入住率的计算装置的功能框图;图4为根据本专利技术实施例的用户画像模块的功能框图;图5为根据本专利技术实施例的计算设备的设备框图。具体实施方式下面结合附图和实施例,对本专利技术的具体实施方式作进一步详细描述。以下实施例用于说明本专利技术,但不用来限制本专利技术的范围。为了克服现有技术的上述问题,本专利技术实施例提供一种居民入住率的计算方法,参见图1,图1为本专利技术实施例的居民入住率的计算方法的流程示意图,包括:101、选取居民区周边一定范围内的若干个用户,根据每个用户的互联网数据和运营商数据,获得对应的用户画像和用户入住特征;本专利技术实施例摒弃了现有技术直接通过观察小区夜间开灯比例或者上门调查的方式,而是先根据居民的互联网数据和运营商数据构建用户画像,形成实际用户的虚拟代表。用户的互联网数据记录了相当多的信息,例如从购物信息、快递信息和打车信息中可以推测用户的常用地址。在具体选取居民区周边一定范围内的若干个用户的过程中,可以使用运营商数据中的手机上网数据,获取在居民区周边3公里范围内产生手机上网的用户,并以此作为选取的目标用户,也可以根据互联网数据中购物网站(如淘宝、唯品会)、生活网站(如58同城、美团)、房屋网站(如途家、好房子网)以此居民区作为地址的用户选为目标用户。102、将获得的所有用户画像和用户入住特征输入至预先训练的居民区入住模型中,获知各用户是否居住在所述居民区中,根据居住在所述居民区中的用户的比例获知居民区入住率。需要说明的是,本专利技术实施例的居民区入住率的计算方法,首先改变了传统由人工统计小区用电/开灯情况或者上门调查的采集方式,通过采集用户的互联网数据和运营商数据的方式,达到了速度更快、可动态更新采集数据的优势;其次改变了传统单纯通过统计学方法计算入住率的分析方式,通过根据互联网数据和运营商数据构建用户的用户画像本文档来自技高网...

【技术保护点】
1.一种居民区入住率的计算方法,其特征在于,包括:选取居民区周边一定范围内的若干个用户,根据每个用户的互联网数据和运营商数据,获得对应的用户画像和用户入住特征;将获得的所有用户画像和用户入住特征输入至预先训练的居民区入住模型中,获知各用户是否居住在所述居民区中,根据居住在所述居民区中的用户的比例获知居民区入住率。

【技术特征摘要】
1.一种居民区入住率的计算方法,其特征在于,包括:选取居民区周边一定范围内的若干个用户,根据每个用户的互联网数据和运营商数据,获得对应的用户画像和用户入住特征;将获得的所有用户画像和用户入住特征输入至预先训练的居民区入住模型中,获知各用户是否居住在所述居民区中,根据居住在所述居民区中的用户的比例获知居民区入住率。2.根据权利要求1所述的计算方法,其特征在于,所述居民区入住模型的训练方法,具体为:获取种子用户的入住信息,所述入住信息包括用户画像和用户入住特征,所述用户入住特征为与用户居住行为相关的信息;获取种子用户所住的居民区,将所述种子用户所住的居民区作为所述入住信息对应的标注结果;将所述种子用户的入住信息和标注结果作为居民区入住模型的训练样本,训练所述居民区入住模型。3.根据权利要求1所述的计算方法,其特征在于,所述根据每个用户的互联网数据和运营商数据,获得对应的用户画像,具体为:对于选取的任意一个用户,获取该用户的互联网数据和运营商数据并进行数据清洗;对数据清洗后的所述互联网数据和运营商数据进行特征提取,得到所述用户的属性特征;基于预先创建的多维特征库训练的标签分类,根据所述用户的属性特征在所述多维特征库中进行匹配,获得所述用户的多维度属性标签;根据所述多维度属性标签构建对应该用户的用户画像。4.根据权利要求3所述的计算方法,其特征在于,所述对数据清洗后的所述互联网数据和运营商数据进行特征提取,得到所述用户的属性特征,具体为:分别通过离线和在线方式对预处理后的所述互联网数据和运营商数据进行分析处理,获得所述用户的属性特征。5.根据权利要求4所述的计算方法,其特征在于,所述多维度属性标签至少包括行为习惯属性标签、兴趣属性标签、收入属性标签以及社会属性标签。6.根据权利要求5所述的计算方法,其特征在于,所述多维特征库包括运营商基础...

【专利技术属性】
技术研发人员:沈林江张笑笑
申请(专利权)人:北京市天元网络技术股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1