The embodiment of the present invention provides a data extraction method and device, which includes acquiring the basic data of each user, the first user interaction behavior data corresponding to the basic data of each user and the second user interaction behavior data corresponding to the basic data of each user, and generating the movie portraits corresponding to each movie according to the basic data of each user and the interactive behavior data of each first user. Data; according to the basic data of each user and the interactive behavior data of each second user, the corresponding cinema portrait data of each cinema are generated; the search keywords input by users are received, and the target data are extracted from the cinema portrait data or cinema portrait data according to the search keywords. Accurate data can be extracted from the film portrait data and cinema portrait data, which is convenient for the operation and management of film or cinema users.
【技术实现步骤摘要】
一种数据提取方法及装置
本专利技术实施例涉及数据提取
,特别是涉及一种数据提取方法及装置。
技术介绍
用户画像是指对于用户基础特征的描述集合。针对电影行业的需求,需要依据用户画像的划分,来查看不同目标(电影、影院等)的受众群体的属性,即不同目标对应不同用户的用户画像。电影行业经常需要对比两部电影对应的用户画像之间的差别来分析影片反响和票房的结果差别。另外,影院侧也经常需要对自己的用户群体进行更细致的分析和精细化运营。然而,传统的用户画像仅对于单个维度进行分析预测,即用户的基本属性进行统计分析和预测,由于用户画像的维度单一,使得无法提取精确的数据。
技术实现思路
本专利技术提供了一种数据提取方法及装置,以解决现有技术中由于数据总和的维度单一,使得无法提取精确的数据的问题。为了解决上述问题,本专利技术公开了一种数据提取方法,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。优选地,所述依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据的步骤,包括:针对每条所述第一用户交互行为数据,确定所 ...
【技术保护点】
1.一种数据提取方法,其特征在于,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。
【技术特征摘要】
1.一种数据提取方法,其特征在于,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。2.根据权利要求1所述的方法,其特征在于,所述依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据的步骤,包括:针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。3.根据权利要求1所述的方法,其特征在于,所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤,包括:针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。4.根据权利要求1所述的方法,其特征在于,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。5.根据权利要求1所述的方法,其特征在于,在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前,所述方法还包括:接收用户输入的账号登录信息;将所述账号登录信息确定为所述用户的用户基础数据;检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。6.一种数据提取装置,其特征在于,所述装置...
【专利技术属性】
技术研发人员:张蒙,
申请(专利权)人:北京猫眼文化传媒有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。