一种数据提取方法及装置制造方法及图纸

技术编号:19965850 阅读:19 留言:0更新日期:2019-01-03 13:40
本发明专利技术实施例提供了一种数据提取方法及装置,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各用户基础数据和各第二用户交互行为数据生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据。能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。

A Data Extraction Method and Device

The embodiment of the present invention provides a data extraction method and device, which includes acquiring the basic data of each user, the first user interaction behavior data corresponding to the basic data of each user and the second user interaction behavior data corresponding to the basic data of each user, and generating the movie portraits corresponding to each movie according to the basic data of each user and the interactive behavior data of each first user. Data; according to the basic data of each user and the interactive behavior data of each second user, the corresponding cinema portrait data of each cinema are generated; the search keywords input by users are received, and the target data are extracted from the cinema portrait data or cinema portrait data according to the search keywords. Accurate data can be extracted from the film portrait data and cinema portrait data, which is convenient for the operation and management of film or cinema users.

【技术实现步骤摘要】
一种数据提取方法及装置
本专利技术实施例涉及数据提取
,特别是涉及一种数据提取方法及装置。
技术介绍
用户画像是指对于用户基础特征的描述集合。针对电影行业的需求,需要依据用户画像的划分,来查看不同目标(电影、影院等)的受众群体的属性,即不同目标对应不同用户的用户画像。电影行业经常需要对比两部电影对应的用户画像之间的差别来分析影片反响和票房的结果差别。另外,影院侧也经常需要对自己的用户群体进行更细致的分析和精细化运营。然而,传统的用户画像仅对于单个维度进行分析预测,即用户的基本属性进行统计分析和预测,由于用户画像的维度单一,使得无法提取精确的数据。
技术实现思路
本专利技术提供了一种数据提取方法及装置,以解决现有技术中由于数据总和的维度单一,使得无法提取精确的数据的问题。为了解决上述问题,本专利技术公开了一种数据提取方法,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。优选地,所述依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据的步骤,包括:针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。优选地,所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤,包括:针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。优选地,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。优选地,在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前,所述方法还包括:接收用户输入的账号登录信息;将所述账号登录信息确定为所述用户的用户基础数据;检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。本专利技术还公开了一种数据提取装置,所述装置包括:获取模块,用于获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;第一生成模块,用于依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;第二生成模块,用于依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;第一接收模块,用于接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。优选地,所述第一生成模块包括:第一确定子模块,用于针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;第二确定子模块,用于针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;第一建立子模块,用于建立所述电影、各所述第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。优选地,所述第二生成模块包括:第三确定子模块,用于针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;第四确定子模块,用于针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;第二建立子模块,用于建立所述影院、各所述第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。优选地,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。优选地,所述装置还包括:第二接收模块,用于在所述获取模块获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据之前,接收用户输入的账号登录信息;确定模块,用于将所述账号登录信息确定为所述用户的用户基础数据;检测模块,用于检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系与现有技术相比,本专利技术具有以下优点:通过获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据;依据各用户基础数据和各第一用户交互行为数据,生成各部电影对应的电影画像数据,依据各用户基础数据和各第二用户交互行为数据,生成各影院对应的影院画像数据;接收用户输入的查找关键词,依据查找关键词从电影画像数据或影院画像数据中提取目标数据,基于两个维度,用户基础数据和用户基础数据对应的第一用户交互行为数据和第二用户交互行为数据,生成各部电影对应的电影画像数据和各影院对应的影院画像数据,能够依据电影画像数据和影院画像数据提取出精确的数据,方便对电影或影院用户进行运营管理。附图说明图1是本专利技术实施例一的一种数据提取方法的步骤流程图;图2是本专利技术实施例二的一种数据提取方法的步骤流程图;图3是本专利技术实施例三的一种数据提取装置的结构框图;图4是本专利技术实施例四的一种数据提取装置的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。实施例一参照图1,示出了本专利技术实施例一的一种数据提取方法的步骤流程图。本专利技术实施例提供的数据提取方法包括以下步骤:步骤101:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各用户基础数据对应的第二用户交互行为数据。其中,第一用户交互行为数据为用户对电影的行为操作数据,第二用户交互行为本文档来自技高网...

【技术保护点】
1.一种数据提取方法,其特征在于,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。

【技术特征摘要】
1.一种数据提取方法,其特征在于,所述方法包括:获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据,其中,所述第一用户交互行为数据为用户对电影的行为操作数据,所述第二用户交互行为数据为用户对影院的行为操作数据;依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据;依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据;接收所述用户输入的查找关键词,依据所述查找关键词从所述电影画像数据或所述影院画像数据中提取目标数据。2.根据权利要求1所述的方法,其特征在于,所述依据各所述用户基础数据和各所述第一用户交互行为数据,生成各部电影对应的电影画像数据的步骤,包括:针对每条所述第一用户交互行为数据,确定所述第一用户交互行为数据对应的电影和第一交互行为操作;其中,第一交互操作行为包括以下任意之一:购票、浏览、评论以及收藏;针对各电影,确定所述电影对应的各第一目标用户基础数据、和各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据;建立所述电影、各所述第一目标用户基础数据以及各所述第一目标用户基础数据对应的所述电影的第一用户交互行为数据三者之间的对应关系,生成电影画像数据。3.根据权利要求1所述的方法,其特征在于,所述依据各所述用户基础数据和各所述第二用户交互行为数据生成各影院对应的影院画像数据的步骤,包括:针对每条所述第二用户交互行为数据,确定所述第二用户交互行为数据对应的影院和第二交互行为操作;其中,第二交互行为操作包括以下任意之一:购票、购买商品以及浏览;针对各影院,确定所述影院对应的各第二目标用户基础数据、和各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据;建立所述影院、各所述第二目标用户基础数据以及各所述第二目标用户基础数据对应的所述影院的第二用户交互行为数据三者之间的对应关系,生成影院画像数据。4.根据权利要求1所述的方法,其特征在于,所述查找关键词包括:年龄范围、性别、职业、爱好、电影名称以及影院名称中的至少之一。5.根据权利要求1所述的方法,其特征在于,在所述获取各用户基础数据、各用户基础数据对应的第一用户交互行为数据以及各所述用户基础数据对应的第二用户交互行为数据的步骤之前,所述方法还包括:接收用户输入的账号登录信息;将所述账号登录信息确定为所述用户的用户基础数据;检测并记录所述用户的交互行为数据,建立所述用户基础数据与所述用户的交互行为数据之间的对应关系。6.一种数据提取装置,其特征在于,所述装置...

【专利技术属性】
技术研发人员:张蒙
申请(专利权)人:北京猫眼文化传媒有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1