一种数据处理方法及装置制造方法及图纸

技术编号：22054947 阅读：23 留言：0更新日期：2019-09-07 15:08

本发明专利技术实施例提供了一种数据处理方法及装置，本发明专利技术涉及大数据技术领域，方法包括：获取第一文件数据，第一文件数据为用户行为日志数据；读取第一文件数据的分割规则，分割规则为固定份数分割、固定容量分割、固定行数分割中的至少一种；按照分割规则对第一文件数据进行分割，得到多个子文件，其中，每个子文件包括至少一条用户行为日志数据；将多个子文件写入目标数据库，每个子文件设有时间段标识；根据预设的筛选条件筛选目标数据库，得到与筛选条件相符合的用户行为日志数据，筛选条件包括用户信息、时间段信息、用户行为分组中的任意一种。本发明专利技术实施例提供的技术方案能够解决现有技术中用户行为日志文件处理效率低的问题。

A Data Processing Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法及装置
本专利技术涉及大数据
，尤其涉及一种数据处理方法及装置。
技术介绍
目前，windows平台上的客服服务器，随着访问量和数据量的快速增长，用于记录用户行为的日志文件的数据量变得非常大，从而使得用户行为日志文件无法直接下载到本地，或者文件太大导致读取速度极慢，从而使得用户行为日志文件的处理效率低。
技术实现思路
有鉴于此，本专利技术实施例提供了一种数据处理方法及装置，用以解决现有技术中用户行为日志文件处理效率低的问题。为了实现上述目的，根据本专利技术的一个方面，提供了一种数据处理方法，所述方法包括：获取第一文件数据，所述第一文件数据为用户行为日志数据；读取所述第一文件数据的分割规则，所述分割规则为固定份数分割、固定容量分割、固定行数分割中的至少一种；按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，其中，每个所述子文件包括至少一条用户行为日志数据；将多个所述子文件写入目标数据库，每个所述子文件设有时间段标识；根据预设的筛选条件筛选所述目标数据库，得到与所述筛选条件相符合的用户行为日志数据，所述筛选条件包括用户信息、时间段信息、用户行为分组中的任意一种。进一步地，所述按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，包括：读取预先设置的分割份数；按照所述分割份数平均分割所述第一文件数据，得到多个子文件。进一步地，所述按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，包括：获取所述第一文件数据的文件容量大小；读取预先设置的子文件的容量阈值；根据所述预先设置的子文件的容量阈值分割所述第一文件数据，...

【技术保护点】
1.一种数据处理方法，其特征在于，所述方法包括：获取第一文件数据，所述第一文件数据为用户行为日志数据；读取所述第一文件数据的分割规则，所述分割规则为固定份数分割、固定容量分割、固定行数分割中的至少一种；按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，其中，每个所述子文件包括至少一条用户行为日志数据；将多个所述子文件写入目标数据库，每个所述子文件设有时间段标识；根据预设的筛选条件筛选所述目标数据库，得到与所述筛选条件相符合的用户行为日志数据，所述筛选条件包括用户信息、时间段信息、用户行为分组中的任意一种。

【技术特征摘要】
1.一种数据处理方法，其特征在于，所述方法包括：获取第一文件数据，所述第一文件数据为用户行为日志数据；读取所述第一文件数据的分割规则，所述分割规则为固定份数分割、固定容量分割、固定行数分割中的至少一种；按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，其中，每个所述子文件包括至少一条用户行为日志数据；将多个所述子文件写入目标数据库，每个所述子文件设有时间段标识；根据预设的筛选条件筛选所述目标数据库，得到与所述筛选条件相符合的用户行为日志数据，所述筛选条件包括用户信息、时间段信息、用户行为分组中的任意一种。2.根据权利要求1所述的方法，其特征在于，所述按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，包括：读取预先设置的分割份数；按照所述分割份数平均分割所述第一文件数据，得到多个子文件。3.根据权利要求1所述的方法，其特征在于，所述按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，包括：获取所述第一文件数据的文件容量大小；读取预先设置的子文件的容量阈值；根据所述预先设置的子文件的容量阈值分割所述第一文件数据，得到多个子文件，其中，所有的所述子文件的容量值皆小于所述容量阈值。4.根据权利要求1所述的方法，其特征在于，所述按照所述分割规则对所述第一文件数据进行分割，得到多个子文件，包括：获取所述第一文件数据的行数；读取预先设置的子文件的行数阈值；根据所述预先设置的子文件的行数阈值分割所述第一文件数据，得到多个子文件，其中，所有的所述子文件的行数值皆小于所述行数阈值。5.根据权利要求2～4中任意一项所述的方法，其特征在于，所述按照所述分割规则对所述第一文件数据进行分割，得到多个子文件之后，所述方法包括：按照预设的文件关联长度，对每个所述子文件的两端进行分割，得到关联上文及关联下文；将每个所述子文件与相邻的前一个所述子文件的关联下文、相邻的后一个所述子文件的关联上文进行拼接处理，得到拼接文件；用所述拼接文件替换未分...

【专利技术属性】
技术研发人员：陈义哲，
申请(专利权)人：深圳壹账通智能科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人