一种多站点的视频播放记录整合方法和装置制造方法及图纸

技术编号：24104135 阅读：38 留言：0更新日期：2020-05-09 15:04

本发明专利技术实施例提供一种多站点的视频播放记录整合方法和装置，基于运营商网络数据的视频播放用户识别技术，识别用户在各大视频站点的播放记录，解决多站点视频播放用户融合的问题；根据不同站点的视频属性等媒资数据，自动给视频分类，建立统一的视频分类标签，统一的视频分类标签，对用户视频播放记录进行聚合，并由此建立用户更为普适的视频分类偏好标签，更加全面而客观地丰富用户画像，促进视频业务数据化运营和发展。

A method and device of video playing and recording integration for multi site

全部详细技术资料下载

【技术实现步骤摘要】
一种多站点的视频播放记录整合方法和装置
本专利技术实施例涉及大数据业务支撑
，更具体地，涉及一种多站点的视频播放记录整合方法和装置。
技术介绍
随着移动通信技术的飞速发展和线上视频内容的不断丰富，人们越来越习惯于通过手机等移动终端播放视频，各类视频APP用户规模不断壮大。识别各类视频APP中的播放用户，分析用户视频偏好，是开展视频精准推荐的基础，在视频类企业的发展中具有重要价值。根据现有技术，用户的视频播放记录仅可从APP的系统日志中获得，但由于系统日志数据属于核心数据，各APP只能获取本APP内部的点播记录，无法识别其他竞品的视频播放用户,无法建立全面而客观的用户视频偏好画像。
技术实现思路
本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的一种多站点的视频播放记录整合方法和装置。第一方面，本专利技术实施例提供一种多站点的视频播放记录整合方法，包括：基于运营商的上网日志数据，获取用户在不同视频站点的视频播放记录；基于自然语言处理方法和机器学习方法对所述视频播放记录中的播放视频进行分类；对不同分类下的播放视频在不同视频站点上的播放记录进行聚合，得到用户在全网的视频播放记录。第二方面，本专利技术实施例提供一种多站点的视频播放记录整合装置，包括：多站点视频播放用户识别模块，用于基于运营商的上网日志数据，获取用户在不同视频站点的视频播放记录；多站点视频媒资自动分类模块，用于基于自然语言处理方法和机器学习方法对所述视频播放...

【技术保护点】
1.一种多站点的视频播放记录整合方法，其特征在于，包括：/n基于运营商的上网日志数据，获取用户在不同视频站点的视频播放记录；/n基于自然语言处理方法和机器学习方法对所述视频播放记录中的播放视频进行分类；/n对不同分类下的播放视频在不同视频站点上的播放记录进行聚合，得到用户在全网的视频播放记录。/n

【技术特征摘要】
1.一种多站点的视频播放记录整合方法，其特征在于，包括：
基于运营商的上网日志数据，获取用户在不同视频站点的视频播放记录；
基于自然语言处理方法和机器学习方法对所述视频播放记录中的播放视频进行分类；
对不同分类下的播放视频在不同视频站点上的播放记录进行聚合，得到用户在全网的视频播放记录。

2.根据权利要求1所述的多站点的视频播放记录整合方法，其特征在于，基于运营商的上网日志数据，获取用户在不同视频站点的视频播放记录，具体包括：
从运营商的上网日志数据中提取用户所播放视频的视频ID编号，基于视频ID编号还原对应视频站点的播放页URL，通过网络爬虫对播放页中URL中的视频描述类信息进行定向爬取，获取所述播放视频的视频特征属性数据；
从运营商的上网日志数据中提取用户行为数据，将所述用户行为数据与所述视频特征属性数据关联，得到用户在不同视频站点的视频播放记录。

3.根据权利要求2所述的多站点的视频播放记录整合方法，其特征在于，从运营商的上网日志数据中提取用户所播放视频的视频ID编号前，还包括：
基于抓包的方法获取各站点播放视频时产生的网络数据包，对所述网络数据包进行整理，得到各站点的ID编码规则库、播放页URL规则库、站点访问特征库；
其中，所述ID编码规则库用于从运营商的上网日志数据中提取播放视频的视频ID编号；
所述播放页URL规则库用于根据视频ID编号还原对应视频站点的播放页URL；
所述站点访问特征库用于通过网络爬虫对播放页中URL中的视频描述类信息进行定向爬取，获取用户播放视频的视频特征属性数据。

4.根据权利要求1所述的多站点的视频播放记录整合方法，其特征在于，基于自然语言处理方法和机器学习方法对所述视频播放记录中的播放视频进行分类，具体包括：
获取视频播放记录中播放视频的视频属性特征字段，并基于预先构建的中文分词词典，将所述视频属性特征字段转换为多个词向量；
以多个所述词向量作为输入，通过已训练的自动识别模型，进行播放视频自动识别分类。

5.根据权利要求4所述的多站点的视频播放记录整合方法，其特征在于，基于自然语言处理方法和机器学习方法对所述视频播放记录中的播放视频进行分类前，还包括：
对各视...

【专利技术属性】
技术研发人员：储晶星，全东方，齐希，傅一平，朱骏，
申请(专利权)人：中国移动通信集团浙江有限公司，中国移动通信集团有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人