用户画像构建方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:23898956 阅读:31 留言:0更新日期:2020-04-22 09:54
本申请涉及一种用户画像构建方法、装置、计算机设备和存储介质,其中,方法包括:先获取视频播放时发送的弹幕数据、并记录弹幕发送时间,通过预设弹幕情感分析模型对弹幕数据进行情感分析,准确得到弹幕数据对应的情感标签,再采集弹幕发送时间前后预设时间范围内的画面信息,通过预设画面内容识别模型,准确获取画面信息对应的画面内容,以准确获取的视频播放中的弹幕数据以及画面内容为用户画像构建数据基础,可以准确构建用户画像。

【技术实现步骤摘要】
用户画像构建方法、装置、计算机设备和存储介质
本申请涉及用户画像构建
,特别是涉及一种用户画像构建方法、装置、计算机设备和存储介质。
技术介绍
用户画像又称用户角色,作为一种勾画目标用户、联系用户诉求与设计方向的有效工具,基于构建的用户画像可以针对性对用户提供服务,给用户带来便捷,例如基于用户画像推送产品(商品)信息、基于用户画像推送音乐以及基于用户画像推送视频等,正是由于用户画像具有上述有效的功能,目前用户画像在各领域得到了广泛的应用。随着用户画像大规模推广应用,如何在当前场景下高效且准确生成用户画像已经成为难题。以应用于基于用户画像推荐视频场景下为例,目前常规的用户画像构建方式是记录用户视频播放操作,识别历史播放视频的类型、时长、频率等信息来构建用户画像。上述方式虽然可以构建出用户画像,但是很多时候用户只是对整个视频中某个画面感兴趣,例如对某个视频中出现的风景感兴趣、对某个视频中出现产品感兴趣、或对某个视频中出现的明星感兴趣,采用上述基于用户视频播放操作的用户画像构建显然无法关注到这些方面因素,造成用户画像构建不准确,无法准确定义用户角色。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够准确构建用户画像的用户画像构建方法、装置、计算机设备和存储介质。一种用户画像构建方法,所述方法包括:获取视频播放时发送的弹幕数据、并记录弹幕发送时间;根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签;采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容;根据所述情感标签以及所述画面内容,构建用户画像。在其中一个实施例中,所述根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签之前,还包括:获取历史弹幕数据以及所述历史弹幕数据对应标注的情感值;根据所述历史弹幕数据,得到多个弹幕词语;获取各弹幕词语对应的情感值平均值,根据所述多个弹幕词语以及对应的所述情感值平均值,生成弹幕情感训练数据;将所述弹幕情感训练数据输入至基于循环递归神经网络的模型,训练得到预设弹幕情感分析模型。在其中一个实施例中,所述采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容之前,还包括:获取样本视频画面信息以及对应的文本描述;根据所述样本视频画面信息以及所述对应的文本描述训练GAN模型,得到预设画面内容识别模型。在其中一个实施例中,所述根据所述样本视频画面信息以及所述对应的文本描述训练GAN模型,得到预设画面内容识别模型包括:连续或周期性抽取所述样本视频画面信息中视频帧;将抽取的视频帧作为GAN模型输入,并将所述对应的文本描述作为GAN模型输出,训练GAN模型,得到预设画面内容识别模型。在其中一个实施例中,所述将抽取的视频帧作为GAN模型输入,并将所述对应的文本描述作为GAN模型输出,训练GAN模型,得到预设画面内容识别模型包括:获取抽取的视频帧,解析所述抽取的视频帧对应高度、宽度以及通道的维度数据;将所述抽取的视频帧以及对应的所述维度数据送入神经网络模型中编码器进行编码,得到编码数据;将所述编码数据导入与所述编码器对应的解码器,解码输出文本描述;根据解码输出的文本描述以及所述对应的文本描述调整神经网络模型中分类器,得到预设画面内容识别模型。在其中一个实施例中,所述根据所述情感标签以及所述画面内容,构建用户画像之后,还包括:根据构建的用户画像,推荐视频至用户。在其中一个实施例中,所述根据构建的用户画像,推荐视频至用户之后,还包括:采集用户对已推荐视频的操作行为数据,操作行为包括点击观看、收藏、评论以及发送弹幕;根据所述操作行为数据,优化所述用户画像。一种用户画像构建装置,所述装置包括:数据获取模块,用于获取视频播放时发送的弹幕数据、并记录弹幕发送时间;情感分析模块,用于根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签;内容获取模块,用于采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容;画像构建模块,用于根据所述情感标签以及所述画面内容,构建用户画像。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的方法的步骤。上述用户画像构建方法、装置、计算机设备和存储介质,先获取视频播放时发送的弹幕数据、并记录弹幕发送时间,通过预设弹幕情感分析模型对所述弹幕数据进行情感分析,准确得到所述弹幕数据对应的情感标签,再采集所述弹幕发送时间前后预设时间范围内的画面信息,通过预设画面内容识别模型,准确获取所述画面信息对应的画面内容,以准确获取的视频播放中的弹幕数据以及画面内容为用户画像构建数据基础,可以准确构建用户画像。附图说明图1为一个实施例中用户画像构建方法的应用环境图;图2为一个实施例中用户画像构建方法的流程示意图;图3为另一个实施例中用户画像构建方法的流程示意图;图4为一个实施例中用户画像构建装置的结构框图;图5为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请提供的用户画像构建方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。用户在终端102上操作,通过终端102浏览视频并且发送弹幕,服务器104捕捉到终端102播放在播放视频过程中用户输入的弹幕,服务器104具体获取视频播放时发送的弹幕数据、并记录弹幕发送时间,根据预设弹幕情感分析模型对弹幕数据进行情感分析,得到弹幕数据对应的情感标签;采集弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取画面信息对应的画面内容;根据情感标签以及画面内容,构建用户画像,将构建的用户画像保存,以便下一步基于构建的画像给用户推荐视频、推荐产品的操作。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。在一个实施例中,如图2所示,提供了一种用户画像构建方法,以该方法应用于图1中的服务器为例进行说明,包括以下步骤:S200:获取视频播放时发送的弹幕数据、并记录弹幕发送时间。用户在终端上操作,终端本文档来自技高网...

【技术保护点】
1.一种用户画像构建方法,所述方法包括:/n获取视频播放时发送的弹幕数据、并记录弹幕发送时间;/n根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签;/n采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容;/n根据所述情感标签以及所述画面内容,构建用户画像。/n

【技术特征摘要】
1.一种用户画像构建方法,所述方法包括:
获取视频播放时发送的弹幕数据、并记录弹幕发送时间;
根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签;
采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容;
根据所述情感标签以及所述画面内容,构建用户画像。


2.根据权利要求1所述的方法,其特征在于,所述根据预设弹幕情感分析模型对所述弹幕数据进行情感分析,得到所述弹幕数据对应的情感标签之前,还包括:
获取历史弹幕数据以及所述历史弹幕数据对应标注的情感值;
根据所述历史弹幕数据,得到多个弹幕词语;
获取各弹幕词语对应的情感值平均值,根据所述多个弹幕词语以及对应的所述情感值平均值,生成弹幕情感训练数据;
将所述弹幕情感训练数据输入至基于循环递归神经网络的模型,训练得到预设弹幕情感分析模型。


3.根据权利要求1所述的方法,其特征在于,所述采集所述弹幕发送时间前后预设时间范围内的画面信息,根据预设画面内容识别模型,获取所述画面信息对应的画面内容之前,还包括:
获取样本视频画面信息以及对应的文本描述;
根据所述样本视频画面信息以及所述对应的文本描述训练GAN模型,得到预设画面内容识别模型。


4.根据权利要求3所述的方法,其特征在于,所述根据所述样本视频画面信息以及所述对应的文本描述训练GAN模型,得到预设画面内容识别模型包括:
连续或周期性抽取所述样本视频画面信息中视频帧;
将抽取的视频帧作为GAN模型输入,并将所述对应的文本描述作为GAN模型输出,训练GAN模型,得到预设画面内容识别模型。


5.根据权利要求4所述的方法,其特征在于,所述将抽取的视频帧作为GAN模型输入,并将所述对应的文本描述作...

【专利技术属性】
技术研发人员:林田谦谨
申请(专利权)人:汉口北进出口服务有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1