System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,特别是涉及一种视频数据采集方法、装置、芯片及存储介质。
技术介绍
1、随着互联网的发展,积累的数据爆炸增长,使得数据库中存在着海量的数据,这些数据中包含用户感兴趣的内容,也存在许多用户不感兴趣的内容,用户感兴趣的内容的数据量和数据库包含的数据量相比如同沧海一粟,造成了数据稀疏的问题,不利于进行数据查找、采集。
技术实现思路
1、基于此,本专利技术提供一种视频数据采集方法、装置、芯片及存储介质,可以解决数据稀疏的技术问题。
2、第一方面,提供一种视频数据采集方法,包括:
3、确定视频数据集中各视频数据的文本特征,所述视频数据集包括至少一个视频数据;
4、根据文本卷积神经网络从所述文本特征中提取所述视频数据集的各视频数据的视频特征;
5、根据用户特征与各视频特征从所述视频数据集中的确定视频数据组成偏好视频集;
6、根据用户交互历史节点的视频特征建立偏好特征;
7、基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分,并采集满足预设偏好评分的视频数据。
8、可选的,根据用户交互历史节点的视频特征建立偏好特征包括:
9、构建包含用户交互历史节点与行为边的异构图;
10、基于所述异构图建立用户与视频数据的多层低维表征向量;
11、结合所述用户与视频数据的多层低维表征向量,基于多层向量传播按照预设时间周期建立偏好特征。
12、可选的,基于
13、借助向量传播方法通过用户第一预设时间周期历史交互结点的表征向量进行建模得到长期偏好特征;
14、和/或,
15、借助向量传播方法,通过用户第二预设时间周期历史交互结点的表征向量进行建模得到短期偏好特征;
16、所述第一预设时间周期长于所述第二预设时间周期。
17、可选的,基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分,还包括:
18、拼接所述长期偏好特征和所述短期偏好特征;
19、利用拼接后的偏好特征,基于注意力网络的预测函数,对所述偏好视频集中的视频数据进行偏好评分。
20、可选的,文本特征包括视频数据的视频标题、视频标签和/或视频内容文本。
21、第二方面,提供一种视频数据采集装置,包括:
22、文本特征确定模块,用于确定视频数据集中各视频数据的文本特征,所述视频数据集包括至少一个视频数据,所述文本特征包括视频数据的视频标题、视频标签、视频内容文本;
23、视频特征提取模块,用于根据文本卷积神经网络从所述文本特征中提取所述视频数据集的各视频数据的视频特征;
24、偏好视频集确定模块,根据用户特征与各视频特征从所述视频数据集中的确定视频数据组成偏好视频集;
25、偏好特征建立模块,用于根据用户交互历史节点的视频特征建立偏好特征;
26、评分采集模块,用于基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分;
27、视频数据采集模块,用于采集满足预设偏好评分的视频数据。
28、可选的,偏好特征建立模块还包括:
29、异构图建立单元,用于构建包含用户交互历史节点与行为边的异构图;
30、表征向量建立单元,用于基于所述异构图建立用户与视频数据的多层低维表征向量;
31、偏好特征建立单元,用于结合所述用户与视频数据的多层低维表征向量,基于多层向量传播按照预设时间周期建立偏好特征。
32、可选的,偏好特征建立单元还包括:
33、长期偏好特征建立模块,用于借助向量传播方法通过用户第一预设时间周期历史交互结点的表征向量进行建模得到长期偏好特征;和/或,
34、短期偏好特征建立模块,用于借助向量传播方法,通过用户第二预设时间周期历史交互结点的表征向量进行建模得到短期偏好特征;
35、第一预设时间周期长于所述第二预设时间周期。
36、第三方面,提供一种芯片,包括第一处理器,用于从第一存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如上介绍的视频数据采集方法的各个步骤。
37、第四方面,提供一种终端,包括第二存储器、第二处理器以及存储在所述第二存储器中并可在所述第二处理器上运行的计算机程序,第二处理器执行所述计算机程序时实现如上介绍的视频数据采集方法的各个步骤。
38、上述视频数据采集方法、装置、芯片及存储介质,通过确定视频数据集中各视频数据的文本特征,视频数据集包括至少一个视频数据,根据文本卷积神经网络从文本特征中提取视频数据集的各视频数据的视频特征,根据用户特征与各视频特征从视频数据集中的确定视频数据组成偏好视频集,根据用户交互历史节点的视频特征建立偏好特征,基于偏好特征对偏好视频集中的各视频进行偏好评分,并采集满足预设偏好评分的视频数据。本专利技术通过先提取视频数据集中的视频特征,基于该视频特征和用户特征从视频数据集中确定偏好视频集,可以使得数据粘稠,之后再建立偏好特征基于此对偏好视频集中的各视频数据进行偏好评分,有助于数据查找、采集。
本文档来自技高网...【技术保护点】
1.一种视频数据采集方法,其特征在于,包括:
2.如权利要求1所述的视频数据采集方法,其特征在于,所述根据用户交互历史节点的视频特征建立偏好特征包括:
3.如权利要求2所述的视频数据采集方法,其特征在于,所述基于多层向量传播按照预设时间周期建立偏好特征包括:
4.如权利要求3所述的视频数据采集方法,其特征在于,所述基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分,还包括:
5.如权利要求1至4任意一项所述的视频数据采集方法,其特征在于,所述文本特征包括视频数据的视频标题、视频标签和/或视频内容文本。
6.一种视频数据采集装置,其特征在于,包括:
7.如权利要求6所述的视频数据采集装置,其特征在于,所述偏好特征建立模块还包括:
8.如权利要求7所述的视频数据采集装置,其特征在于,偏好特征建立单元还包括:
9.一种芯片,其特征在于,包括:第一处理器,用于从第一存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如权利要求1至5任意一项所述的一种视频数据采集方法。
1
...【技术特征摘要】
1.一种视频数据采集方法,其特征在于,包括:
2.如权利要求1所述的视频数据采集方法,其特征在于,所述根据用户交互历史节点的视频特征建立偏好特征包括:
3.如权利要求2所述的视频数据采集方法,其特征在于,所述基于多层向量传播按照预设时间周期建立偏好特征包括:
4.如权利要求3所述的视频数据采集方法,其特征在于,所述基于所述偏好特征对所述偏好视频集中的各视频进行偏好评分,还包括:
5.如权利要求1至4任意一项所述的视频数据采集方法,其特征在于,所述文本特征包括视频数据的视频标题、视频标签和/或视频内容文本。
6.一种视频数据采集装置,其特征在于...
【专利技术属性】
技术研发人员:谢英娜,何文钦,何炜程,何炜骏,
申请(专利权)人:深圳市博锐高科科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。