一种快速检索采集视频的方法技术

技术编号:27140854 阅读:17 留言:0更新日期:2021-01-27 21:10
本发明专利技术提供了一种快速检索采集视频的方法。获取用户的检索词,确定所述检索词的同义词集合;根据所述同义词集合构建检索视频的约束模型,根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合;根据所述同义词集合在所述视频集合中对应内容出现的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合。本发明专利技术公开了一种快速检索采集视频的方法,主要用于用户采集大量同类视频;通过对视频的同义词进行提取能够最大限度的获取与检索词相关的视频。能够最大限度的获取与检索词相关的视频。能够最大限度的获取与检索词相关的视频。

【技术实现步骤摘要】
一种快速检索采集视频的方法


[0001]本专利技术涉及视频检索
,特别涉及一种快速检索采集视频的方法。

技术介绍

[0002]目前,短视频行业兴盛,因为短视频的制作需要大量素材。然而,各个公司还是通过普通的视频下载和花费资金购买来完成视频数据的检索和收集,这使得成本大量增加。而且在视频的获取上效率极低很难获取到自己的意向视频。

技术实现思路

[0003]本专利技术提供一种快速检索采集视频的方法。用以解决视频采集困难的的情况。
[0004]一种快速检索采集视频的方法,其特征在于,包括:
[0005]获取用户的检索词,确定所述检索词的同义词集合;
[0006]根据所述同义词集合构建视频的约束模型,根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合;
[0007]获取所述同义词集合中同义词在所述检索视频集合中对应内容的特征,并通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合。
[0008]作为本专利技术的一种实施例:所述获取用户的检索词,确定所述检索词的同义词集合,包括:
[0009]获取检索词;
[0010]根据词典获取所述检索词的第一同义词集合A={a1,a2L L a
x
};
[0011]根据网页标签获取所述检索词的第二同义词集合B={b1,b2L L b
y
};
[0012]根据文本关系获取所述检索词的第三同义词集合C={c1,c2L L c
z<br/>};
[0013]对所述第一同义词集合A、第二同义词集合B和第三同义词集合C进行相同项分析,得到相同项集合S
(A,B,C)
:
[0014][0015]其中,所述a
x
表示所述第一同义词集合A中的第x项;所述b
y
表示所述第二同义词集合B中的第y项;所述c
z
表示所述第一同义词集合C中的第z项;所述x=1,2,3L L x;所述y=1,2,3L L y;所述z=1,2,3,L L z;
[0016]根据所述相同项集合S
(A,B,C)
,确定所述同义词集合。
[0017]作为本专利技术的一种实施例:所述根据所述同义词集合构建视频的约束模型,包括:
[0018]步骤1:通过所述同义词集合与所述检索词的距离D:
[0019]D=(G-s
i
)P-1
(G-s
i
);
[0020]其中,所述G表示所述检索词;所述P-1
为所述同义词集合的协方差矩阵,所述s
i
表示所述同义词集合的第i个同义词;
[0021]步骤2:构建所述同义词集合的线性回归方程;
[0022][0023]其中,所述ξ为所述同义词集合内积;所述表示所述同义词集合的均值;
[0024]步骤3:根据所述距离D合线性回归方程确定所述视频的约束模型F:
[0025][0026]其中,所述k
j
表示检索视频集合的第j个视频;所述表示检索视频集合的均值;所述β表示所述检索视频集合的误差系数。
[0027]作为本专利技术的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,包括:
[0028]根据所述同义词集合在任意视频检索网站获取第一检索视频集合;
[0029]确定所述第一检索视频集合的均值;
[0030]根据所述均值,将所述检索视频集合中检索的视频的参数导入所述约束模型,得到约束值;
[0031]获取所述约束值中的正值和与所述正值对应的视频,确定所述检索视频合集。
[0032]作为本专利技术的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:
[0033]根据所述同义词集合在任意视频检索网站检索视频;
[0034]获取所述检索视频的链接地址;
[0035]根据所述链接地址,确定所述链接地址对应的视频网页;
[0036]当所述链接地址没有对应的视频网页时,删除所述链接地址;
[0037]对所述视频网页中的视频进行触发,响应对所述视频网页触发行为,当所述视频网页的触发行为具有响应时,获取所述视频网页的视频,构成所述检索视频集合;
[0038]当所述视频网页的触发行为没有有响应时,判断所述视频网页为无效网页。
[0039]作为本专利技术的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:
[0040]获取所述检索视频的网络传输协议;
[0041]根据所述网络传输协议判断所述检索视频的获取方式;
[0042]根据所述检索视频的获取方式,获取对应的视频加载工具;
[0043]根据所述加载工具,获取所述检索视频集合。
[0044]作为本专利技术的一种实施例:所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:
[0045]获取检索视频对应的视频网页;
[0046]判断所述视频网页异常弹窗的次数;
[0047]根据所述异常弹窗的次数,判断所述视频网页是否异常网页;
[0048]当所述视频网页为异常网页时,删除所述视频网页;
[0049]当所述视频网页为正常网页时,获取所述视频网页的视频,构成检索视频集合。
[0050]作为本专利技术的一种实施例:所述获取所述同义词集合的同义词在所述视频集合中
对应内容出现的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合,包括:
[0051]在所述检索视频集合确定后,获取所述同义词集合中每个同义词的语意;
[0052]根据所述同义词集合中每个同义词的语意,判断与同义词对应的视频的特征;
[0053]根据所述同义词集合对应视频的特征与模板视频参数对比,确定最终的目标视频集合。
[0054]作为本专利技术的一种实施例:所述预设特征参数通过以下步骤确定:
[0055]步骤S1:获取检索视频集合E={e1,e2L L e
g
};所述g表示第g个视频;所述g=1,2,3L L g;
[0056]步骤S2:根据所述检索视频集合E,确定所述检索视频集合的特征矩阵R:
[0057][0058]其中,所述r
gl
表示第g个视频的第l个特征;
[0059]步骤S3:根据所述检索视频集合的特征矩阵R,计算所述检索视频集合的差值系数η:
[0060][0061]其中,所述em为模板视频的特征参数,所述N为检索视频集合的个数;
[0062]步骤S4:根据所述差值系数η和模板视频确定所述目标视频的阀值ε=emη:
[0063]当所述检索视频集合中的视频的特征参数大于等于所述目标视频的阀值时,确定所述检索本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种快速检索采集视频的方法,其特征在于,包括:获取用户的检索词,确定所述检索词的同义词集合;根据所述同义词集合构建检索视频的约束模型,通过所述约束模型检索并获取与所述同义词集合对应的检索视频集合;获取所述同义词集合在所述检索视频集合中对应内容的特征,通过预设的特征参数对所述检索视频集合中的视频进行筛检,得到目标视频集合。2.如权利要求1所述的一种快速检索采集视频的方法,其特征在于,所述获取用户的检索词,确定所述检索词的同义词集合,包括:获取检索词;根据词典获取所述检索词的第一同义词集合A={a1,a2L L a
x
};根据网页标签获取所述检索词的第二同义词集合B={b1,b2L L b
y
};根据文本关系获取所述检索词的第三同义词集合C={c1,c2L L c
z
};对所述第一同义词集合A、第二同义词集合B和第三同义词集合C进行相同项分析,得到相同项集合S
(A,B,C)
:其中,所述a
x
表示所述第一同义词集合A中的第x项;所述b
y
表示所述第二同义词集合B中的第y项;所述c
z
表示所述第一同义词集合C中的第z项;所述x=1,2,3L L x;所述y=1,2,3L L y;所述z=1,2,3,L L z;根据所述相同项集合S
(A,B,C)
,确定所述同义词集合。3.如权利要求1所述的一种快速检索采集视频的方法,其特征在于,所述根据所述同义词集合构建视频的约束模型,包括:步骤1:确定所述同义词集合与所述检索词的距离D:D=(G-s
i
)P-1
(G-s
i
);其中,所述G表示所述检索词;所述P-1
为所述同义词集合的协方差矩阵,所述s
i
表示所述同义词集合的第i个同义词;步骤2:构建所述同义词集合的线性回归方程;其中,所述ξ为所述同义词集合内积;所述表示所述同义词集合的均值;步骤3:根据所述距离D合线性回归方程确定所述视频的约束模型F:其中,所述k
j
表示检索视频集合的第j个视频;所述表示检索视频集合的均值;所述β表示所述检索视频集合的误差系数。4.如权利要求1所述的一种快速检索采集视频的方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,包括:根据所述同义词集合在任意视频检索网站获取第一检索视频集合;
确定所述第一检索视频集合的均值;根据所述均值,将所述检索视频集合中检索的视频的参数导入所述约束模型,得到约束值;获取所述约束值中的正值和与所述正值对应的视频,确定所述检索视频合集。5.如权利要求1所述的一种快速检索采集视频的方法,其特征在于,所述根据所述约束模型检索并获取与所述同义词集合对应的检索视频集合,还包括:根据所述同义词集合在任意视频检索网站进行检索视频;获取所述检索视频的链接地址;根据所述链接地址,确定所述链接地址...

【专利技术属性】
技术研发人员:李月梅
申请(专利权)人:广州五子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1