The embodiment of the invention provides a video search method, a device and a server, belonging to the technical field of the internet. The video search method includes: calculating the similarity of each video search word and resource database input in the search list, and then according to the generation of candidate calculated similarity, then calculate the quality of video data for each candidate search list, finally obtained the quality data based on similarity and video generation of search words should be current the target list of search results. The comprehensive consideration of the quality of data and video search word similarity and video, video search method, its results can significantly enhance the user's viewing experience, users can get what they want to watch or watch the love and to ensure the quality of the video from the search results.
【技术实现步骤摘要】
一种视频搜索方法、装置及服务器
本专利技术涉及互联网
,具体而言,涉及一种视频搜索方法、装置及服务器。
技术介绍
随着科学技术的不断发展,电子技术也得到了飞速发展。人们可以通过例如智能手机、平板电脑等电子设备下载安装各种资讯类应用(如今日头条、搜狐新闻、UC头条等)以观看视频。现有技术中,用户可以在应用界面上通过输入搜索词来获取想要观看的视频,但是存在的问题是,展示出的搜索结果给用户的体验不佳,经常会出现没有用户想要的视频或者搜索出的视频质量欠佳,不能很好的满足用户的观看需求。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种视频搜索方法、装置及服务器,以改善上述问题。本专利技术较佳实施例提供一种视频搜索方法,该方法包括:计算输入的搜索词与资源数据库中每个视频的相似度;根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表;获取所述搜索词之前每次被搜索时得到的搜索结果列表;根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据;根据所述候选搜索列表中每个视频的所述质量数据和对应的相似度,获得所述搜索词当前的目标搜索结果列表。本专利技术另一较佳实施例提供一种视频搜索装置,该装置包括:相似度计算模块,用于计算输入的搜索词与资源数据库中每个视频的相似度;候选搜索列表生成模块,用于根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表;搜索结果列表获取模块,用于获取所述搜索词之前每次被搜索时得到的搜索结果列表;质量数据计算模块,用于根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数 ...
【技术保护点】
一种视频搜索方法,其特征在于,该方法包括:计算输入的搜索词与资源数据库中每个视频的相似度;根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表;获取所述搜索词之前每次被搜索时得到的搜索结果列表;根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据;根据所述候选搜索列表中每个视频的所述质量数据和对应的相似度,获得所述搜索词当前的目标搜索结果列表。
【技术特征摘要】
1.一种视频搜索方法,其特征在于,该方法包括:计算输入的搜索词与资源数据库中每个视频的相似度;根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表;获取所述搜索词之前每次被搜索时得到的搜索结果列表;根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据;根据所述候选搜索列表中每个视频的所述质量数据和对应的相似度,获得所述搜索词当前的目标搜索结果列表。2.根据权利要求1所述的视频搜索方法,其特征在于,所述根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表的步骤,包括:获取所述资源数据库中对应的相似度大于预设值的所有视频;通过获取到的所述所有视频生成所述候选搜索列表。3.根据权利要求1所述的视频搜索方法,其特征在于,所述根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据的步骤,包括:根据计算式:计算所述候选搜索列表中每个视频的质量数据,其中,qul表示视频的质量数据,J表示所述候选搜索列表,st表示预先统计得到的视频在各个所述搜索结果列表中的播放完成率,avgj∈J(stj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均播放完成率,ct表示预先统计得到的视频在各个所述搜索列表中的被点击率,avgj∈J(ctj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均被点击率,hb表示预先统计得到的视频在各个所述搜索列表中的用户行为反馈率,avgj∈J(hbj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均用户行为反馈率,sk表示预先统计得到的视频在各个所述搜索列表中的被跳过率,avgj∈J(skj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均被跳过率,α、β、γ、θ是预设的权重参数。4.根据权利要求3所述的视频搜索方法,其特征在于,所述根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据的步骤,还包括:根据计算式:统计每个视频在各个所述搜索结果列表中的播放完成率,其中,NumDis表示视频在各个所述搜索结果列表中被展示的总次数,numst表示视频在各个所述搜索结果列表中被点击且播放完成的总次数;根据计算式:统计每个视频在各个所述搜索结果列表中的被点击率,numct表示视频在各个所述搜索结果列表中被点击的总次数;根据计算式:统计每个视频在各个所述搜索结果列表中的用户行为反馈率,numhb表示视频在各个所述搜索结果列表中的用户行为反馈总次数,所述用户行为反馈包括针对该视频的点赞、评论和分享;及根据计算式:统计每个视频在各个所述搜索结果列表中的被跳过率,numsk表示视频在各个所述搜索结果列表中被跳过的总次数,所述被跳过包括在搜索结果列表中的展示位在该视频之后的其他视频被点击而该视频未被点击。5.根据权利要求1所述的视频搜索方法,其特征在于,所述根据所述候选搜索列表中每个视频的所述质量数据和对应的相似度,获得所述搜索词当前的目标搜索结果列表的步骤,包括:针对所述候选搜索列表中的每个视频,将其对应的相似度和所述质量数据相乘得到每个视频的排序值;按照所述排序值对所述候选搜索列表中的视频进行排序,生成所述搜索词当前的目标搜索结果列表。6.根据权利要求1所述的视频搜索方法,其特征在于,所述计算输入的搜索词与资源数据库中每个视频的相似度的步骤,包括:获取描述所述视频的目标文本信息;对所述目标文本信息及所述搜索词进行分词,并计算出每个分词在所述目标文本信息、所述搜索词中出现的词频;根据所述资源数据库中的所有视频对应的文本信息,计算所述每个分词的逆文档频率;根据所述每个分词在所述目标文本信息中出现的词频以及所述每个分词的逆文档频率,计算得到该视频的第一特征向量;根据所述每个分词在所述搜索词中出现的词频以及所述每个分词的逆文档频率,计算得到该搜索词的第二特征向量;计算所述第一特征向量和所述第二特征向量的夹角的余弦值,该余弦值表示所述搜索词与所述视频的相似度。7.一种视频搜索装置,其特征在于,该装置包括:相似度计算模块,用于计算输入的搜索词与资源数据库中每个视频的相似度;候选搜索列表生成模块,用于根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表;搜索结果列表获取模块,用于获取所述搜索词之前每次被搜索时得到的搜索结果列表;质量数据计算模块,用于根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据;目标搜索结果列表生成模块,用于根据所述候选搜索列表中每个视频的所述质量数据和对应的相似度,获得所述搜索词当前的目标搜索结果列表。8.根据权利要求7所述的视频搜索装置,其特征在于,所述候选搜索列表生成模块根据所述资源数据库中每个视频对应的相似度,生成所述搜索词的候选搜索列表的方式,包括:获取所述资源数据库中对应的相似度大于预设值的所有视频;通过获取到的所述所有视频生成所述候选搜索列表。9.根据权利要求7所述的视频搜索装置,其特征在于,所述质量数据计算模块根据上述得到的各个所述搜索结果列表,计算所述候选搜索列表中每个视频的质量数据的方式,包括:根据计算式:计算所述候选搜索列表中每个视频的质量数据,其中,qul表示视频的所述质量数据,J表示所述候选搜索列表,st表示预先统计得到的视频在各个所述搜索结果列表中的播放完成率,avgj∈J(stj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均播放完成率,ct表示预先统计得到的视频在各个所述搜索列表中的被点击率,avgj∈J(ctj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均被点击率,hb表示预先统计得到的视频在各个所述搜索列表中的用户行为反馈率,avgj∈J(hbj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均用户行为反馈率,sk表示预先统计得到的视频在各个所述搜索列表中的被跳过率,avgj∈J(skj)表示预先统计得到的所述候选搜索列表中所有视频在各个所述搜索结果列表中的平均被跳过率,α、β、γ、θ是预设的权重参数。10.根据...
【专利技术属性】
技术研发人员:潘岸腾,
申请(专利权)人:广州优视网络科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。