视频页面剧目确定方法和装置制造方法及图纸

技术编号:23705061 阅读:27 留言:0更新日期:2020-04-08 11:12
本发明专利技术公开了一种视频页面剧目确定方法和装置。该方法包括:获取待解析的视频网页集合,视频网页集合包括一个或多个待解析的视频网页地址;依次获取待解析的视频网页集合中每个待解析的视频网页对应的媒体的剧目解析规则;按照获取到的解析规则解析每个视频网页的剧目,得到解析结果;根据解析结果确定每个视频网页的剧目名称,通过本发明专利技术,达到了提高视频网站页面的剧目提取效率的效果。

【技术实现步骤摘要】
视频页面剧目确定方法和装置
本专利技术涉及视频剧目领域,具体而言,涉及一种视频页面剧目确定方法和装置。
技术介绍
从视频媒体页面中提取剧目可以帮助用户了解当前视频媒体页面中播放的视频媒体是什么,也可以将爬虫爬取到的内容进行更充分的标识。现有获取视频媒体页面剧目的方案是按视频媒体划分,对于每一个视频媒体提供一个专门的剧目提取处理器。一个提取处理器仅能处理一个媒体的页面,并且在媒体页面改版时,对应的提取处理器需要做相应的调整。如果出现了一个新的媒体,则也需要增加对应的提取处理器,需要增加很多重复工作,导致视频网站页面的剧目提取效率低下。针对相关技术中视频网站页面的剧目提取效率低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术的主要目的在于提供一种视频页面剧目确定方法和装置,以解决视频网站页面的剧目提取效率低的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种视频页面剧目确定方法,该方法包括:获取待解析的视频网页集合,所述视频网页集合包括一个或多个待解析的视频网页地址;依次获取待解析的视频网本文档来自技高网...

【技术保护点】
1.一种视频页面剧目确定方法,其特征在于,包括:/n获取待解析的视频网页集合,所述视频网页集合包括一个或多个待解析的视频网页地址;/n依次获取待解析的视频网页集合中每个待解析的视频网页对应的媒体的剧目解析规则;/n按照获取到的所述解析规则解析每个视频网页的剧目,得到解析结果;/n根据所述解析结果确定每个视频网页的剧目名称。/n

【技术特征摘要】
1.一种视频页面剧目确定方法,其特征在于,包括:
获取待解析的视频网页集合,所述视频网页集合包括一个或多个待解析的视频网页地址;
依次获取待解析的视频网页集合中每个待解析的视频网页对应的媒体的剧目解析规则;
按照获取到的所述解析规则解析每个视频网页的剧目,得到解析结果;
根据所述解析结果确定每个视频网页的剧目名称。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获取不到视频网页对应的媒体的剧目解析规则的情况下,将视频网页的标题作为视频网页的剧目名称。


3.根据权利要求1所述的方法,其特征在于,按照获取到的所述解析规则解析每个视频网页的剧目,得到解析结果包括:
通过多个解析规则解析视频网页的剧目,得到对应于每个解析规则的剧目;
计算对应于每个剧目的加权结果;
根据所述加权结果确定加权值最高的剧目为视频网页的剧目名称。


4.根据权利要求3所述的方法,其特征在于,通过多个解析规则解析视频网页的剧目,得到对应于每个解析规则的剧目包括以下至少之一:
基于标签解析规则解析视频网页的标签,得到对应于标签解析规则的剧目;
通过标题解析器基于标题解析规则解析视频网页的标题,得到对应于标题解析规则的剧目;
通过关键词解析器基于关键词解析规则解析视频网页的关键词,得到对应于关键词解析规则的剧目。


5.根据权利要求4所述的方法,其特征在于,根据所述加权结果确定加权值最高的剧目为视频网页的剧目名称包括:
判断对应于标签解析规则的剧目、对应于标题解析规则的剧目、对应于...

【专利技术属性】
技术研发人员:陈国兴
申请(专利权)人:北京国双科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1