一种网页模板生成方法及装置制造方法及图纸

技术编号:13390514 阅读:68 留言:0更新日期:2016-07-22 14:03
本发明专利技术公开了一种网页模板生成方法,包括:获取预定数量的网页地址等同目录下的网页;将所述网页切分成若干切分块,计算所述各切分块的特征值;将计算得到的所述特征值进行统计;将重复出现次数多于预设阈值的特征值保存到特征值库,作为模板部分的特征值。本发明专利技术还提供相应的装置。根据本发明专利技术能基于已有网页生成适配的网页模版,所生成的模板能够很好的体现网页的内容,在用于网页解析时,能够只对网页中真正的内容部分进行解析,从而减少垃圾信息的干扰,提高网页分析的准确度和精确度,明显提高网页分析的效果。

【技术实现步骤摘要】

【技术保护点】
一种网页模板生成的方法,其特征在于,包括如下步骤:获取预定数量的网页地址等同目录下的网页;将所述网页切分成若干切分块,计算所述各切分块的特征值;将计算得到的所述特征值进行统计;将重复出现次数多于预设阈值的特征值保存到特征值库,作为模板部分的特征值。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑清芳章动鲍东山
申请(专利权)人:北京新岸线移动多媒体技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1