The present invention provides a method for identifying features of web search keywords, which is characterized in that the method comprises the following steps: according to user search keyword generation on the website of the URL; extracting at least one from the beginning, to confirm the keywords of field and characteristic features of the composition of the end from the URL; at least one the field is sent to the user interface of the display, according to the users to search keywords, and displayed in the field to confirm the keyword, correct field in the field to confirm the correct field display; receiving user confirmation, get the starting characteristics of the field and the end of the beginning and end of feature, feature composition the identification of web pages. Using this application scheme, the identification features of web search keywords can be obtained flexibly according to the actual requirements.
【技术实现步骤摘要】
一种获得网页搜索关键字的标识特征的方法及装置
本申请涉及互联网
,尤其涉及一种获得网页搜索关键字的标识特征的方法及装置。
技术介绍
随着网络技术的发展,对用户在网页中搜索的关键字进行审计,从而保障网络安全的需求日益增加。用户在网页中进行搜索时,将生成HTTP/GET报文发送至网页服务器,该报文的URL中包括并通过某种形式的特征标识了用户输入的关键字,因此通过解析URL数据,即可提取用户所搜索的关键字进行审计。然而,不同网页所使用的标识特征没有统一的标准,因此在对某一网页进行搜索关键字审计前,首先需要获得该网页的关键字标识特征。现有技术中,通常是由专业的技术工程师分析常用的搜索引擎、门户网站等网页的搜索URL数据,提取网页的标识特征,在审计设备出厂时内置这些常用网页的标识特征,并由专业的分析团队长期地为用户提供常用网页及其标识特征的更新补丁。显然这种方式灵活性较差,一方面只能满足用户的一般需求,对于针对性较强的、较为小众的网页,如专业性网站、学校内部论坛等类别的网页,无法提供全面的审计覆盖,另一方面,定期提供更新补丁的方式,也无法适应互联网中的网页与资讯的更新速度,审计效果较差。
技术实现思路
有鉴于此,本申请提供一种获得网页搜索关键字的标识特征的方法及装置,技术方案如下:根据本申请的第一方面,提供一种获得网页搜索关键字的标识特征的方法,该方法包括:获得根据用户在网页中搜索的关键字生成的URL;从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;将解析得到的至少一个字段发送至用户界面显示,以使用户根据所搜索的关键字、及所显示字段中的待确 ...
【技术保护点】
一种获得网页搜索关键字的标识特征的方法,其特征在于,所述方法包括:获得根据用户在网页中搜索的关键字生成的URL;从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;将解析得到的至少一个字段发送至用户界面显示,以使用户根据所搜索的关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;接收用户确认的正确字段,获得该字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页的标识特征。
【技术特征摘要】
1.一种获得网页搜索关键字的标识特征的方法,其特征在于,所述方法包括:获得根据用户在网页中搜索的关键字生成的URL;从所述URL中提取至少一个由开始特征、待确认关键字及结束特征组成的字段;将解析得到的至少一个字段发送至用户界面显示,以使用户根据所搜索的关键字、及所显示字段中的待确认关键字,确认所显示字段中的正确字段;接收用户确认的正确字段,获得该字段的开始特征与结束特征,所述开始特征与结束特征组成所述网页的标识特征。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据接收到的所述网页的审计添加指令,获得所述网页的域名;在获得所述网页的标识特征的情况下,对应存储所述网页的域名与标识特征。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:在接收到用户的远程更新指令、和/或审计服务器的远程更新请求的情况下,下载审计服务器中的网页域名与标识特征;对应存储所下载的网页域名与标识特征。4.一种基于权利要求2或3所述方法的网页搜索关键字提取方法,其特征在于,所述方法包括:解析用户设备生成的HTTP/GET报文,得到该报文中的网页域名与URL;在确认所述网页域名对应的网页为待审计网页的情况下,获得预先存储的所述网页域名对应的标识特征;在该URL中查找该标识特征的开始特征与结束特征;提取开始特征与结束特征间的数据,所述数据即为用户在该网页中搜索的关键字。5.根据权利要求4所述的方法,其特征在于,所述在确认所述网页域名对应的网页为待审计网页的情况下,获得预先存储的所述网页域名对应的标识特征,包括:在预先存储的网页域名中查找该报文中的网页域名;在查找到该网页域名的情况下,确定该网页域名对应的网页为待审计网页;获得与该网页域名预先对应存储的标识特征。6.一种获得网页搜索关键字的标识特征的装置,其特征在于,所述装置包括:URL获得模块,用于获得根据用户在...
【专利技术属性】
技术研发人员:魏方征,
申请(专利权)人:杭州迪普科技股份有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。