当前位置: 首页 > 专利查询>庄爱芹专利>正文

一种浏览器浏览记录的管理方法及装置制造方法及图纸

技术编号:15219427 阅读:55 留言:0更新日期:2017-04-26 16:37
本发明专利技术公开了一种浏览器浏览记录的管理方法,用于解决现有技术中浏览器用户在浏览记录中查询信息时,不仅操作繁琐,而且查询效率低的问题。该方法包括:获取用户的浏览记录并对其进行分类得到样本集合;分别对各样本集合进行相关性分析生成相应的分类组合,该分类组合包含所述样本集合中浏览记录对应的特征向量;根据各分类组合中词语出现的频率确定分类组合对应的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录;以及根据用户查询时输入的关键词查找与该关键词匹配的浏览主题,并将查找到的与浏览主题关联的浏览记录呈现给用户。本发明专利技术同时公开了一种浏览器浏览记录的管理装置。

Method and device for managing browser browsing record

The invention discloses a method for managing browser browsing records, which is used to solve the problem that the browser users in the prior art not only have complicated operation, but also have low query efficiency when searching information in browsing records. The method includes: obtaining the user's browsing history and carries on the classification to get the sample set; each sample set by correlation analysis generated the corresponding classification, the classification combination containing the sample set in browsing the corresponding eigenvectors; according to the words of each classification appeared in determining the frequency corresponding to the combination of browsing theme classification, and the association to browse the topic classification combined the corresponding browsing records; and according to the user input query keyword search with the keyword matching and browsing theme, to search and browse the topic related browsing records presented to the user. The invention also discloses a browser browsing record management device.

【技术实现步骤摘要】

本专利技术涉及通信及计算机
,尤其涉及一种即时通讯浏览记录的管理方法及装置。
技术介绍
随着互联网技术的不断发展和普及,越来越多的用户不仅采用浏览器软件在网络中与其他用户进行交流,还可以将浏览器软件作为用户向其他用户咨询工作或学习中遇到问题的工具,同时,用户间的浏览记录伴随着用户间的交流在浏览器系统中保存下来,为用户以后查找自己关注的信息提供了资料。例如:当用户A向用户B对一个问题进行了咨询,用户B返回了问题的答案,当用户C就同一个问题咨询用户A或用户B时,用户A需要查看与用户B的浏览记录中的相关信息,或者用户B需要查看与用户A的浏览记录中的相关信息时,用户A或用户B都需要在浏览记录中人工查找相关记录,当浏览记录较多或用户A与用户C咨询问题的时间间隔较长时,采用现有技术的方法,不仅增加了人工查找的工作量,而且查找效率较低。如果用户A就同一问题对多个用户进行了咨询,当用户A希望从与多个用户的浏览记录中查询信息时,采用现有技术的方法,如用户使用的浏览器系统提供浏览记录查看功能的浏览器系统时,用户A只能人工对多个用户的浏览记录逐一查看,找到自己关心的信息。即使用户A使用其它一些提供了用户浏览记录的数据导入/导出功能的浏览器系统,用户A也需要将多个用户的浏览记录数据先进行导出,然后在导出数据中进行查询,用户A还可根据自己关心的信息的关键词在导出数据中进行查询,但采用关键词的方式也只能定位到包含该关键词的语段,该语段不一定与用户关心的信息相关,也不能实现用户在浏览记录中有效查找信息。
技术实现思路
本专利技术提供一种即时通讯浏览记录的管理方法及装置,用以解决现有技术中存在的即时通讯用户在浏览记录中查询信息时,不仅操作繁琐,而且查询效率低的问题。本专利技术提供以下技术方案:一种浏览器浏览记录的管理方法,包括如下步骤:获取用户的浏览记录并对其进行分类得到样本集合;分别对各样本集合进行相关性分析生成相应的分类组合,该分类组合包含所述样本集合中浏览记录对应的特征向量;根据各分类组合中词语出现的频率确定分类组合对应的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录;以及根据用户查询时输入的关键词查找与该关键词匹配的浏览主题,并将查找到的与浏览主题关联的浏览记录呈现给用户。其中,生成浏览主题后进一步分析浏览主题之间的相关性,并将相关性大于预定阈值的浏览主题合并为同一个浏览主题,使合并后的浏览主题与被合并的所有浏览主题所对应的浏览记录关联。按不同的浏览用户对浏览记录进行分类生成样本集合。较佳的,根据所述样本集合中浏览记录的间隔时间,进一步将一个样本集合划分为多个不同的样本集合。对样本集合进行相关性分析生成分类组合包括步骤:生成样本集合中每条浏览记录对应的特征向量;分析各特征向量与其他特征向量的相关性;根据所述相关性对特征向量进行分类生成分类组合。其中,对每条浏览记录进行分词处理,删除该浏览记录中无实际意义的词语并合并剩余词语中的同义词生成该浏览记录对应的特征向量。根据组成所述特征向量的各词在其特征向量中的权重计算各特征向量的相关性。根据分类组合中出现频率大于预定阈值的词语确定该分类组合的浏览主题。一种浏览器浏览记录的管理装置,包括:用于存储用户浏览记录的单元;用于对所述浏览记录进行分类生成样本集合的单元;用于对所述样本集合进行相关性分析生成相应的分类组合的单元;用于确定所述分类组合对应的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录的单元;以及用于根据用户查询时输入的关键词查找与该关键词匹配的浏览主题,并将查找到的与浏览主题关联的浏览记录呈现给用户的单元。较佳的,所述装置还包括:用于分析浏览主题之间的相关性,并将相关性大于预定阈值的浏览主题合并为同一个浏览主题,以及将合并后的浏览主题与被合并的所有浏览主题所对应的浏览记录关联的单元。本专利技术有益效果如下:本专利技术对用户浏览记录进行分类生成样本集合后,分别对各样本集合进行相关性分析生成相应的分类组合并确定出分类组合对应的浏览主题,以及将浏览主题关联到分类组合对应的浏览记录。采用本专利技术后,当用户需要从浏览记录中查询信息时,用户只需输入关键词,系统将自动查找与该关键词匹配的浏览主题,并将查找到的浏览主题所关联的浏览记录呈现给用户,不仅避免了用户手工查询信息时的繁琐操作,而且提高了查询效率。具体实施方式为了解决现有技术中,即时通讯用户在浏览记录中查询信息时,不仅操作繁琐,而且查询效率低的问题,本实施例中对用户浏览记录进行分类生成样本集合,分别对各样本集合进行相关性分析生成相应的分类组合并确定出分类组合对应的浏览主题,并将浏览主题关联到分类组合对应的浏览记录,以及根据用户输入的关键词查找与该关键词匹配的浏览主题,并将查找到的浏览主题所关联的浏览记录呈现给用户。本实施例中用户浏览记录的管理装置包括:存储单元、分类单元、分析单元、浏览主题单元、合并单元和查询单元。存储单元用于保存用户的浏览记录和浏览主题。分类单元用于获取浏览记录并对浏览记录进行分类得到样本集合。分析单元用于对样本集合进行相关性分析,生成样本集合的分类组合。浏览主题单元用于确定样本集合分类组合的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录。合并单元105用于分析浏览主题之间的相关性,并将相关性大于预定阈值的浏览主题合并为同一个浏览主题,以及将合并后的浏览主题关联到被合并的所有浏览主题对应的浏览记录。查询单元用于接收用户在浏览记录中查询信息时输入的关键词和查找与该关键词匹配的浏览主题,并将查找到的浏览主题所关联的浏览记录呈现给用户。本实施例中用户浏览记录管理方法,包括:步骤201、获取用户的浏览记录并对该浏览记录进行分类得到样本集合。步骤202、对生成的样本集合进行相关性分析生成相应的分类组合。步骤203、根据各分类组合中词语出现的频率确定分类组合对应的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录。步骤204、分析浏览主题之间的相关性,并将相关性大于预定阈值的浏览主题合并为同一个浏览主题,使合并后的浏览主题关联到被合并的所有浏览主题对应的浏览记录。步骤205、当用户在浏览记录中查询信息时,根据用户查询时输入的关键词查找与该关键词匹配的浏览主题,并将查找到的浏览主题所关联的浏览记录呈现给用户。在步骤201中,对浏览记录进行分类的处理过程如下:步骤301、判断浏览记录是否已经过分类处理,如果已经过分类处理,则不对其进行处理;否则,执行步骤302。步骤302、对没有经过分类处理的浏览记录根据不同的用户对浏览记录进行分类。步骤303、将同一样本集合根据该样本集合中的浏览记录的间隔时间进行划分,进一步划分为不同的样本集合,浏览记录的间隔时间根据实际应用,可设为一星期等。经过步骤303处理生成的样本集合TS为进行相关性分析的样本集合。通过计算,获得各特征向量间的相关系数,根据该相关系数,将与每一个特征向量最相关的K个特征向量分别组合为一个集合,K的取值可根据实际应用进行确定。步骤404、将各浏览记录对应的特征向量划分到分类C中的不同类中生成分类组合。分类C为样本集合TS中各浏览记录对应的特征向量组成的集合。方法一:当分类C为空时,则采用如下方式生成分类C中的一个向量集合c,然后将c添加到分类C中,对每个样本集本文档来自技高网...

【技术保护点】
一种浏览器浏览记录的管理方法,其特征在于,包括如下步骤:获取用户的浏览记录并对其进行分类得到样本集合;分别对各样本集合进行相关性分析生成相应的分类组合,该分类组合包含所述样本集合中浏览记录对应的特征向量;根据各分类组合中词语出现的频率确定分类组合对应的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录;以及根据用户查询时输入的关键词查找与该关键词匹配的浏览主题,并将查找到的与浏览主题关联的浏览记录呈现给用户。

【技术特征摘要】
1.一种浏览器浏览记录的管理方法,其特征在于,包括如下步骤:获取用户的浏览记录并对其进行分类得到样本集合;分别对各样本集合进行相关性分析生成相应的分类组合,该分类组合包含所述样本集合中浏览记录对应的特征向量;根据各分类组合中词语出现的频率确定分类组合对应的浏览主题,并使该浏览主题关联到分类组合对应的浏览记录;以及根据用户查询时输入的关键词查找与该关键词匹配的浏览主题,并将查找到的与浏览主题关联的浏览记录呈现给用户。2.如权利要求1所述的方法,其特征在于,生成浏览主题后进一步分析浏览主题之间的相关性,并将相关性大于预定阈值的浏览主题合并为同一个浏览主题,使合并后的浏览主题与被合并的所有浏览主题所对应的浏览记录关联。3.如权利要求1或2所述的方法,其特征在于,按不同的浏览用户对浏览记录进行分类生成样本集合。4.如权利要求3所述的方法,其特征在于,根据所述样本集合中浏览记录的间隔时间,进一步将一个样本集合划分为多个不同的样本集合。5.如权利要求1所述的方法,其特征在于,对样本集合进行相关性分析生成分类组合包括步骤:生成样本集合中每条浏览记录对应的特征向量;分析各特征向量与其他特征向量的相关性;根据...

【专利技术属性】
技术研发人员:庄爱芹
申请(专利权)人:庄爱芹
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1