【技术实现步骤摘要】
本专利技术涉及互联网信息处理领域,特别是涉及一种针对客户端用户群进行聚类的方法和系统,以及一种基于上述聚类结果向用户提供个性化信息服务的方法和系统。
技术介绍
向用户提供各种个性化的信息服务是互联网信息技术发展的下一个方向,例如,个性化搜索,相关信息的个性化发布(例如,新闻信息、娱乐信息、广告信息)等。但是,为了实现个性化信息服务的提供,就必须大量的收集用户的个性信息,并加以分析处理,找出该用户的类别信息,进而针对该用户提供相应类别的个性化信息服务。然而,在传统实现的众多技术中,由于方法和资源限制,对于用户个性信息的收集,存在着获取信息不准确、不完备的问题,这样使得后续进行的用户群体分析结果偏差较大。例如,一般用于收集用户个性信息的数据源包括以下三种:(1)用户的搜索历史记录用户的搜索历史记录,可以包括:所使用过的查询词记录、选取点击过的搜索结果、被点击文档的内容以及分类信息等等。但是这些信息都存在着不能准确描述用户个人兴趣,进而无法准确识别用户类别的问题。原因如下:首先,一般用户搜索的目的,往往是为了发现一个问题的正确答案或者寻找一些事物的相关信息;而这种未知 ...
【技术保护点】
一种针对客户端用户群进行聚类的方法,其特征在于,包括: 收集多个输入法客户端用户的用户词库,并记录用户与其用户词库的对应关系;所述用户词库包括词及词频; 针对各用户的用户词库,计算得到该用户的特征参数; 计算各用户特征参数之间的相似度,完成对各个用户的聚类。
【技术特征摘要】
1、一种针对客户端用户群进行聚类的方法,其特征在于,包括:收集多个输入法客户端用户的用户词库,并记录用户与其用户词库的对应关系;所述用户词库包括词及词频;针对各用户的用户词库,计算得到该用户的特征参数;计算各用户特征参数之间的相似度,完成对各个用户的聚类。2、如权利要求1所述的方法,其特征在于,所述用户词库还包括:应用软件及其使用信息;和/或,表征字词之间关联关系的二元或者N元信息;和/或,用户注册信息;和/或,依据输入历史记录分析得到的用户隐性属性信息;和/或,依据用户注册信息分析得到的用户隐性属性信息。3、如权利要求1所述的方法,其特征在于,所述用户特征参数的计算过程进一步包括:针对用户词库进行预处理的步骤。4、如权利要求3所述的方法,其特征在于,所述预处理步骤包括:直接针对用户词库中的信息进行处理得到所需的用户属性信息;或者,从输入法客户端获得其他信息,与用户词库一起进行处理得到所需用户属性信息。5、一种针对客户端用户群进行聚类的系统,其特征在于,包括:词库存储模块,用于汇集多个输入法客户端用户的用户词库,并记录用户与其用户词库的对应关系;所述用户词库包括词及词频;特征参数计算模块,用于针对各用户的用户词库,计算得到该用户的特征参数;聚类模块,用于计算各用户特征参数之间的相似度,完成对各个用户的聚类。6、如权利要求5所述的系统,其特征在于,所述用户词库还包括:应用软件及其使用信息;和/或,表征字词之间关联关系的二元或者N元信息;和/或,用户注册信息;和/或,依据输入历史记录分析得到的用户隐性属性信息;和/或,依据用户注册信息分析得到的用户隐性属性信息。7、如权利要求5所述的系统,其特征在于,所述特征参数计算模块进一步包括预处理子模块,用于针对用户词库进行预处理。8、如权利要求7所述的系统,其特征在于,所述预处理过程包括:直接针对用户词库中的信息进行处理得到所需的用户属性信息;或者,从输入法客户端获得其他信息,与用户词库一起进行处理得到所需用户属性信息。9、一种针对客户端用户群提供个性化信息服务的方法,其特征在于,包括:收集多个输入法客户端用户的用户词库,并记录用户与其用户词库的对应关系;所述用户词库包括词及词频;针对各用户的用户词库,计算得到该用户的特征参数;计算各用户特征参数之间的相似度,完成对各个用户的聚类并记录;依据一用户的类别信息,向该用户提供个性化信息服务。10、如权利要求9所述的方法,其特征在于,所述用户词库还包括:应用软件及其使用信息;和/或,表征字词之间关联关系的二元或者N元信息;和/或,用户注册信息;和/或,依据输入历史记录分析得到的用户隐性属性信息;和/或,依据用户注册信息分析得到的用户隐性属性信息。11、如权利要求9所述的方法,其特征在于,所述用户特征参数的计算过程进一步包括:针对用户词库进行预处理的步骤。12、如权利要求11所述的方法,其特征在于,所述预处理步骤包括:直接针对用户词库中的信息进行处理得到所需的用户属性信息;或者,从输入法客户端获得其他信息,与用户词库一起进行处理得到所需用户属性信息。13、如权利要求9所述的方法,其特征在于,所述个性化信息服务包括...
【专利技术属性】
技术研发人员:苏雪峰,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。