个人信息获得、推定、商品的分类、检索方法及系统技术方案

技术编号:9667963 阅读:76 留言:0更新日期:2014-02-14 06:27
本发明专利技术公开了一种购买者的个人信息的获得方法,包括:获取该购买者的历史购买记录中对一商品的评论信息;采用一常用词词库并按照至少一个分类要素提取该评论信息中的常用词;采用一分类要素信息词库得到该常用词与每个分类要素一一对应的分类要素信息;将该分类要素信息记录入该个人信息中。本发明专利技术公开了一种购买者的个人信息的获得系统、购买者的个人信息的推定方法及系统、商品的分类方法及系统和商品的检索方法及系统。本发明专利技术的购买者的个人信息的来源多元化、不完全依赖于用户的提供,且商品分类方式多元化、能够根据不同的用户人群为用户提供更为快速、精准的检索结果。

【技术实现步骤摘要】
个人信息获得、推定、商品的分类、检索方法及系统
本专利技术涉及一种购买者的个人信息的获得方法及系统、购买者的个人信息的推定方法及系统、商品的分类方法及系统以及商品的检索方法及系统。
技术介绍
随着互联网时代的到来,中国的电子商务在最近几年获得了蓬勃的发展。快速膨胀的商品种类使得搜索在电子商务领域中扮演的愈来愈重要的角色。但是我们发现搜索过程中,用户往往不再满足于传统的按照价格、销量等排序。他们希望具有更大附加值的应用出现。对于某些种类的商品,不同人群会有各自的偏好。举个例子,同样一款手机,可能受男性欢迎但不一定受女性欢迎,反之亦然。调查显示,不同人群对于商品的需求差异较为迥异,在传统的按照销量、价格等分类检索的方式中,有些用户为了搜索适合其的商品,甚至需要浏览多张检索目录,操作繁琐,检索结果又不尽如人意,这为用户带来极大的困扰。为了更贴近不同用户的不同需求,使得不同需求的用户能快速检索到符合其需求的商品,需要一种新的商品分类方式,但同时,又不能牺牲商品的检索速度,即需要找到一种合理的商品的分类方式,在满足了不同用户的不同需求的同时,仍然要保证较快的检索速度和较为精准的检索结果。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中购买者的个人信息的来源单一、完全依赖于用户的提供、商品分类方式单一、无法根据不同的用户人群为用户提供更为快速、精准的检索结果的缺陷,提供一种购买者的个人信息的来源多元化、不完全依赖于用户的提供、商品分类方式多元化、能够根据不同的用户人群为用户提供更为快速、精准的检索结果的个人信息的获得方法及系统、购买者的个人信息的推定方法及系统、商品的分类方法及系统以及商品的检索方法及系统。本专利技术是通过下述技术方案来解决上述技术问题的:—种购买者的个人信息的获得方法,其特点在于,其包括以下步骤:步骤Sp1、获取该购买者的历史购买记录中对一商品的评论信息;步骤Sp2、采用一常用词词库并按照至少一个分类要素提取该评论信息中的常用词;步骤Sp3、采用一分类要素信息词库得到该常用词与每个分类要素一一对应的分类要素信息,该分类要素信息词库中记录常用词与分类要素信息之间的对应关系;步骤Sp4、将步骤Sp3中得到的该分类要素信息记录入该个人信息中。为了扩展购买者的个人信息的来源,不仅仅依赖于购买者对自身个人信息的录入,本专利技术还利用购买者对商品的评论信息来推定获得购买者的身份,例如用户偶尔也会在评价某个已购买商品时透露自己或商品使用者的信息,例如“我太太非常喜欢这款手表”,那么我们可以认为该用户是男性。实现时可以采用该常用词词库以及该分类要素信息词库,进行推理。举几个例子:如果出现“太太” “老婆” “妻子” “女朋友”,该用户判定为男性;如果出现“丈夫” “老公” “男朋友”,该用户判定为女性;如果出现“儿子” “女儿”,该用户判定为成年人。这样,就为获得个人信息提供了更多的方式,而不仅仅依赖于用户的信息录入。优选地,该分类要素选自:性别、职业、年龄、收入和居住地。本专利技术还提供一种购买者的个人信息的推定方法,其特点在于,其包括以下步骤:步骤Sq1、分别获取第一购买者的历史记录以及第二购买者的历史记录,该历史记录中包括历史购买记录和历史浏览记录,其中,该第一购买者的个人信息为已知的,该第一购买者的个人信息中包括与至少一个分类要素分类 对应的分类要素信息;步骤Sq2、将该第一购买者的历史记录和该第二购买者的历史记录相比较,获取该第一购买者的历史记录和该第二购买者的历史记录中相同类目的商品的数量;步骤Sq3、在该数量达到一数量阈值时将该第一购买者的分类要素信息记录入该第二购买者的个人信息中。除了上述的个人信息获得方法之外,还可以从个人信息既定的购买者的购物行为、浏览行为来推定购物行为、浏览行为确定但个人信息不定的购买者的个人信息。很多时候用户没有主动提供个人资料,显性的个人信息是非常有限的。本专利技术提供的方法通过用户行为来猜测、推定用户的个人信息,这种推定所得的个人信息也可称为隐性信息。即可以根据用户在网站上的浏览(或者购买)的行为,利用机器学习中的分类技术,将他们大致划分到不同人群。比如说一个用户经常购买女士化妆品和女士服装,我们就可以将该用户认作“女性”。当然这种划分只是根据其行为的假设,而不是对其真实身份的认定。这样,又进一步扩展了个人信息的来源。并且由于推定的整个过程是通过个人信息明确的用户及其行为,来推断未知用户的个人信息,因而推断结果具有较高的准确度。本专利技术还提供一种购买者的个人信息的推定方法,其特点在于,其包括以下步骤:步骤Sk1、分别获取第一购买者的历史记录以及第二购买者的历史记录,该历史记录中包括历史购买记录和历史浏览记录,其中,该第一购买者的个人信息为已知的,该第一购买者的个人信息中包括与至少一个分类要素分类一一对应的分类要素信息,该历史记录以向量空间的形式表达;步骤Sk2、采用向量余弦夹角的算法将该第一购买者的历史记录和该第二购买者的历史记录相比较,计算该第二购买者的分类要素信息与该第一购买者的分类要素信息相同的概率;步骤Sk3、在该概率达到一概率阈值时将该第一购买者的分类要素信息记录入该第二购买者的个人信息中。举例来说,推定过程中,首先收集真实用户(购买者)及其购买案例。例如若干名男性、女性、学生、白领和他们的所有购买记录。这些用户的个人信息都是已知的。接着,将所有用户行为数字化。不同模型可以有不同的表述,一种基本的实现是向量空间。假设一共有η中商品,一个用户的购买行为表达为U1=Lf1, f2, f3,...fn_1; fn]其中fn表示该用户购买第n种商品的次数。如果存在向量稀疏性问题(也就是说商品数非常大,很多fn的取值都是0),为了保证下一步的匹配度,这里也可以用商品类目,fn表示该用户购买第η种类目的次数将未知信息的用户和已知用户组里的每个用户匹配(一种基本实现是用向量余弦夹角)。最后求平均值,未知用户将已一定的概率划入已知用户的分组,打上同样的个人信息标签。对于用户U1,属于男性组(male)的概率计算如下:本文档来自技高网...

【技术保护点】
一种购买者的个人信息的获得方法,其特征在于,其包括以下步骤:步骤SP1、获取该购买者的历史购买记录中对一商品的评论信息;步骤SP2、采用一常用词词库并按照至少一个分类要素提取该评论信息中的常用词;步骤SP3、采用一分类要素信息词库得到该常用词与每个分类要素一一对应的分类要素信息,该分类要素信息词库中记录常用词与分类要素信息之间的对应关系;步骤SP4、将步骤SP3中得到的该分类要素信息记录入该个人信息中。

【技术特征摘要】
1.一种购买者的个人信息的获得方法,其特征在于,其包括以下步骤: 步骤Sp1、获取该购买者的历史购买记录中对一商品的评论信息; 步骤Sp2、采用一常用词词库并按照至少一个分类要素提取该评论信息中的常用词;步骤Sp3、采用一分类要素信息词库得到该常用词与每个分类要素一一对应的分类要素信息,该分类要素信息词库中记录常用词与分类要素信息之间的对应关系; 步骤Sp4、将步骤Sp3中得到的该分类要素信息记录入该个人信息中。2.如权利要求1所述的购买者的个人信息的获得方法,其特征在于,该分类要素选自:性别、职业、年龄、收入和居住地。3.一种购买者的个人信息的推定方法,其特征在于,其包括以下步骤: 步骤Sq1、分别获取第一购买者的历史记录以及第二购买者的历史记录,该历史记录中包括历史购买记录和历史浏览记录,其中,该第一购买者的个人信息为已知的,该第一购买者的个人信息中包括与至少一个分类要素分类对应的分类要素信息; 步骤Sq2、将该第一购买者的历史记录和该第二购买者的历史记录相比较,获取该第一购买者的历史记录和该第二购买者的历史记录中相同类目的商品的数量; 步骤Sq3、在该数量达到一数量阈值时将该第一购买者的分类要素信息记录入该第二购买者的个人信息中。4.一种购买者的个人信息的推定方法,其特征在于,其包括以下步骤: 步骤Sk1、分别获取第一购买者的历史记录以及第二购买者的历史记录,该历史记录中包括历史购买记录和历史浏览记录,其中,该第一购买者的个人信息为已知的,该第一购买者的个人信息中包括与至少一个分类要素分类一一对应的分类要素信息,该历史记录以向量空间的形式表达; 步骤Sk2、采用向量余弦夹角的算法将该第一购买者的历史记录和该第二购买者的历史记录相比较,计算该第二购买者的分类要素信息与该第一购买者的分类要素信息相同的概率; 步骤Sk3、在该概率达到一概率阈值时将该第一购买者的分类要素信息记录入该第二购买者的个人信息中。5.如权利要求3或4所述的购买者的个人信息的推定方法,其特征在于,该分类要素选自:性别、职业、年龄、收入和居住地。6.一种商品的分类方法,其特征在于,其包括以下步骤: 针对一商品数据库中的每件商品: 步骤S1、调取每件商品的历史购买记录; 步骤S2、提取该历史购买记录中的所有购买者的个人信息; 步骤S3、按照至少一个分类要素提取该个人信息中与每个分类要素一一对应的分类要素信息; 步骤S4、针对每个分类要素,计算从该个人信息中提取相同分类要素信息的数量,并且在该数量达到一阈值时将该商品与相同的数量达到该阈值的分类要素信息相关联以完成该商品按照该分类要素的分类。7.如权利要求6所述的商品的分类方法,其特征在于,该个人信息通过如权利要求1所述的购买者的个人信息的获得方法获得,和/或,该个人信息通过如权利要求3所述的购买者的个人信息的推定方法获得,和/或, 该个人信息通过如权利要求4所述的购买者的个人信息的推定方法获得。8.如权利要求6所述的商品的分类方法,其特征在于,该分类要素选自:性别、职业、年龄、收入和居住地。9.一种商品的检索方法,其特征在于,按照如权利要求6-8中任意一项所述的商品的分类方法将该商品数据库中的每件商品分类后,该商品的检索方法还包括以下步骤: 针对该商品数据库中的所有商品, 步骤S5、接收用户所选择的分类要素信息; 步骤S6、调取该商品数据库中所有与该分类要素信息相应的商品以显示给用户。10.一种购买者的个人信息的获得系统,其特征...

【专利技术属性】
技术研发人员:黄申韩军
申请(专利权)人:纽海信息技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1