基于物品间相似度的物品处理方法、系统和装置制造方法及图纸

技术编号:10335048 阅读:207 留言:0更新日期:2014-08-20 19:03
本发明专利技术公开了一种基于物品间相似度的物品处理方法、系统和装置,所述方法包括:根据物品处理指令所涉及的物品的名称,查找物品间相似度列表中以该物品的名称为索引的相似度记录,根据查找到的相似度记录进行物品处理;其中,物品间相似度列表的更新包括:对于新增物品,从以特征为索引的特征列表中查找出与新增物品的特征相同的特征后,确定查找出的特征所对应的原有物品的名称;在物品间相似度列表中、以原有物品的名称为索引的相似度记录中,存储原有物品与新增物品间的相似度;在物品间相似度列表中创建以新增物品的名称为索引的相似度记录,存储新增物品与原有物品间的相似度;从而加快相似度更新和物品处理的速度。

【技术实现步骤摘要】
基于物品间相似度的物品处理方法、系统和装置
本专利技术涉及计算机领域,尤其涉及一种基于物品间相似度的物品处理方法、系统和装置。
技术介绍
随着互联网技术迅猛发展,网上信息爆炸式增长,基于特征向量的相似度计算已广泛应用于多个领域。例如,在物品推荐系统中,可将待推荐物品等以特征向量的方式表示,通过计算各待推荐物品的特征向量之间的相似度,建立相似度数据模型;这样,物品推荐系统可根据用户的需求、兴趣等,将用户感兴趣的物品推荐给用户,从而避免信息超载给用户带来的不便。再如,在垃圾邮件过滤系统中,将电子邮件的邮件数据以特征向量表示,通过计算各电子邮件的特征向量之间的相似度,对电子邮件进行分类,以便于垃圾邮件过滤规则的挖掘。为便于描述,在本文中将物品推荐系统中的待推荐物品、垃圾邮件过滤系统中的电子邮件等统称为物品。在实际应用中,随着物品推荐系统、垃圾邮件过滤系统的不断运行,这些系统中的物品的数量将越来越多。现有技术中当有新增物品时,提取新增物品的特征,进而得到新增物品的特征向量后,分别计算新增物品的特征向量与之前的所有原有物品的特征向量之间的相似度,从而得到当前的全部物品的特征向量间的相似度;从而本文档来自技高网...
基于物品间相似度的物品处理方法、系统和装置

【技术保护点】
一种基于物品间相似度的物品处理方法,其特征在于,包括:在接收到物品处理指令后,根据所述物品处理指令所涉及的物品的名称,查找物品间相似度列表中以该物品的名称为索引的相似度记录,并根据查找到的相似度记录进行物品处理;其中,所述物品间相似度列表是以如下方法进行更新的:对于新增物品,在提取其特征后,根据提取的特征确定所述新增物品的特征向量;从以特征为索引的特征列表中查找出与所述新增物品的特征相同的特征后,进一步从所述特征列表中确定查找出的特征所对应的原有物品的名称;对于确定出的每个原有物品的名称,在所述物品间相似度列表中的、以该原有物品的名称为索引的相似度记录中,存储该原有物品的特征向量与所述新增物品...

【技术特征摘要】
1.一种基于物品间相似度的物品处理方法,其特征在于,包括:在接收到物品处理指令后,根据所述物品处理指令所涉及的物品的名称,查找物品间相似度列表中以该物品的名称为索引的相似度记录,并根据查找到的相似度记录进行物品推荐或物品分类;其中,所述物品间相似度列表是以如下方法进行更新的:对于新增物品,在提取其特征后,根据提取的特征确定所述新增物品的特征向量;从以特征为索引的特征列表中查找出与所述新增物品的特征相同的特征后,进一步从所述特征列表中确定查找出的特征所对应的原有物品的名称;对于确定出的每个原有物品的名称,在所述物品间相似度列表中的、以该原有物品的名称为索引的相似度记录中,存储该原有物品的特征向量与所述新增物品的特征向量间的相似度;并在所述物品间相似度列表中,创建以所述新增物品的名称为索引的一条相似度记录,并在该相似度记录中存储所述新增物品的特征向量与各确定出的原有物品的特征向量间的相似度。2.如权利要求1所述的方法,其特征在于,在所述确定所述新增物品的特征向量后,还包括:对于所述新增物品的每个特征,将该特征与所述特征列表中存储的特征进行比对,若该特征不存在于所述特征列表中,则在所述特征列表中创建以该特征为索引的特征记录后,在该特征记录中存储所述新增物品的名称;以及所述从以特征为索引的特征列表中查找出与所述新增物品的特征相同的特征后,还包括:对于查找出的每个特征,在以该特征为索引的特征记录中存储所述新增物品的名称。3.如权利要求2所述的方法,其特征在于,所述物品间相似度列表和所述特征列表是预先创建的:对于预先得到的若干原有物品中的每个原有物品,提取该原有物品的特征后,确定出该原有物品的特征向量;将各原有物品的特征组成特征集合后,创建所述特征列表;并对于所述特征集合中的每个特征,在所述特征列表中创建一条以该特征为索引的特征记录,将具有该特征的原有物品的名称存储到该特征记录中;对于所述特征列表中记录的每个特征,将以该特征为索引的特征记录中所涉及的任意两个原有物品确定为一对原有物品对,计算出该对原有物品的特征向量间的相似度;创建所述物品间相似度列表后,对于每个原有物品,在所述物品间相似度列表中创建以该原有物品的名称为索引的相似度记录,并在该相似度记录中存储计算出的该原有物品的特征向量与其它原有物品的特征向量间的相似度。4.如权利要求1-3任一所述的方法,其特征在于,所述物品处理指令具体为物品推荐指令;以及所述根据查找到的相似度记录进行物品处理,具体为:根据查找到的相似度记录中所涉及的物品进行物品推荐。5.如权利要求1-3任一所述的方法,其特征在于,在所述创建以所述新增物品的名称为索引的一条相似度记录,并在该相似度记录中存储所述新增物品的特征向量与各确定出的原有物品的特征向量间的相似度后,还包括:根据所述新增物品所对应的相似度记录中所涉及的各物品的类别属性,确定出所述新增物品的类别属性后,在该相似度记录中进行存储;以及所述物品处理指令具体为物品类别请求指令;以及所述根据查找到的相似度记录进行物品处理,具体为:根据查找到的相似度记录中存储的、该物品类别请求指令所涉及的物品的类别属性,进行所述物品类别请求的响应。6.一种物品间相似度的更新方法,其特征在于,包括:对于新增物品,在提取其特征后,根据提取的特征确定所述新增物品的特征向量;从以特征为索引的特征列表中查找出与所述新增物品的特征相同的特征后,进一步从中确定查找出的特征所对应的原有物品的名称后,对以物品的名称为索引的物品间相似度列表进行更新:对于确定出的每个原有物品的名称,在所述物品间相似度...

【专利技术属性】
技术研发人员:刘洋
申请(专利权)人:新浪网技术中国有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1