基于二元切词和支持向量机的商品自动分类方法技术

技术编号:9143291 阅读:380 留言:4更新日期:2013-09-12 04:50
本发明专利技术公开了一种基于二元切词和支持向量机的商品自动分类方法,该方法主要包括:对于训练集合中的所有商品标题进行二元切词处理构造特征词库;构造商品分类集合,同时根据所述特征词库将商品标题表示为特定向量,由该特定向量和商品所属分类生成训练数据,针对该训练数据采用序贯对偶方法进行参数优化得到最佳分类向量;计算所述最佳分类向量与待分类商品的标题所表示的特定向量的内积,挑选最大内积结果对应的分类作为该商品所属的分类。本发明专利技术以解决现有技术中难以构建产品特征信息库以及由于特征空间构造而导致商品自动分类方法训练时间长且效果不理想的问题。

【技术实现步骤摘要】

【技术保护点】
一种基于二元切词和支持向量机的商品自动分类方法,其特征在于,包括:对于训练集合中的所有商品标题进行二元切词处理构造特征词库;构造商品分类集合,同时根据所述特征词库将商品标题表示为特定向量,由该特定向量和商品所属分类生成训练数据,针对该训练数据采用序贯对偶方法进行参数优化得到最佳分类向量;计算所述最佳分类向量与待分类商品的标题所表示的特定向量的内积,挑选最大内积结果对应的分类作为该商品所属的分类。

【技术特征摘要】

【专利技术属性】
技术研发人员:许大伦毛颖张立群
申请(专利权)人:北京尚友通达信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有4条评论
  • 来自[上海市图像数据通信有限公司] 2017年10月16日 20:02
    66666
    2
  • 来自[中国移动] 2017年10月16日 20:00
    six six six
    0
  • 来自[上海市图像数据通信有限公司] 2017年10月16日 19:43
    就是很66
    3316
  • 来自[上海市图像数据通信有限公司] 2017年10月16日 19:41
    666
    3
1