【技术实现步骤摘要】
一种基于社交电商公开文本信息的商品细粒度分类方法
本专利技术涉及电商数据处理
,具体涉及一种基于社交电商公开文本信息的商品细粒度分类方法。
技术介绍
移动互联网的快速发展使得社交电商这一零售群体逐步走向大众的视野。社交电商相比于传统电商缺乏有力的平台管理和商品描述上的约束,这使得服务提供商对他们的客户缺乏系统性了解,当中就包括社交电商售卖商品所属的类别。目前,多数电子商务平台采用手动分类的方式按照商品属性进行分类。这种方式存在人力成本过高、标准难以统一等诸多弊端。如果采用人工智能算法对社交电商公开文本进行自动分类,则会存在商品细粒度类别过多,难以完成文本分类模型所需规模的数据收集工作。
技术实现思路
鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种基于社交电商公开文本的商品细粒度分类处理方法,可以实现在相对较少的数据集条件下对商品进行细粒度的自动分类。为实现以上目的,本专利技术采用如下技术方案:一种基于社交电商公开文本信息的商品细粒度分类方法,包括以下步骤:步 ...
【技术保护点】
1.一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,包括以下步骤:/n步骤S1:从数据库读取社交电商对于商品的公开描述文本信息,根据商品属性建立一级目录标签,并根据标签的不同将文本信息分成若干类数据集;/n步骤S2:对社交电商公开文本进行词性标注,参照一级目录标签,选择商品公开描述文本中与一级目录标签为被包含关系的名称性词语作为其二级目录标签;/n步骤S3:根据文本在上述一级目录标签中的分类结果调用该一级目录下的二级目录标签数据,并检索该名词性词语与二级目录中相同的标签数据,得到文本所属细粒度类别。/n
【技术特征摘要】
1.一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,包括以下步骤:
步骤S1:从数据库读取社交电商对于商品的公开描述文本信息,根据商品属性建立一级目录标签,并根据标签的不同将文本信息分成若干类数据集;
步骤S2:对社交电商公开文本进行词性标注,参照一级目录标签,选择商品公开描述文本中与一级目录标签为被包含关系的名称性词语作为其二级目录标签;
步骤S3:根据文本在上述一级目录标签中的分类结果调用该一级目录下的二级目录标签数据,并检索该名词性词语与二级目录中相同的标签数据,得到文本所属细粒度类别。
2.根据权利要求1所述的一种基于社交电商公开文本信息的商品细粒度分类方法,其特征在于,在S1中,所述的商标属性参照已公开的购物网站的一级目录分类。
<...
【专利技术属性】
技术研发人员:陈轶,张文,崔浩亮,牛少彰,王让定,
申请(专利权)人:东南数字经济发展研究院,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。