【技术实现步骤摘要】
一种电商服务问题自动发现系统
本专利技术涉及一种电商服务问题自动发现系统,尤其涉及一种适用于对有关电商服务问题的文本进行分类统计、语义分析,并基于文本的情感倾向自动发现电商服务问题的系统
技术介绍
随着互联网的发展,电子商务发展迅速,2017年,全国网上零售额达到7.18万亿元人民币,同比增长32.2%,增速较上一年提高了6个百分点。与传统商务相比,电子商务具有交易虚拟化、交易成本低、交易效率高、交易透明化等特点,消费者可以在网络上发布关于电商服务质量的文本,但由于每个人的表述都有所不同,并且数据量太大,逐个阅读每个文本的所有内容将耗费大量时间。现有技术中,由于有关电商服务问题的文本数量太多,很难逐条读完,用户无法在短时间内了解电商服务中的问题,并且由于对于电商服务的问题发现存在滞后性,电商无法短时间内获取消费者对于电商服务的反馈信息,从而针对性的改进和提高服务质量。
技术实现思路
本专利技术提供一种电商服务问题自动发现系统,包括:特征词提取模块、文本分类模块、一级属性发现模块和二级属性提取模块;所述特征词提取模块,完成对文本中出现的有意义词的提取:对已经标记的典型文本进行分词并去除停用词之后,根据词语出现频次排序,得到特征词。所述文本分类模块,完成对单条文本的初步分类:利用逻辑回归分类器对有关电商服务问题的文本进行分类,分类结果分为物流、产品、售后、营销四类;所述一级属性发现模块,完成基于词性的电商服务问题一级属性关键词的确定,为二级属性的自动发现提供数据基础;所述二级属性提取模块,实现电商服务问题二级属性的自动发现;建立二级属性备选集合;基于情绪词典对二级 ...
【技术保护点】
1.一种电商服务问题自动发现系统,其特征在于包括:特征词提取模块、文本分类模块、一级属性发现模块和二级属性提取模块;所述特征词提取模块,完成对文本中出现的有意义词的提取:对已经标记的典型文本进行分词并去除停用词之后,根据词语出现频次排序,得到特征词。所述文本分类模块,完成对单条文本的初步分类:利用逻辑回归分类器对有关电商服务问题的文本进行分类,分类结果分为物流、产品、售后、营销四类;所述一级属性发现模块,完成基于词性的电商服务问题一级属性关键词的确定,为二级属性的自动发现提供数据基础;所述二级属性提取模块,实现电商服务问题二级属性的自动发现;建立二级属性备选集合;基于情绪词典对二级属性统计与排序,并进行统计。
【技术特征摘要】
1.一种电商服务问题自动发现系统,其特征在于包括:特征词提取模块、文本分类模块、一级属性发现模块和二级属性提取模块;所述特征词提取模块,完成对文本中出现的有意义词的提取:对已经标记的典型文本进行分词并去除停用词之后,根据词语出现频次排序,得到特征词。所述文本分类模块,完成对单条文本的初步分类:利用逻辑回归分类器对有关电商服务问题的文本进行分类,分类结果分为物流、产品、售后、营销四类;所述一级属性发现模块,完成基于词性的电商服务问题一级属性关键词的确定,为二级属性的自动发现提供数据基础;所述二级属性提取模块,实现电商服务问题二级属性的自动发现;建立二级属性备选集合;基于情绪词典对二级属性统计与排序,并进行统计。2.根据权利要求1所述的一种电商服务问题自动发现系统,其特征在于:所述特征词提取模块的具体实现过程为:步骤2a,对已标注的文本进行分词;步骤2b,去除其中的停用词;步骤2c,按词语出现频次统计得到所有的特征词。3.根据权利要求1所述的一种电商服务问题自动发现系统,其特征在于:所述文本分类模块中使用所述逻辑回归分类器对有关电商服务问题的文本进行分类的具体实现过程为:步骤3a,手工标记部分典型的文本,作为该文本的类别标注;步骤3b,将特征词提取模块得到的特征词,作为特征集;步骤3c,从电商网站的商品评论获取的有关电商服务问题的文本数据中去掉重复和无效的数据,作为训练数据;步骤3d,利用特征集将已标注的数据、训练数据转为向量,并以此训练逻辑回归分类器;步骤3e,使用所训练的逻辑回归分类器对文本进行分类。4.根据权利要求3所述的一种电商服务问题自动发现系统,其特征在于:所述基于词性的一级属性发现模块中基于词性的问题一级属性关键词确定,具体实现为:对不同类别相关文本进行分词处理,所述类别包括物流、产品、售后、营销,过滤停用词,筛选其中词性为名词的词语,统计频次并按照降序排序,作为关键词集合,由此得到不同类别商品问题的一级属性及其对应关键词。5.根据权利要求4所述的一种电商服务问题自动发现系统,其特征在于:所述二级属性提取模块中二级属性备选集合的建立,具体实现为:步骤5a,将文本分类模块获得的不同类别相关文本下属的一级属性关键词作为二级属性备选集合建立模块的输入;步骤5b,将所输入的一级属性关键词所对应的文本类别进行分词处理,并过滤停用词,每条文本生成一个分词列表;步骤5c,使用滑动窗口方法,取窗口长度为2,遍历步...
【专利技术属性】
技术研发人员:赵吉昌,王珊珊,孙孟晗,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。