【技术实现步骤摘要】
产品问题的识别方法及系统
本申请涉及机器学习领域,尤其涉及一种应用机器学习解决客服中产品问题的识别的方法及系统。
技术介绍
随着互联网技术的发展,服务商可以为用户提供多种产品应用。一站式服务可以给用户提供便利,因而,服务商通常将多种产品应用整合在一个服务平台上完成服务以提供良好的用户体验。当用户在使用产品应用的发生问题的时候,可以通过服务平台提供的客服端口进行咨询、投诉等。在实现现有技术过程中,专利技术人发现现有技术中至少存在如下问题:随着服务平台上整合的产品应用的数量的增加,势必要维持越来越大的客服团队来解决产品应用使用过程中产生的客诉。客服人员通常可以给予解决特定问题针对性的指导,也可以提供产品应用的质量反馈。然而,除非将客服团队收集到的所有信息汇总分析,否则,难以发现服务平台整合的各产品应用的问题的轻重缓急。而且,客服团队反馈的产品应用问题的过程中可能存在信息流失的问题。因此,需要提供一种智能化的产品问题的识别方法及系统以解决产品问题的识别占用资源大、识别效率低、准确性差的技术问题。
技术实现思路
本申请实施例提供一种占用资源小、识别效率高、准确性好的产品问题的 ...
【技术保护点】
一种产品问题的识别方法,其特征在于,包括:导入文档集合,所述文档集合包含对产品存在问题的描述;切分文档集合形成若干切分词;划分切分词为产品词和问题词,所述问题词为对产品存在的问题进行描述的词;建立产品词和问题词之间多对多的映射关系,拼接产品词和问题词生成包含产品词和问题词的主题。
【技术特征摘要】
1.一种产品问题的识别方法,其特征在于,包括:导入文档集合,所述文档集合包含对产品存在问题的描述;切分文档集合形成若干切分词;划分切分词为产品词和问题词,所述问题词为对产品存在的问题进行描述的词;建立产品词和问题词之间多对多的映射关系,拼接产品词和问题词生成包含产品词和问题词的主题。2.如权利要求1所述的方法,其特征在于,切分文档集合形成若干切分词,具体包括:根据分词模板,切分文档集合中的字符串为若干切分词。3.如权利要求1所述的方法,其特征在于,在切分文档集合形成若干切分词之前,所述方法还包括:对文档集合进行排除自动回复字符串、网页标签字符串,或后缀字符串的预处理。4.如权利要求1所述的方法,其特征在于,在切分文档集合形成若干切分词之前,所述方法还包括:对文档集合进行排除停用词的预处理。5.如权利要求1所述的方法,其特征在于,所述方法还包括:提供预设产品词,将产品词之外的切分词归类为问题词。6.如权利要求1所述的方法,其特征在于,建立产品词和问题词之间多对多的映射关系,拼接产品词和问题词生成包含产品词和问题词的主题,具体包括:建立第一概率正比于第二概率的模型,所述第一概率为文档集合出现切分词的概率,所述第二概率为文档集合出现主题概率、主题出现产品词概率、主题出现问题词概率的乘积;求解使得第二概率最大的模型参数;根据获得的模型参数,计算得到文档集合出现主题概率、主题出现产品词概率、主题出现问题词概率;拼接产品词和问题词,生成产品词与问题词共同出现的概率描述。7.如权利要求6所述的方法,其特征在于,所述方法还包括:建立第一概率正比于第二概率的模型具体如下:其中,P(zi=k|z-i,wp,wq)表示文档集合出现切分词的概率;表示主题中出现问题词的概率;表示主题中出现产品词的概率;表示文档集合中出现主题的概率。8.如权利要求7所述的方法,其特征在于,求解使得第二概率最大的模型参数,具体包括:采用吉布斯采样方法,根据P(zi=k|z-i,wp,wq)的最大似然估计,估计出模型中的参数αk和βt,其中,αk是文档中出现主题的先验狄利克雷参数,βt是主题中出现切分词的先验狄利克雷参数。9.一种产品问题...
【专利技术属性】
技术研发人员:周扬,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。