一种使用机器学习提升技术支持效率的系统技术方案

技术编号：18783816 阅读：52 留言：0更新日期：2018-08-29 06:58

一种使用机器学习提升技术支持效率的系统，包括数据预处理模块，分类模块、相似度计算模块、专家系统判断模块、分配模块；数据预处理模块包括数据提取单元、新词分配单元和分词单元，相似度计算模块包括第二向量化单元、LDA单元和相似度计算单元，专家系统判断模块包括关键词匹配单元、业务系统查询单元和规则判断单元。本发明专利技术使用专家系统判断模块结合分类器、使用监督机器学习，让机器学习和业务专家规则很好融合，确保准确率；新词模块能确保在不同的垂直领域也能工作良好，能够逐渐提升准确率，提升效率，极大降低了客服对经验的要求。

全部详细技术资料下载

【技术实现步骤摘要】
一种使用机器学习提升技术支持效率的系统
本专利技术属于软件设计
，设计一种使用机器学习来提升技术支持效率的系统。
技术介绍
当客服无法解决用户的问题时，会求助于技术支持人员来帮助处理。现有的公司，会把这些工作放在一个技术支持系统中(比如：jira系统)，由客服和技术支持人员来协调处理。这一般需要客服有经验，或者能够去自行查找FAQ系统，根据FAQ的提示去找相关人员，或是找一些对技术有了解的技术人员来帮助客服正确的去找到正确的技术人员。这就对客服或者协助帮忙的技术人员的经验水平提出了很高的要求。虽然有系统作为载体，但由于问题种类很多，情况复杂，协助有困难，人工查找有时会很慢，对于紧急问题或者大量爆发时问题，忙不过来，处理效率低下。
技术实现思路
为解决上述问题，本专利技术公开了一种使用机器学习提升技术支持效率的系统。为了达到上述目的，本专利技术提供如下技术方案：一种使用机器学习提升技术支持效率的系统，包括：数据预处理模块，分类模块、相似度计算模块、专家系统判断模块、分配模块；所述数据预处理模块包括数据提取单元、新词分配单元和分词单元；所述数据提取单元用于采集历史数据，并过滤历史数据中的无效数据；所述新词分配单元用于在用户问题数据中寻找新词；分词单元用于对用户的信息进行分词；所述分类模块包括第一向量化单元和分类器；所述第一向量化单元用于对用户的问题进行向量化，将不同长度的语句，转换成统一维度的向量；所述分类器首先基于用户问题和技术人员进行分类，对准确度不满足要求的进行二次分类；二次分类根据前述一次分类的结果，将实际分类结果y与历史数据中确定的类别Y的对应关系...

【技术保护点】
1.一种使用机器学习提升技术支持效率的系统，其特征在于，包括：数据预处理模块，分类模块、相似度计算模块、专家系统判断模块、分配模块；所述数据预处理模块包括数据提取单元、新词分配单元和分词单元；所述数据提取单元用于采集历史数据，并过滤历史数据中的无效数据；所述新词分配单元用于在用户问题数据中寻找新词；分词单元用于对用户的信息进行分词；所述分类模块包括第一向量化单元和分类器；所述第一向量化单元用于对用户的问题进行向量化，将不同长度的语句，转换成统一维度的向量；所述分类器首先基于用户问题和技术人员进行分类，对准确度不满足要求的进行二次分类；二次分类根据前述一次分类的结果，将实际分类结果y与历史数据中确定的类别Y的对应关系，使用有向图进行记录，y指向Y；再使用社区发现算法计算哪些分类的关系比较近，根据结果，将Y中相应部分标记新的分组G；所述相似度计算模块包括第二向量化单元、LDA单元和相似度计算单元；所述第二向量化单元使用与第一向量化单元不同的方法将用户的问题转化成统一维度向量；所述LDA单元将第二向量化单元的输出统一维度向量，放入LDA主题模型中进行机器学习；所述相似度计算单元使用genis...

【技术特征摘要】
1.一种使用机器学习提升技术支持效率的系统，其特征在于，包括：数据预处理模块，分类模块、相似度计算模块、专家系统判断模块、分配模块；所述数据预处理模块包括数据提取单元、新词分配单元和分词单元；所述数据提取单元用于采集历史数据，并过滤历史数据中的无效数据；所述新词分配单元用于在用户问题数据中寻找新词；分词单元用于对用户的信息进行分词；所述分类模块包括第一向量化单元和分类器；所述第一向量化单元用于对用户的问题进行向量化，将不同长度的语句，转换成统一维度的向量；所述分类器首先基于用户问题和技术人员进行分类，对准确度不满足要求的进行二次分类；二次分类根据前述一次分类的结果，将实际分类结果y与历史数据中确定的类别Y的对应关系，使用有向图进行记录，y指向Y；再使用社区发现算法计算哪些分类的关系比较近，根据结果，将Y中相应部分标记新的分组G；所述相似度计算模块包括第二向量化单元、LDA单元和相似度计算单元；所述第二向量化单元使用与第一向量化单元不同的方法将用户的问题转化成统一维度向量；所述LDA单元将第二向量化单元的输出统一维度向量，放入LDA主题模型中进行机器学习；所述相似度计算单元使用genismsimilariry计算，采用余弦相似性标准计算新问题与历史问题的相似度；专家系统判断模块包括关键词匹配单元、业务系统查询单元和规则判断单元；关键词匹配单元用于对用户信息再次进行有效提取，首先使用正则办法，提取连续的数字，然后使用NLP提取人名，接着由业务专家根据分类器模块提到的Y与G的对应关系，分析出来的一些有分类价值的词，进行提取；使用NLP从历史数据提取谓词，判断出主体；业务系统查询单元根据关键词匹配出来的结果，进行业务确认；规则判断单元用于将获取得到的更多的分类信息，生成一个多维数据，进行规则判断；分配模块用于根据相似度计算模块的计算结果，专家系统判断模块以及分类器的结果，抉择合理分类。2.根据权利要求1所述的使用机器学习提升技术支持效率的系统，其特征在于，分配模块判断过程包括：X为待分配的用户信息，当X被最终分配后，将K记作此次分配的可能性数值，并通过以下步骤进行判断：1，...

【专利技术属性】
技术研发人员：胡小敏，
申请(专利权)人：南京途牛科技有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人