基于文本挖掘技术的投诉责任认定系统技术方案

技术编号:20484864 阅读:36 留言:0更新日期:2019-03-02 18:58
本发明专利技术公开了一种基于文本挖掘技术的投诉责任认定系统,包括数据层、平台层、中间件、服务层和业务层;数据层包括关系型数据库、分布式文件系统、非关系型数据库,数据层定期从国网总部的95598业务支持系统和营销业务应用系统中的抽取数据,并将数据分类存储;平台层包括公共业务组件、业务组件、业务流引擎组件以及Spark;中间件包括Zookeeper、图像识别算法插件、决策树算法插件,图像识别算法插件、决策树算法插件对数据层的数据进行计算,并通过数据建模和数据挖掘等方式进行建模,实现数据的分析和挖掘;服务层包括统一编码服务、统一缓存服务、竞价模型计算服务、流程服务、文件存储服务;业务层包括责任认定、图像识别和工单自动生成。

【技术实现步骤摘要】
基于文本挖掘技术的投诉责任认定系统
本专利技术涉及一种基于文本挖掘技术的投诉责任认定系统。
技术介绍
公司在总部层面集中建设了全国范围大规模集约化的客服中心,在全网统一服务标准,重塑客户服务新体系,全面优化了服务资源,构建了纵向贯通、横向融合的高效协同机制,全力打通了客户服务“最后一公里”。为有效发挥客户服务监控作用,层层传递工作压力,提高各层级对服务的重视程度,促进公司服务水平快速提升,需要对客户投诉工单进行闭环管理,明确投诉责任主体。目前95598投诉责任认定主要走线下流程,依靠电话、OA传递信息和资料,工作人员用表格手工记录结果,容易出现信息遗漏、数据丢失、工作超时等问题,查看历史轨迹和进行报表统计也存在困难,不利于责任认定工作高效、规范管理。
技术实现思路
本专利技术要解决的技术问题是提供一种可自动生成责任认定工单的基于文本挖掘技术的投诉责任认定系统。为解决上述技术问题,本专利技术包括数据层、平台层、中间件、服务层和业务层;所述数据层包括关系型数据库、分布式文件系统、非关系型数据库,所述数据层定期从国网总部的95598业务支持系统和营销业务应用系统中的抽取数据,并将数据分类存储在本文档来自技高网...

【技术保护点】
1.一种基于文本挖掘技术的投诉责任认定系统,其特征在于:其包括数据层、平台层、中间件、服务层和业务层;所述数据层包括关系型数据库、分布式文件系统、非关系型数据库,所述数据层定期从国网总部的95598业务支持系统和营销业务应用系统中的抽取数据,并将数据分类存储在关系型数据库、分布式文件系统、非关系型数据库,通过图像识别技术、决策树处理技术对数据进行计算,并通过数据建模和数据挖掘等方式进行建模,实现数据的分析和挖掘,支撑系统中的责任认定功能模块的应用;所述平台层包括营销开发平台中的公共业务组件、业务组件、业务流引擎组件以及Spark;所述中间件包括Zookeeper、图像识别算法插件、决策树算法插...

【技术特征摘要】
1.一种基于文本挖掘技术的投诉责任认定系统,其特征在于:其包括数据层、平台层、中间件、服务层和业务层;所述数据层包括关系型数据库、分布式文件系统、非关系型数据库,所述数据层定期从国网总部的95598业务支持系统和营销业务应用系统中的抽取数据,并将数据分类存储在关系型数据库、分布式文件系统、非关系型数据库,通过图像识别技术、决策树处理技术对数据进行计算,并通过数据建模和数据挖掘等方式进行建模,实现数据的分析和挖掘,支撑系统中的责任认定功能模块的应用;所述平台层包括营销开发平台中的公共业务组件、业务组件、业务流引擎组件以及Spark;所述中间件包括Zookeeper、图像识别算法插件、决策树算法插件;所述服务层包括统一编码服务、统一缓存服务、竞价模型计算服务、流程服务、文件存储服务;所述业务层包括责任认定、图像识别和工单自动生成。2.根据权利要求1所述的基于文本挖掘技术的投诉责任认定系统,其特征是所述公共业务组件包括统一编码、统一缓存、统一验证规则、插件通信模式、基于Rest的RPC。3.根据权利要求1所述的基于文本挖掘技术的投诉责任认定系统,其特征是所述图像识别技术采用BRISK图像识别算法,用检测随机响应建立描述子,生成的二进制描述子。4.根据权利要求3所述的基于文本挖掘技术的投诉责任认定系统,其特征是所述BRISK图像识别算法通过以下步骤实现:(1)尺度空间特征点检测:图像和尺度维度都是通过使用一个显著性的标准来识别感兴趣特征点。为了提高计算效率,在图像金字塔的层与层的中间检测特征点。通过在连续区域拟合二次函数来获得每个关键点的位置和尺度;(2)关键点检测:由点组成的样本模式位于比例合适的同心圆上,在每一个关键点的相邻位置使用该圆来检测灰度值:就处理的强度梯度,决定了特征描述的方向;BRISK二进制描述子都是由二进制串通过向间接简单的亮度比较测试的结果组成。BRISK确定了每个特征点的特征方向以便得到方向均衡化的描述子;①BRISK描述的关键是利用像素采集关键点相邻位置所使用的模式。以关键点为中心,在其周围采集N个特征点的圆,定义多个相等局部圆形区域。②对在模式中的采样点Pi应用了高斯平滑方法,标准差δi正比于每个采样点对应于各自中心的距离,定位和扩展模式在图像中相应地为关键点k模式化,考虑一个N(N-1)/2个采样点对,用集合(Pi,Pj)表示。③这些点的平滑像素值分别为I(Pi,σi)和I(Pj,σj),用于估计局部梯度值g(Pi,Pj)的公式为:④所有组合方式的集合称作采样点对,用集合表示为:⑤定义短距离点对子集S、长距离点对子集L(L个)为:⑥特征点k的主方向计算如下:α=arctan2(gy,gx)(3)面向BRISK的采样模式用于获得成对的亮度对比结果,将结果组合成二进制BRISK描述子;①使用关键点k周围的抽样点旋转α=ARCTAN2(gy,gx)角度作为模式;②BIRSK的描述子也是一个包含512个比特位的向量,每个描述子由短距离点对(Pαi,Pαj)∈S两两进行比较产生的,上标alpha表示旋转的模式。每一位b对应:③匹配两个BRISK描述符是简单的计算他们在BRIEF中汉明距离:比特位...

【专利技术属性】
技术研发人员:李静张雪梅孟巍吴雪霞梁雅洁徐美玲王若晗刘思涛孙峰孙云峰
申请(专利权)人:国网山东省电力公司电力科学研究院国家电网有限公司
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1