基于文本分析处理通信质量投诉地址的方法及系统技术方案

技术编号：24708780 阅读：88 留言：0更新日期：2020-07-01 00:04

基于文本分析处理通信质量投诉地址的方法及系统，包括：通过正向最长匹配算法对源文本进行中文地址分词；分词结果由多级行政区划地址树推理分析，得到精确的多级地名识别结果；接收到地址树传递的输入后，基于规则的多级地址识别算法，自动分析出更复杂更一般的多级地址字段；将地址树的推理结果和规则匹配的识别结果融合，作为算法系统的最终输出。针对通信质量投诉工单具体受理文本内容，进行中文分词、正则表达式地址抽取以及地址树推理处理后，实现通信质量投诉工单标准地址的自动抽取。

全部详细技术资料下载

【技术实现步骤摘要】
基于文本分析处理通信质量投诉地址的方法及系统
本专利技术涉及计算机网络
，更具体地，涉及基于文本分析处理通信质量投诉地址的方法及系统。
技术介绍
电信行业客户通过服务热线来电投诉通信质量问题后，一线坐席人员将通信质量故障的具体地址随同故障问题记录进入工单系统派发到网络部门，并按照省-市-县等逐级派单模式派送到最终责任单位予以处理。现有的电信客户服务工单系统没有基于文本分析处理通信质量投诉地址的方法。现有的电信客户服务工单系统没有基于文本分析处理通信质量投诉地址的方法。在呼叫中心以及网络各级部门等各个环节均需手工派单处理，造成工单流转周期过长，效率过低。
技术实现思路
本方案采用一种方法针对通信质量投诉工单具体受理文本内容，进行中文分词、正则表达式地址抽取以及地址树推理处理后，实现通信质量投诉工单标准地址的自动抽取。本专利技术的目的在于解决事件在整个推送过程中，耦合性高的问题，通过配置规则，以实现服务的自由组合。本专利技术提供一种基于文本分析处理电信行业通信质量投诉地址的方法，包括：步骤一、通过正向最长匹配算法对源文本进行中文地址分词；步骤二、分词结果由多级行政区划地址树推理分析，得到精确的多级地名识别结果；步骤三、接收到地址树传递的输入后，基于规则的多级地址识别算法，自动分析出更复杂更一般的多级地址字段；步骤四、将地址树的推理结果和规则匹配的识别结果融合，作为算法系统的最终输出。在本公开的一实施例中，所述步骤一中，查询行政区划前缀索引数...

【技术保护点】
1.基于文本分析处理通信质量投诉地址的方法及系统，其特征在于，包括：/n步骤一、通过正向最长匹配算法对源文本进行中文地址分词；/n步骤二、分词结果由多级行政区划地址树推理分析，得到精确的多级地名识别结果；/n步骤三、接收到地址树传递的输入后，基于规则的多级地址识别算法，自动分析出更复杂更一般的多级地址字段；/n步骤四、将地址树的推理结果和规则匹配的识别结果融合，作为算法系统的最终输出。/n

【技术特征摘要】
20191225 CN 20191136243831.基于文本分析处理通信质量投诉地址的方法及系统，其特征在于，包括：
步骤一、通过正向最长匹配算法对源文本进行中文地址分词；
步骤二、分词结果由多级行政区划地址树推理分析，得到精确的多级地名识别结果；
步骤三、接收到地址树传递的输入后，基于规则的多级地址识别算法，自动分析出更复杂更一般的多级地址字段；
步骤四、将地址树的推理结果和规则匹配的识别结果融合，作为算法系统的最终输出。

2.如权利要求1所述的方法，其特征在于，所述步骤一中，查询行政区划前缀索引数据库。

3.如权利要求1所述的方法，其特征在于，所述步骤二中，查询多级行政区划记录数据。

4.如权利要求1所述的方法，其特征在于，所述步骤三中，查询各级识别规则库。

5.如权利要求1所述的方法，其特征在于，所述步骤一到三中，包...

【专利技术属性】
技术研发人员：刘德厚，雷晓宇，王福君，李言良，
申请(专利权)人：北京合力亿捷科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人