【技术实现步骤摘要】
一种动态更新的智慧客服知识库系统
[0001]本专利技术涉及数据处理
,具体涉及一种动态更新的智慧客服知识库系统。
技术介绍
[0002]知识库是基于知识且具有智能性的系统(或专家系统),并不是所有具有智能的程序都拥有知识库,只有基于知识的系统才拥有知识库。许多应用程序都利用知识,其中有的还达到了很高的水平,但是,这些应用程序可能并不是基于知识的系统,它们也不拥有知识库。一般的应用程序是把问题求解的知识隐含地编码在程序中,而基于知识的系统则将应用领域的问题求解知识显式地表达,并单独地组成一个相对独立的程序实体。目前知识库创建无法根据用户问题实时识别创建知识点,知识库的创建效率较低,人工比对时间较长,无法适应知识库动态更新的需求。另外,目前的知识库存在无法识别用户发送的包括语音、图片等非结构化数据的问题,导致用户体验感较差。
技术实现思路
[0003]为克服现有技术的缺陷,本专利技术提出一种动态更新的智慧客服知识库系统,该系统可以自动识别用户语音、文本、图片等非结构化问法,利用智能分词技术全方位识别用户意 ...
【技术保护点】
【技术特征摘要】
1.一种动态更新的智慧客服知识库系统,其特征在于,该系统包括智慧客服知识库,知识点创建模块,文本预处理模块,关键词提取模块,非结构化数据转译模块,知识混淆模块以及知识混淆检测模块;所述知识点创建模块根据提取的用户问题,利用智能分词技术识别提取用户语音信息,用户图片信息以及用户文本信息,再根据坐席回复信息,将用户问题和坐席回复信息合并为问答知识点,对该问答知识点进行问题扩充形成条目知识点;所述文本预处理模块对所述条目知识点进行文本预处理,对条目知识点中的停用词进行剔除后,新增至所述智慧客服知识库中;所述关键词提取模块对所述用户文本信息进行筛选,采用TF
‑
IDF算法识别提取文本信息中的特有关键词,利用提取的特有关键词核对系统内各个知识点的关键词;所述非结构化数据转译模块采用CNN+RNN+CTC模型对所述用户图片信息中的文字信息和文字范围,识别文字区域,将文字区域转化为字符信息,输出文本信息;所述知识混淆模块根据所述智慧客服知识库中多个知识点之间的关键词重合度,确定混淆知识点候选集合,寻找混淆知识点以及高质量混淆知识点;所述知识混淆检测模块用于将用户文本信息,输出文本信息,混淆知识点以及高质量混淆知识点与现有所述智慧客服知识库进行混淆检测,对比现有知识库内是否存在类似问题,根据对比结果判断是否需要进行知识点的扩充,完成知识库的动态更新。2.根据权利要求1所述动态更新的智慧客服知识库系统,其特征在于,所述智慧客服知识库包括知识库平台以及知识库,所述知识库平台为知识库提供硬件设备以及软件环境,所述硬件设备包括计算设备、存储设备、安全设施、网络设备,所述软件环境包括可用于机器学习的Python以及Matlab;所述知识库包括知识库数据以及关键词数据;所述知识库数据是各系统以及各个业务常见问题及热点问题的集合,包括分类存储的各类业务数据,所述业务数据包括文本数据、图片数据、语音数据、半结构化和非结构化数据;所述关键词数据是各系统以及各个业务常见问题及热点问题的关键词集合,包括各个业务数据的特有专业名词。3.根据权利要求2所述动态更新的智慧客服知识库系统,其特征在于,采用词频逆向知识点频率TFIDF的方法确定所述系统内各个知识点的关键词。4.根据权利要求3所述动态更新的智慧客服知识库系统,其特征在于,寻找混淆知识点的步骤包括:S41:确定各个知识点对应...
【专利技术属性】
技术研发人员:郑蓉蓉,于霄洋,王晨辉,薛文婷,张冰,罗大勇,
申请(专利权)人:国家电网有限公司信息通信分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。