【技术实现步骤摘要】
一种基于关键字提取的智能客服信息生成系统及生成方法
[0001]本专利技术具体涉及一种基于关键字提取的智能客服信息生成系统及生成方法。
技术介绍
[0002]客服工作主要包括对客户提出的针对于其服务及产品的解答,随着智能化信息处理及人工智能的普及越来越多的领域开始选择利用人工智能客服代替传统的人工客服,这种客服模式节约人力成本且可以实现对客户需求的标准化应答,因此人工智能客服必然成为客服工作未来的发展趋势。
[0003]近年来,人工智能客服发展较为快速,但基本停留在对特定语句的识别后调取数据库中预先设置的标准答复语句进行应答,这种智能客服方式存在大量的答不对题或因无法完成整段语句的全方位识别而无法进行后续的数据库筛选及应答输出的环节,因此这种模式会在具体使用中表现得并不智能甚至十分不方便使用。即,现有技术存在由于部分客户输入语句不清或不标准而导致客服信息生成不准确的问题。
技术实现思路
[0004]本专利技术的目的在于针对现有技术的不足,提供一种基于关键字提取的智能客服信息生成系统,该基于关键字提取的 ...
【技术保护点】
【技术特征摘要】
1.一种基于关键字提取的智能客服信息生成系统,其特征在于,包括:用户输入解析模块:用于实现对客户输入的语音信息进行识别,利用NLP技术对自然语言进行处理,实施语句分割、词性标注、实体识别、句法分析,以提取关键信息和语义,得到文字信息并对文字信息进行逻辑分析后将其中逻辑错误处进行模糊化处理,以得到标准化文字信息之后对标准化文字信息进行语句拆分,以得到短语句,并从用户输入中提取关键字或关键短语,通过匹配预定义的关键词列表或使用机器学习算法来识别关键字;问题匹配模块,使用文本相似度算法比较用户提问与数据库中问题的相似度,采用Word2Vec词嵌入模型或GloVe词嵌入模型并结合Siamese网络或BERT深度学习模型计算语义相似度,并在对短语句中各文字信息进行权重的情况下调取数据库中对应信息;数据库管理模块:该模块用于管理系统的数据库,包括常见问题、答案并提供添加、修改、删除和查询数据库内容的功能,该数据库为结构化的数据库或文档集合;回答生成模块:根据生成的信息和回答模板生成最终的回答,使用自然语言生成技术,生成符合语法和语义规范的回答,并组成长语句,最后将全部长语句整合成为文字回答信息,回答生成考虑上下文信息和需求;响应输出模块:该模块将生成的回答输出给用户,根据用户的渠道将回答进行输出,响应输出为文本形式的回答或包含多媒体内容;数据存储模块,使用关系型数据库或者NoSQL数据库进行问题和答案的存储和管理。2.根据权利要求1所述的基于关键字提取的智能客服信息生成系统,其特征在于,还包括:评估和优化模块用于评估系统的性能和优化算法,根据用户的反馈和评价,对系统的回答进行评估和分析,以便不断优化关键字提取、信息生成和回答生成的算法和模型。3.一种基于关键字提取的智能客服信息生成方法,其特征在于,包括如下步骤:S1:对客户输入的语音信息进行识别,并将所述语音信息转化为文字信息;S2:对转化后的文字信息进行逻辑分析;S3:对转化后的文字信息中逻辑错误处进行模糊化处理,以得到标准化文字信息;S4:对所述标准化文字信息进行语句拆分,以得到短语句;S5:对短语句中各文字信息进行权重设置;S6:根据短语句中各文字信息及对应权重调取数据库中对应信息,并共同组成长语句;S7:将全部短语句所对应的长语句根据短语句的前后顺序依次排列组合成为文字回答信息。4.根据权利要求3所述的基于关键字提取的智能客服信息生成方法,其特征在于:步骤S3中进行模糊化处理的步骤具体如下:利用如下公式计算每一个文字信息的模糊程度,并将其中模糊度最高的数据利用空白数据进行替换:,其中,X为文字信息中的总字符数;G为文字信息采样频率;A为当前数据与其后数据的间隔时长;
B为文字信息的复数数据;M为数据模糊化程度;T为当前数据的位数。5.根据权利要求3所述的基于关键字提取的智能客服信息生成方法,其特征在于:步骤S3中进行模糊化处理的步骤具体如下:利用如下公式计算每一个文字信息的模糊程度,并将其中模糊度最高的数据利用空白数据进行替换:Fuzziness= ∫[a,b] p(x)log(p(x));其中:Fuzziness为模糊度,表示信息的模糊程度或不确定性的度量;p(x)为概率密度函数;[a, b]为数据积分的区间。6.根据权利要求3所...
【专利技术属性】
技术研发人员:崔晓乾,高健豪,
申请(专利权)人:成都信通信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。