一种基于集成学习的问答方法及系统技术方案

技术编号：27205992 阅读：18 留言：0更新日期：2021-01-31 12:29

本发明专利技术公开了一种基于集成学习的问答方法及系统。方法包括：将用户问题输入预先训练好的集成学习模型，所述集成学习模型包含多个机器学习模型，每个机器学习模型输出该用户问题应由哪一个子问答模块来回答的分类结果；对所述多个机器学习模型的分类结果进行投票集成，根据投票集成结果确定最终调用的子问答模块。本发明专利技术借助深度学习技术、集成学习技术，调用合适的子问答模块来回答问题，不依赖于子问答模块的排序，问答效果好，且能够支持使用用户反馈数据对系统再次进行优化。户反馈数据对系统再次进行优化。户反馈数据对系统再次进行优化。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于集成学习的问答方法及系统

[0001]本专利技术涉及一种基于集成学习的问答方法及系统，属于电力智能客服机器人领域。

技术介绍

[0002]电力智能客服是在传统的客服系统基础上，集成了语义理解、知识图谱、深度学习等多项智能交互技术，能准确理解用户的意图或提问，再根据电力知识库和电力知识图谱，给予用户满意的回答。
[0003]电力智能客服机器人中包含常见问答模块(简称FAQ问答模块，Frequently Asked Questions)和知识图谱问答模块(简称KBQA模块,Knowledge Base Question Answering)。FAQ问答模块用于回答常见用户问题，KBQA模块多用于回答知识查询、推理类问题。两个问答模块结合可以回答绝大多数用户问题。
[0004]电力智能客服机器人的核心是中控系统，它的主要功能是分析用户问题，选择合适的问答模块来回答用户问题。
[0005]当前基于KBQA和FAQ问答模块的智能客服中，中控逻辑较为简单，是基于规则的、串行的，中控系统会尝试调用子问答模块(即KBQA模块和FAQ模块)，并根据子问答模块的返回结果来判断是否调用下一个问答模块。
[0006]但是，当前中控调度依赖于被调用问答模块的返回结果，中控系统需要根据被调用模块的返回结果判断是否继续调用下一个问答模块。这种工作方式由如下几个不足：
[0007]1)问答模块调用方式不合理，问答效果依赖于子模块的排序，排在前面模块的返回结果有更大的几率被作为最终答案。这是不合理的，如...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的问答方法，其特征在于，包括如下步骤：将用户问题输入预先训练好的集成学习模型，所述集成学习模型包含多个机器学习模型，每个机器学习模型输出该用户问题应由哪一个子问答模块来回答的分类结果；对所述多个机器学习模型的分类结果进行投票集成，根据投票集成结果确定最终调用的子问答模块。2.根据权利要求1所述的方法，其特征在于，还包括：在输入集成学习模型之前，对用户问题进行预处理。3.根据权利要求2所述的方法，其特征在于，所述预处理，包括：对用户问题进行统一编码；对编码后的用户问题进行简繁转换；对简繁转换后用户问题进行停用词移除。4.根据权利要求1所述的方法，其特征在于，所述集成学习模型的训练方法，包括：获取用户问题训练集；对训练集中的每个用户问题标注该问题应由哪一个子问答模块来回答；将标注好的训练集输入所述集成学习模型中的每个机器学习模型，以对每个机器学习模型进行训练。5.根据权利要求4所述的方法，其特征在于，所述训练方法，还包括：对训练后的每个机器学习模型的预测性能进行评价。6.根据权利要求5所述的方法，其特征在于，对每个机器学习模型的预测性能进行评价的方...

【专利技术属性】
技术研发人员：吴宁，嵇友浪，孙少辰，赵洪莹，俞阳，邹云峰，
申请(专利权)人：国网江苏省电力有限公司营销服务中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人