基于用户交互的多轮对话在线训练方法及系统技术方案

技术编号：21714492 阅读：41 留言：0更新日期：2019-07-27 19:14

本发明专利技术公开了一种基于用户交互的多轮对话在线训练方法及系统，其中，该方法包括：获取当前对话轮次，并判断对话轮次是否大于预设阈值；若对话轮次大于预设阈值，则获取当前动作；若当前动作为接收操作动作时，则通过自然语言理解模块对当前动作进行意图和实体识别；若意图和实体的识别结果任一存在错误，则接收用户定义正确的意图和实体；根据用户定义正确的意图和实体对自然语言理解模块进行实时在线训练。该方法通过与用户在线交互，实时对模块进行训练，解决任务型多轮对话系统中文对话数据集匮乏且质量不高的问题，可适用于不同的对话场景。

Online Training Method and System of Multi-Round Dialogue Based on User Interaction

全部详细技术资料下载

【技术实现步骤摘要】
基于用户交互的多轮对话在线训练方法及系统
本专利技术涉及人工智能
，特别涉及一种基于用户交互的多轮对话在线训练方法及系统。
技术介绍
近年来，随着人工智能技术日新月异的发展，人机对话技术在各个领域都得到广泛应用，尤其是目标驱动型的多轮对话系统，旨在帮助用户完成具体的任务，例如帮助用户预订机票，预订餐厅等，目标驱动型的对话系统可以使用户获取信息的方式更加简洁明确，不同于传统的搜索引擎的基于网页的解决方案，对话系统可以与用户进行多轮连续的对话，步步引导，逐渐确定用户的意图，基于背景知识返回给用户直接且精准的答案，避免用户从搜索引擎查找到的网页中再进行更细粒度的信息筛选，节省了用户的时间和精力。将传统的搜索引擎检索方式转换为目标驱动型的与用户进行多轮交互的方式，是未来必然的发展趋势。目标驱动型的多轮对话系统的发展势头良好，但传统的基于自动机转换和模版的方式远远不能满足用户的需要，因而对话系统的主要发展趋势是与深度学习技术紧密结合起来，利用深度学习技术进一步提高目标驱动型多轮对话系统的性能。深度学习本身是数据驱动的科学，需要大量的数据来进行训练才能保证模型的性能，但是基于中文业务场景的对话系统数据集很难获得，且标注费时费力，构建高质量的基于业务场景的中文知识库的成本很高昂。其次，数据库的人工标注非常容易出错，会有一些未正确标注的数据出现，这些数据也会放进模型中进行训练，会进一步影响模型的性能。实际上，制约目标驱动型的多轮对话系统的发展的瓶颈之一就是高质量数据量的匮乏。而构建可以实时产生高质量对话数据的在线训练模块可以快速高效的构建高质量的对话数据，缓解目标驱...

【技术保护点】
1.一种基于用户交互的多轮对话在线训练方法，其特征在于，包括以下步骤：获取当前对话轮次，并判断所述对话轮次是否大于预设阈值；若所述对话轮次大于预设阈值，则获取当前动作；若所述当前动作为接收操作动作时，则通过自然语言理解模块对所述当前动作进行意图和实体识别；若所述意图和实体的识别结果任一存在错误，则接收用户定义正确的意图和实体；根据所述用户定义正确的意图和实体对所述自然语言理解模块进行实时在线训练。

【技术特征摘要】
1.一种基于用户交互的多轮对话在线训练方法，其特征在于，包括以下步骤：获取当前对话轮次，并判断所述对话轮次是否大于预设阈值；若所述对话轮次大于预设阈值，则获取当前动作；若所述当前动作为接收操作动作时，则通过自然语言理解模块对所述当前动作进行意图和实体识别；若所述意图和实体的识别结果任一存在错误，则接收用户定义正确的意图和实体；根据所述用户定义正确的意图和实体对所述自然语言理解模块进行实时在线训练。2.根据权利要求1所述的方法，其特征在于，还包括：若所述意图和实体的识别结果都为正确，则通过对话管理模块根据所述意图和实体的识别结果对所述当前动作进行动作回应；若所述动作回应为错误，则接收用户定义正确的工作；根据所述用户定义正确的工作对所述对话管理模块进行实时在线训练。3.根据权利要求2所述的方法，其特征在于，还包括：在完成了所述自然语言理解模块和所述对话理解模块的实时在线训练之后，对对话状态更新模块进行更新得到新的对话状态，并将所述新的对话状态转换为向量形式，得到下一轮次对话，形成多轮对话的交互。4.根据权利要求1还包括所述的方法，其特征在于，还包括：若所述对话轮次不大于预设阈值，则等待下一对话轮次。5.根据权利1所述的方法，其特征在于，还包括：若所述当前动作不为所述接收操作动作，则仅通过所述对话管理模块对所述当前动作进行动作回应供用户审阅。6.一种基于用户交互的多轮对话在线训练系统，其特征在于，包括：判断模块，用于获取当前对话轮次，并...

【专利技术属性】
技术研发人员：鄂海红，宋美娜，牛佩晴，陈忠富，肖思琪，周筱松，程瑞，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人