一种数据处理方法、装置及计算机存储介质和电子设备制造方法及图纸

技术编号：24497934 阅读：29 留言：0更新日期：2020-06-13 03:47

本发明专利技术公开了一种数据处理方法、装置及计算机存储介质和电子设备，方法包括：获取初始语料，所述初始语料至少包括对话目标和历史语料；对所述初始语料进行词向量转换，得到语料词向量；根据所述语料词向量进行分类训练，得到分类结果；根据所述分类结果判断所述对话目标是否完成。本发明专利技术提供的数据处理方法、装置及计算机存储介质和电子设备，通过引入对话目标来约束对话，并把对话目标的完成与否当作分类任务来进行分类训练判断对话目标是否完成，若完成则不再对同一对话目标进行无意义的回复；若对话目标未完成，则据此生成更为符合对话目标的回复文本来约束对话，以产生更有价值的对话，最终有助于提高对话机器人的用户满意度，提高商业价值。

A data processing method, device, computer storage medium and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种数据处理方法、装置及计算机存储介质和电子设备
本专利技术涉及信息处理
，尤其涉及一种数据处理方法、装置及计算机存储介质和电子设备。
技术介绍
近年来，聊天机器人受到了广泛的关注和发展，聊天机器人是一种通过自然语言模拟人类进行对话的程序，其中，开放域聊天机器人在生活中发挥着重要作用。传统的开放域对话一般没有明确的目标，机器人基于对话生成模型所生成的回复语句中经常出现没有实际意义的万能回复，比如中文里的“哈哈哈哈”等回复非常容易被选中，而且一旦用户向机器输入这种没有意义的语句时，机器与人之间的多轮对话就有很高概率会陷入死循环。人和机器之间没有目的的闲聊，这样的聊天一方面很难深入，商业价值较小，而且另一方面用户体验感也较差。
技术实现思路
本专利技术实施例为了有效克服现有技术所存在的上述缺陷，创造性地提供一种数据处理方法，包括：获取初始语料，所述初始语料至少包括对话目标和历史语料；对所述初始语料进行词向量转换，得到语料词向量；根据所述语料词向量进行分类训练，得到分类结果；根据所述分类结果判断所述对话目标是否完成。在一可实施方式中，所述方法还包括：根据所述语料词向量进行文本回复训练，得到回复文本；当所述对话目标未完成时，输出所述回复文本。在一可实施方式中，通过栈式双向循环神经网络根据所述语料词向量进行分类训练。在一可实施方式中，通过神经网络根据所述语料词向量进行文本回复训练。在一可实施方式中，根据所述语料词向量进行二分类训练；所述根据所述分类结果判断对话目...

【技术保护点】
1.一种数据处理方法，其特征在于，包括：/n获取初始语料，所述初始语料至少包括对话目标和历史语料；/n对所述初始语料进行词向量转换，得到语料词向量；/n根据所述语料词向量进行分类训练，得到分类结果；/n根据所述分类结果判断所述对话目标是否完成。/n

【技术特征摘要】
1.一种数据处理方法，其特征在于，包括：
获取初始语料，所述初始语料至少包括对话目标和历史语料；
对所述初始语料进行词向量转换，得到语料词向量；
根据所述语料词向量进行分类训练，得到分类结果；
根据所述分类结果判断所述对话目标是否完成。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括：
根据所述语料词向量进行文本回复训练，得到回复文本；
当所述对话目标未完成时，输出所述回复文本。

3.根据权利要求1或2所述的方法，其特征在于，通过栈式双向循环神经网络根据所述语料词向量进行分类训练。

4.根据权利要求1或2所述的方法，其特征在于，通过神经网络根据所述语料词向量进行文本回复训练。

5.根据权利要求1或2所述的方法，其特征在于，根据所述语料词向量进行二分类训练；
所述根据所述分类结果判断所述对话目标是否完成包括：
当所述分类结果大于第一阈值时，所述对话目标完成；
当所述分类结果小于第一阈值时，所述对话目标未完成。

6.一种数据处理装置，其特征在于，包括：
语料获取模块，用于获取初始语料，所述初始语料至少包括对话目标和历史...

【专利技术属性】
技术研发人员：林凤绿，王东升，范红杰，雷欣，
申请(专利权)人：出门问问信息科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人