【技术实现步骤摘要】
一种数据处理方法、装置及计算机存储介质和电子设备
本专利技术涉及信息处理
,尤其涉及一种数据处理方法、装置及计算机存储介质和电子设备。
技术介绍
近年来,聊天机器人受到了广泛的关注和发展,聊天机器人是一种通过自然语言模拟人类进行对话的程序,其中,开放域聊天机器人在生活中发挥着重要作用。传统的开放域对话一般没有明确的目标,机器人基于对话生成模型所生成的回复语句中经常出现没有实际意义的万能回复,比如中文里的“哈哈哈哈”等回复非常容易被选中,而且一旦用户向机器输入这种没有意义的语句时,机器与人之间的多轮对话就有很高概率会陷入死循环。人和机器之间没有目的的闲聊,这样的聊天一方面很难深入,商业价值较小,而且另一方面用户体验感也较差。
技术实现思路
本专利技术实施例为了有效克服现有技术所存在的上述缺陷,创造性地提供一种数据处理方法,包括:获取初始语料,所述初始语料至少包括对话目标和历史语料;对所述初始语料进行词向量转换,得到语料词向量;根据所述语料词向量进行分类训练,得到分类结果;根据所述分类结果判断所 ...
【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n获取初始语料,所述初始语料至少包括对话目标和历史语料;/n对所述初始语料进行词向量转换,得到语料词向量;/n根据所述语料词向量进行分类训练,得到分类结果;/n根据所述分类结果判断所述对话目标是否完成。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
获取初始语料,所述初始语料至少包括对话目标和历史语料;
对所述初始语料进行词向量转换,得到语料词向量;
根据所述语料词向量进行分类训练,得到分类结果;
根据所述分类结果判断所述对话目标是否完成。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据所述语料词向量进行文本回复训练,得到回复文本;
当所述对话目标未完成时,输出所述回复文本。
3.根据权利要求1或2所述的方法,其特征在于,通过栈式双向循环神经网络根据所述语料词向量进行分类训练。
4.根据权利要求1或2所述的方法,其特征在于,通过神经网络根据所述语料词向量进行文本回复训练。
5.根据权利要求1或2所述的方法,其特征在于,根据所述语料词向量进行二分类训练;
所述根据所述分类结果判断所述对话目标是否完成包括:
当所述分类结果大于第一阈值时,所述对话目标完成;
当所述分类结果小于第一阈值时,所述对话目标未完成。
6.一种数据处理装置,其特征在于,包括:
语料获取模块,用于获取初始语料,所述初始语料至少包括对话目标和历史...
【专利技术属性】
技术研发人员:林凤绿,王东升,范红杰,雷欣,
申请(专利权)人:出门问问信息科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。