文本数据处理方法、装置、电子设备及计算机可读介质制造方法及图纸

技术编号：24091420 阅读：15 留言：0更新日期：2020-05-09 08:14

本公开涉及一种文本数据处理方法、装置、电子设备及计算机可读介质。该方法包括：获取待处理文本数据，并对所述待处理文本数据进行处理，获得至少一个词向量序列；根据所述至少一个词向量序列与至少一个词典库确定目标权重矩阵，所述至少一个词典库包括情感词典库；通过神经网络模型对所述目标权重矩阵进行处理，获得解码信息；对所述解码信息进行集束搜索，获得所述待处理文本数据的回复文本数据。本公开涉及的文本数据处理方法、装置、电子设备及计算机可读介质，根据包含建立包含情感词典库对应权重的目标权重矩阵，能够根据目标权重矩阵获得包含正确情感的回复文本数据。

Text data processing methods, devices, electronic equipment and computer-readable media

全部详细技术资料下载

【技术实现步骤摘要】
文本数据处理方法、装置、电子设备及计算机可读介质
本公开涉及自然语言
，具体而言，涉及一种文本数据处理方法、装置、电子设备及计算机可读介质。
技术介绍
在当前的智能客服机器人系统中，通常关注生成对话的语法语义是否合理。为满足语法语义的合理性，通常包括如下三种方法：考虑上下文，结合主题以及生成长句子等等。然而在聊天中，当一个人表示难过的时候，另一方的回答应该包括适当的安慰性语句；当一方感到开心时，另一方也会为其感到快乐。例如，当A说：“我的宠物狗去世了”，B很自然应该回复：“我为你感到难过”等类似的语句。这种带有情感交互的例子在日常对话中数不胜数。而上述的三种方式均没有考虑情感因素，然而，只有真正的模拟人类的交谈才是好的对话机器人。因此，需要一种新的文本数据处理方法、装置、电子设备及计算机可读介质。在所述
技术介绍
部分公开的上述信息仅用于加强对本公开的背景的理解，因此它可以包括不构成对本领域普通技术人员已知的相关技术的信息。
技术实现思路
有鉴于此，本公开实施例提供一种文本数据处理方法、装置、电子设备及计算机可读介质，能够克服相关技术中的回复文本缺乏情感因素的缺陷。本公开的其他特性和优点将通过下面的详细描述变得显然，或部分地通过本公开的实践而习得。根据本公开的一方面，提出一种文本数据处理方法，该方法包括：获取待处理文本数据，并对所述待处理文本数据进行处理，获得至少一个词向量序列；根据所述至少一个词向量序列与至少一个词典库确定目标权重矩阵，所述至少一个词典库包括情感...

【技术保护点】
1.一种文本数据处理方法，其特征在于，包括：/n获取待处理文本数据，并对所述待处理文本数据进行处理，获得至少一个词向量序列；/n根据所述至少一个词向量序列与至少一个词典库确定目标权重矩阵，所述至少一个词典库包括情感词典库；/n通过神经网络模型对所述目标权重矩阵进行处理，获得解码信息；/n对所述解码信息进行集束搜索，获得所述待处理文本数据的回复文本数据。/n

【技术特征摘要】
1.一种文本数据处理方法，其特征在于，包括：
获取待处理文本数据，并对所述待处理文本数据进行处理，获得至少一个词向量序列；
根据所述至少一个词向量序列与至少一个词典库确定目标权重矩阵，所述至少一个词典库包括情感词典库；
通过神经网络模型对所述目标权重矩阵进行处理，获得解码信息；
对所述解码信息进行集束搜索，获得所述待处理文本数据的回复文本数据。

2.如权利要求1所述的方法，其特征在于，所述神经网络模型包括依次连接的编码模块、卷积层和解码模块；其中，还包括：
通过所述编码模块和所述卷积层对所述目标权重矩阵进行处理，获得编码信息；
根据所述解码模块对所述编码信息进行处理，获得解码信息；
根据所述编码信息、所述解码信息和所述情感词典库确定目标损失函数；
根据所述目标损失函数调节所述神经网络模型的参数，获得训练完成的所述神经网络模型。

3.如权利要求2所述的方法，其特征在于，根据所述编码信息、所述解码信息和所述情感词典库确定目标损失函数，包括：
根据所述编码信息与所述解码信息确定交叉熵损失函数；
根据所述编码信息在所述情感词典库中进行匹配，获得编码情感信息；
根据所述解码信息在所述情感词典库中进行匹配，获得解码情感信息；
根据所述交叉熵损失函数、所述编码情感信息、所述解码情感信息确定第一损失函数、第二损失函数和第三损失函数；
对所述第一损失函数、所述第二损失函数和所述第三损失函数进行加权求和，获得所述目标损失函数。

4.如权利要求2所述的方法，其特征在于，所述编码模块包括第一循环门单元和第二循环门单元，所述解码模块包括第三循环门单元和第四循环门单元。

5.如权利要求4所述的方法，其特征在于，通过所述编码模块和所述卷积层对所述目标权重矩阵进行处理，获得编码信息，包括：
通过所述第一循环门单...

【专利技术属性】
技术研发人员：杨正良，刘设伟，杜维，
申请(专利权)人：泰康保险集团股份有限公司，泰康在线财产保险股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人