文本数据的处理方法、装置和计算机可读存储介质制造方法及图纸

技术编号：24855745 阅读：32 留言：0更新日期：2020-07-10 19:08

本公开涉及一种文本数据的处理方法、装置和计算机可读存储介质，涉及人工智能技术领域。该方法包括：在待处理文本中添加一个或多个占位符以生成目标文本，使得目标文本的长度满足深度学习模型的预设文本长度；将目标文本输入深度学习模型，计算所标文本中各词和占位符的隐层输出；根据注意力机制计算目标文本中各词的权值，并将占位符相应的权值设置为零；根据权值和隐层输出，确定待处理文本的情绪类型。本公开的技术方案能够在保证文本处理准确性的基础上，提高文本处理的效率。

全部详细技术资料下载

【技术实现步骤摘要】
文本数据的处理方法、装置和计算机可读存储介质
本公开涉及人工智能
，特别涉及一种文本数据的处理方法、文本数据的处理装置和计算机可读存储介质。
技术介绍
客服系统作为直接面向用户的窗口，在互联网行业起到越来越重要的作用。客服系统解决问题的能力将直接影响用户体验和用户对公司的印象。当用户对客服的服务不满意，将降低用户体验。在相关技术中，通过自然语言处理等人工智能技术，根据输入文本确定用户的当前情绪。例如，采用公开的情感分析数据集yelpfull、sogounews等建立模型，以确定用户的当前情绪。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题：只能处理固定长度的输入文本，导致处理效率低。鉴于此，本公开提出了一种文本数据的处理技术方案，能够提高处理效率。根据本公开的一些实施例，提供了一种文本数据的处理方法，包括：在待处理文本中添加一个或多个占位符以生成目标文本，使得所述目标文本的长度满足深度学习模型的预设文本长度；将所述目标文本输入所述深度学习模型，计算所述目标文...

【技术保护点】
1.一种文本数据的处理方法，包括：/n在待处理文本中添加一个或多个占位符以生成目标文本，使得所述目标文本的长度满足深度学习模型的预设文本长度；/n将所述目标文本输入所述深度学习模型，计算所述目标文本中各词和所述占位符的隐层输出；/n根据注意力机制计算所述目标文本中所述各词的权值，并将所述占位符相应的权值设置为零；/n根据所述权值和所述隐层输出，确定所述待处理文本的情绪类型。/n

【技术特征摘要】
1.一种文本数据的处理方法，包括：
在待处理文本中添加一个或多个占位符以生成目标文本，使得所述目标文本的长度满足深度学习模型的预设文本长度；
将所述目标文本输入所述深度学习模型，计算所述目标文本中各词和所述占位符的隐层输出；
根据注意力机制计算所述目标文本中所述各词的权值，并将所述占位符相应的权值设置为零；
根据所述权值和所述隐层输出，确定所述待处理文本的情绪类型。

2.根据权利要求1所述的处理方法，其中，所述计算所述目标文本中各词和所述占位符的隐层输出包括：
通过所述深度学习模型计算所述目标文本中各词的隐层输出；
将所述目标文本中所述占位符的隐层输出设置为随机值。

3.根据权利要求1所述的处理方法，其中，所述根据注意力机制计算所述目标文本中所述各词的权值包括：
计算所述各词的所述隐层输出的隐层表示；
根据所述隐层表示计算所述各词的权值。

4.根据权利要求1所述的处理方法，其中，所述确定所述待处理文本的情绪类型包括：
根据所述权值和所述隐层输出，计算所述目标文本的输出向量；
根据所述输出向量，计算所述待处理文本对于各情绪类型的概率分布；
根据所述概率分布确定所述待处理文本的情绪类型和情绪浓度。

5.根据权利要求1-4任一项所述的处理方法，其中，所述将所述目标文本输入所述深度学习模型包括：
调用tensorflow的dynamic_rnn接口，将所述目标文本输入所述深度学习模型。

6.一种文本数据的处理装置，包括：
生成单元，用于在待处理文本中添加一个或多个占位符以生成目标文本，使...

【专利技术属性】
技术研发人员：高维国，车天博，
申请(专利权)人：北京京东尚科信息技术有限公司，北京京东世纪贸易有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人