文本数据的处理方法、装置和计算机可读存储介质制造方法及图纸

技术编号:24855745 阅读:32 留言:0更新日期:2020-07-10 19:08
本公开涉及一种文本数据的处理方法、装置和计算机可读存储介质,涉及人工智能技术领域。该方法包括:在待处理文本中添加一个或多个占位符以生成目标文本,使得目标文本的长度满足深度学习模型的预设文本长度;将目标文本输入深度学习模型,计算所标文本中各词和占位符的隐层输出;根据注意力机制计算目标文本中各词的权值,并将占位符相应的权值设置为零;根据权值和隐层输出,确定待处理文本的情绪类型。本公开的技术方案能够在保证文本处理准确性的基础上,提高文本处理的效率。

【技术实现步骤摘要】
文本数据的处理方法、装置和计算机可读存储介质
本公开涉及人工智能
,特别涉及一种文本数据的处理方法、文本数据的处理装置和计算机可读存储介质。
技术介绍
客服系统作为直接面向用户的窗口,在互联网行业起到越来越重要的作用。客服系统解决问题的能力将直接影响用户体验和用户对公司的印象。当用户对客服的服务不满意,将降低用户体验。在相关技术中,通过自然语言处理等人工智能技术,根据输入文本确定用户的当前情绪。例如,采用公开的情感分析数据集yelpfull、sogounews等建立模型,以确定用户的当前情绪。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题:只能处理固定长度的输入文本,导致处理效率低。鉴于此,本公开提出了一种文本数据的处理技术方案,能够提高处理效率。根据本公开的一些实施例,提供了一种文本数据的处理方法,包括:在待处理文本中添加一个或多个占位符以生成目标文本,使得所述目标文本的长度满足深度学习模型的预设文本长度;将所述目标文本输入所述深度学习模型,计算所述目标文本中各词和所述占位符本文档来自技高网...

【技术保护点】
1.一种文本数据的处理方法,包括:/n在待处理文本中添加一个或多个占位符以生成目标文本,使得所述目标文本的长度满足深度学习模型的预设文本长度;/n将所述目标文本输入所述深度学习模型,计算所述目标文本中各词和所述占位符的隐层输出;/n根据注意力机制计算所述目标文本中所述各词的权值,并将所述占位符相应的权值设置为零;/n根据所述权值和所述隐层输出,确定所述待处理文本的情绪类型。/n

【技术特征摘要】
1.一种文本数据的处理方法,包括:
在待处理文本中添加一个或多个占位符以生成目标文本,使得所述目标文本的长度满足深度学习模型的预设文本长度;
将所述目标文本输入所述深度学习模型,计算所述目标文本中各词和所述占位符的隐层输出;
根据注意力机制计算所述目标文本中所述各词的权值,并将所述占位符相应的权值设置为零;
根据所述权值和所述隐层输出,确定所述待处理文本的情绪类型。


2.根据权利要求1所述的处理方法,其中,所述计算所述目标文本中各词和所述占位符的隐层输出包括:
通过所述深度学习模型计算所述目标文本中各词的隐层输出;
将所述目标文本中所述占位符的隐层输出设置为随机值。


3.根据权利要求1所述的处理方法,其中,所述根据注意力机制计算所述目标文本中所述各词的权值包括:
计算所述各词的所述隐层输出的隐层表示;
根据所述隐层表示计算所述各词的权值。


4.根据权利要求1所述的处理方法,其中,所述确定所述待处理文本的情绪类型包括:
根据所述权值和所述隐层输出,计算所述目标文本的输出向量;
根据所述输出向量,计算所述待处理文本对于各情绪类型的概率分布;
根据所述概率分布确定所述待处理文本的情绪类型和情绪浓度。


5.根据权利要求1-4任一项所述的处理方法,其中,所述将所述目标文本输入所述深度学习模型包括:
调用tensorflow的dynamic_rnn接口,将所述目标文本输入所述深度学习模型。


6.一种文本数据的处理装置,包括:
生成单元,用于在待处理文本中添加一个或多个占位符以生成目标文本,使...

【专利技术属性】
技术研发人员:高维国车天博
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1