【技术实现步骤摘要】
一种数据处理方法、装置、计算机设备以及存储介质
[0001]本申请涉及互联网
,尤其涉及一种数据处理方法、装置、计算机设备以及存储介质。
技术介绍
[0002]在自然语言处理领域中,文本的自动生成在很多场景下都有非常显著的作用,例如,个性化开场白的自动生成系统,目前,自动生成开场白主要是基于变分自编码器的生成方案,该方案中的基础架构中,主要包括三个部分,分别是编码器、变分自编码器和解码器,该方案虽然可以自动生成开场白文本,但是由于其输入只有一个随机变量,而随机变量和生成的文本之间的对应关系非常复杂,因此,难以通过人工指定变量来生成的指定文本,因此,采用现有的变分自编码器的方案无法生成可控的目标文本,导致预测的文本数据与目标用户的契合度较低。
技术实现思路
[0003]本申请实施例提供一种数据处理方法、装置、计算机设备以及存储介质,可以提高预测文本数据与目标用户的契合度。
[0004]本申请实施例一方面提供了一种数据处理方法,可包括:
[0005]获取目标用户的用户信息,根据所述用户信息生 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取目标用户的用户信息,根据所述用户信息生成目标用户的用户特征向量;从历史文本信息中提取至少两个备选主题生成备选主题序列,并根据所述备选主题序列生成每个备选主题对应的备选主题向量;基于主题预测模型,根据所述用户特征向量和所述备选主题序列中的备选主题向量生成所述目标用户对应的预测主题序列;基于文本预测模型,根据所述预测主题序列生成所述目标用户对应的预测文本数据。2.根据权利要求1所述的方法,其特征在于,所述获取目标用户的用户信息,根据所述用户信息生成目标用户的用户特征向量,包括:获取目标用户的用户信息,所述用户信息包括离散型特征信息和连续型特征信息;对所述离散型特征信息进行离散化处理,生成第一特征向量;对所述连续型特征信息进行等频分桶处理,生成第二特征向量;将所述第一特征向量和所述第二特征向量进行拼接生成所述目标用户的用户特征向量。3.根据权利要求1所述的方法,其特征在于,所述基于主题预测模型,根据所述用户特征向量和所述备选主题序列中的备选主题向量生成所述目标用户对应的预测主题序列,包括:获取输出向量O
i
,基于主题预测模型中的多层感知单元,根据所述用户特征向量、输出向量O
i
和输入主题序列M
i
中的备选主题向量生成所述目标用户对应的预测主题TP
i
;所述i为大于0的整数,当i=1时,所述输出向量O
i
为置零向量,所述输出向量O
i
是根据中间主题序列N
i
生成的;所述输入主题序列M
i
包括至少一个备选主题,所述输入主题序列M
i
中的备选主题属于所述备选主题序列,当i=1时,所述输入主题序列M
i
为备选主题序列;根据所述预测主题TP
i
更新所述输入主题序列M
i
生成输入主题序列M
i+1
;获取中间主题序列N
i
‑1,根据所述预测主题TP
i
更新所述中间主题序列N
i
‑1生成中间主题序列N
i
;当i=1时,所述中间主题序列N
i
为置零序列;获取隐向量H
i
,通过主题预测模型中的循环神经网络,根据所述预测主题TP
i
和隐向量H
i
生成输出向量O
i+1
和隐向量H
i+1
;当i=1时,所述隐向量H
i
为置零向量;当所述中间主题序列向量N
i
中预测主题的数量大于数量阈值时,将所述中间主题序列N
i
确定为所述目标用户对应的预测主题序列。4.根据权利要求3所述的方法,其特征在于,所述基于主题预测模型中的多层感知单元,根据所述用户特征向量、输出向量O
i
和输入主题序列M
i
中的备选主题向量生成所述目标用户对应的预测主题TP
i
,包括:基于主题预测模型中的多层感知单元,根据所述用户特征向量、输出向量O
i
和目标备选主题向量生成所述目标备选主题的预测值;所述目标备选主题向量为输入主题序列M
i
中的任意一个备选主题向量;将所述预测值最大的目标备选主题向量对应的备选主题,确定为所述目标用户对应的预测主题TP
i
。5.根据权利要求3所述的方法,其特征在于,所述根据所述预测主题TP
i
更新所述输入主题序列M
i
生成输入主题序列M
i+1
,包括:
从输入主题序列M
i
中将所述预测主题TP
i
进行删除,将删除预测主题TP
i
的输入主题序列M
i
确定为输入主题序列M
i+1
。6.根据权利要求3所述的方法,其特征在于,所述根据所述预测主题TP
i
更新所述中间主题序列N
i
‑1生成中间主题序列N
i
,包括:将所述预测主题TP
i
添加至所述中间主题序列N
i
‑1中,将添加预测主题TP
i
的中间主题序列N
i
‑1确定为中间主题序列N
i
。7.根据权利要求1所述的方法,其特征在于,所述基于文本预测模型,根据所述预测主题序列生成所述目标用户对应的预测文本数据,包括:获取预测主题序列中的初始主题TP
n<...
【专利技术属性】
技术研发人员:张懿,吴伟佳,李羽,
申请(专利权)人:微民保险代理有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。