【技术实现步骤摘要】
一种数据处理的方法、装置及设备
[0001]本文件属于人工智能领域,具体涉及一种数据处理的方法
、
装置及设备
。
技术介绍
[0002]自然语言处理可分为自然语言理解与自然语言生成两大分支,后者也可简称为文本生成,其主要包括文本到文本生成
、
数据到文本生成以及图像到文本生成三类
。
[0003]然而,对于数据到文本生成这一文本生成类型来说,由于输入文本生成模型的数据类信息
(
如表格
、
键值对列表以及三元组等
)
蕴含有丰富的内容,可能会出现文本生成模型输出的描述文本不符合预期的现象
。
例如,随着表格内容的增加,文本生成模型输出的描述文本长度也会增加,这时的描述文本常常会出现前后衔接不当等现象
。
为此,需要提供一种更优的数据处理方案,来克服上述困难
。
技术实现思路
[0004]本说明书实施例提供一种数据处理的方法
、
装置及设备,以提供一种符合文本生成预期的数据处理方案
。
[0005]第一方面,本说明书实施例提供了一种数据处理的方法,该方法包括:获取目标结构化数据和所述目标结构化数据对应的提示信息,所述目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和所述关联账户的预设特征的特征值,所述提示信息用于表征所述预设关联关系的类型和
/
或所述关联账户的行为的类型;对所述目标结构化数据
【技术保护点】
【技术特征摘要】
1.
一种数据处理的方法,包括:获取目标结构化数据和所述目标结构化数据对应的提示信息,所述目标结构化数据包括存在预设关联关系的账户群组中各个关联账户的账户标识和所述关联账户的预设特征的特征值,所述提示信息用于表征所述预设关联关系的类型和
/
或所述关联账户的行为的类型;对所述目标结构化数据中包含的数据内容进行序列化处理,得到所述目标结构化数据对应的内容序列信息;根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,并对所述描述逻辑信息进行序列化处理,得到所述目标结构化数据对应的逻辑序列信息;将所述内容序列信息和所述逻辑序列信息输入到文本生成模型中,得到所述目标结构化数据对应的账户群组描述文本,所述账户群组描述文本用于描述所述关联账户的相关信息
。2.
根据权利要求1所述的方法,所述根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,包括:根据所述提示信息中表征所述预设关联关系的类型和
/
或所述关联账户的行为的类型的第一关键词,从预设逻辑库中,确定与所述预设关联关系的类型和
/
或所述关联账户的行为的类型相关的至少一个关联逻辑信息;从所述至少一个所述关联逻辑信息中获取包含所述第一关键词的关联逻辑信息,基于获取的包含所述第一关键词的关联逻辑信息确定所述描述逻辑信息
。3.
根据权利要求2所述的方法,所述根据所述提示信息,获取所述目标结构化数据中包含的描述逻辑信息,包括:在所述至少一个所述关联逻辑信息中不包括包含所述第一关键词的关联逻辑信息的情况下,根据所述关联逻辑信息中表征逻辑类型的第二关键词,从预设的逻辑框架中,确定与所述关联逻辑信息的逻辑类型匹配的逻辑框架;使用所述账户标识和
/
或所述预设特征,对所述逻辑框架中的账户标识位置和
/
或预设特征位置进行填充,得到所述描述逻辑信息
。4.
根据权利要求3所述的方法,所述逻辑类型包括:同一预设特征中的相同特征值的数量
、
同一预设特征中大于第一预设阈值的特征值
、
同一预设特征中小于第二预设阈值的特征值
、
同一预设特征中的不同特征值的大小关系
、
使用第一预设数量的预设特征中特征值的联合计算
、
同一预设特征中大于第二预设数量的特征值的计算
、
同一预设特征中与其它特征值不同的特征值
、
同一预设特征中特征值的排序
。5.
根据权利要求3所述的方法,所述逻辑框架的构建过程,包括:将从所述预设特征对应的特征值中确定兴趣值的方式,确定为所述逻辑框架的第一层次逻辑;将所述兴趣值与所述账户标识关联的方式,确定为所述逻辑框架的第二层次逻辑;根据所述第一层次逻辑信息和
/
或所述第二层次逻辑信息,确定所述逻辑框架
。6.
根据权利要求5所述的方法,所述逻辑框架为树形结构,所述逻辑框架的构建过程,包括:分别将所述第一层次逻辑中的所述预设特征和所述预设特征对应的特征值在所述目
标结构化数据中的存放位置,作为所述树形结构中第一子节点的两个叶子节点,所述第一子节点为根据所述第一层次逻辑确定的兴趣值确定的节点;将所述第二层次逻辑中的所述账户标识作为所述树形结构的第二子节点;将所述第二层次逻...
【专利技术属性】
技术研发人员:陈中奇,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。