【技术实现步骤摘要】
一种数据处理方法、装置、设备以及可读存储介质
[0001]本申请涉及计算机
,尤其涉及一种数据处理方法、装置、设备以及可读存储介质。
技术介绍
[0002]随着人工智能(Artificial Intelligence,AI)的飞速发展,多种多样的智能应用(或理解为智能系统,例如智能咨询系统、智能清洁系统等等)大大方便了日常生活。对于大部分智能系统(如智能咨询系统),由于系统版本的更新或者其他原因,通常都涉及到数据迁移业务,数据迁移主要是指将某个数据存储位置中所存储的数据,同步至另一个数据存储位置(如,将历史版本的系统中所存储的数据,同步至新版本的系统中)。
[0003]目前,对于智能系统的数据迁移业务,主要为将所有的全量数据一次性打包迁移,这种全量打包迁移的方式,由于数据量庞大且杂乱,部分数据在迁移过程中极易出现丢失的情况,影响数据迁移准确性;同时,当存在数据丢失的问题时,由于数据并未完全迁移,所以需要对全量数据进行遍历,以查找所丢失的数据,然后将丢失的数据再次进行全量迁移,这无疑会消耗大量的时间,影响数据迁移 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取针对历史系统的第一咨询树;所述第一咨询树基于历史系统数据所构建得到;所述第一咨询树用于基于层级存储方式存储所述历史系统数据中的咨询机器人、属于所述咨询机器人的第一咨询主题以及属于所述第一咨询主题的第一问答信息之间的从属关系;所述历史系统数据是指历史系统的使用数据;获取针对目标系统的第二咨询树;所述第二咨询树基于目标系统数据构建得到;所述第二咨询树用于基于所述层级存储方式存储所述目标系统数据中的所述咨询机器人、属于所述咨询机器人的第二咨询主题以及属于所述第二咨询主题的第二问答信息之间的从属关系;所述目标系统数据是指目标系统的使用数据;所述目标系统的系统上线时刻晚于所述历史系统的系统上线时刻;基于所述第一咨询树与所述层级存储方式所指示的层级顺序,依次对所述第二咨询树中的所述第二咨询主题以及所述第二问答信息进行数据对齐处理,得到对齐咨询树;所述对齐咨询树所存储的数据与所述第一咨询树所存储的数据相同。2.根据权利要求1所述的方法,其特征在于,所述获取针对历史系统的第一咨询树,包括:创建用于存储所述咨询机器人的第一根节点、用于存储所述第一咨询主题的第一父节点以及用于存储所述第一问答信息的第一子节点;基于所述咨询机器人与所述第一咨询主题之间的从属关系,将所述第一根节点与所述第一父节点进行连接,得到第一连接边;基于所述第一咨询主题与所述第一问答信息之间的从属关系,将所述第一父节点与所述第一子节点进行连接,得到第二连接边;将包含所述第一根节点、所述第一父节点、所述第一子节点、所述第一连接边以及所述第二连接边的树,确定为所述第一咨询树。3.根据权利要求2所述的方法,其特征在于,所述第一咨询主题的数量为至少两个,用于存储所述第一咨询主题的第一父节点的数量为至少两个;所述第一问答信息的数量为至少两个;用于存储所述第一问答信息的第一子节点的数量为至少两个;至少两个第一咨询主题包括第一咨询主题Z
i
,至少两个第一父节点包括用于存储所述第一咨询主题Z
i
的第一父节点T
i
,i为正整数;所述基于所述第一咨询主题与所述第一问答信息之间的从属关系,将所述第一父节点与所述第一子节点进行连接,得到第二连接边,包括:在至少两个第一问答信息中,获取属于所述第一咨询主题Z
i
的第一问答信息,将属于所述第一咨询主题Z
i
的第一问答信息确定为所述第一咨询主题Z
i
的专属问答信息;将用于存储所述第一咨询主题Z
i
的专属问答信息的第一子节点,确定为第一咨询主题Z
i
的专属子节点;将用于存储所述第一咨询主题Z
i
的第一父节点T
i
,与所述专属子节点进行连接,得到所述第一咨询主题Z
i
对应的专属连接边;当确定出所述至少两个第一咨询主题中,每个第一咨询主题分别对应的专属连接边时,将所述每个第一咨询主题分别对应的专属连接边均确定为所述第二连接边。4.根据权利要求1所述的方法,其特征在于,所述基于所述第一咨询树与所述层级存储
方式所指示的层级顺序,对所述第二咨询树中的所述第二咨询主题以及所述第二问答信息进行数据对齐处理,得到对齐咨询树,包括:基于所述第一咨询树与所述第二咨询树构建全量差异树;所述全量差异树用于基于所述层级存储方式,存储所述咨询机器人、所述第一咨询主题、所述第二咨询主题、所述第一问答信息以及所述第二问答信息之间的关联关系;根据所述层级存储方式所指示的层级顺序以及所述全量差异树,对所述第二咨询树中的所述第二咨询主题以及所述第二问答信息进行数据对齐处理,得到对齐咨询树。5.根据权利要求4所述的方法,其特征在于,所述第一咨询树中包括第一根节点、第一父节点集合与第一子节点集合,所述第一父节点集合中的一个第一父节点用于存储一个第一咨询主题;所述第一子节点集合中的一个第一子节点用于存储一个第一问答信息;一个第一父节点与所述第一子节点集合中的N个第一子节点存在连接关系;所述第二咨询树中包括第二根节点、第二父节点集合与第二子节点集合,所述第二父节点集合中的一个第二父节点用于存储一个第二咨询主题;所述第二子节点集合中的一个第二子节点用于存储一个第二咨询主题;一个第二父节点与所述第二子节点集合中的M个第二子节点存在连接关系;所述第一根节点与所述第二根节点均用于存储所述咨询机器人;N、M均为自然数;所述基于所述第一咨询树与所述第二咨询树构建全量差异树,包括:将所述第一父节点集合与所述第二父节点集合进行并集处理,将并集处理得到的集合确定为融合父节点集合;根据所述第一咨询树中所述第一父节点集合与所述第一子节点集合之间的连接关系、所述第二咨询树中所述第二父节点集合与第二子节点集合之间的连接关系,在所述第一子节点集合与所述第二子节点集合中,确定所述融合父节点集合中每个融合父节点分别对应的划分子节点集合;根据所述第一咨询树、所述第二咨询树、所述融合父节点集合以及所述每个融合父节点分别对应的划分子节点集合,构建所述全量差异树。6.根据权利要求5所述的方法,其特征在于,所述融合父节点集合包含融合父节点S
a
,a为正整数;所述根据所述第一咨询树中所述第一父节点集合与所述第一子节点集合之间的连接关系、所述第二咨询树中所述第二父节点集合与第二子节点集合之间的连接关系,在所述第一子节点集合与所述第二子节点集合中,确定所述融合父节点集合中每个融合父节点分别对应的划分子节点集合,包括:根据所述第一父节点集合与所述第一子节点集合之间的连接关系,在所述第一子节点集合中,确定与所述融合父节点S
a
具有连接关系的第一子节点,将所述与所述融合父节点S
a
具有连接关系的第一子节点确定为第一待划分子节点;根据所述第二父节点集合与所述第二子节点集合之间的连接关系,在所述第二子节点集合中,确定与所述融合父节点S
a
具有连接关系的第二子节点,将所述与所述融合父节点S
a
具有连接关系的第二子节点确定为第二待划分子节点;将所述第一待划分子节点与所述第二待划分子节点进行并集处理,将并集处理得到的集合确定为融合父节点S
i
对应的划分子节点集合。7.根据权利要求6所述的方法,其特征在于,所述融合父节点集合中包括融合父节点S
a
;
所述融合父节点S
a
对应的划分子节点集合中包括划分子节点K
b
,a、b均为正整数;所述根据所述第一咨询树、所述第二咨询树、所述融合父节点集合以及所述每个融合父节点分别对应的划分子节点集合,构建所述全量差异树,包括:分别遍历所述第一咨询树中的所述第一父节点集合,以及所述第二咨询树中的所述第二父节点集合,得到第一遍历结果,根据所述第一遍历结果确定所述融合父节点S
a
对应的对齐状态;分别遍历所述第一咨询树中的所述第一子节点集合,以及所述第二咨询树中的所述第二子节点集合,得到第二遍历结果,根据所述第二遍历结果确定所述划分子节点K
b
对应的对齐状态;当确定出每个融合父节点分别对应的对齐状态,以及每个划分子节点分别对应的对齐状态时,构建用于存储所述咨询机器人的根节点,根据所述根节点、所述融合父节点集合、所述每个融合父节点分别对应的划分子节点集合、所述每个融合父节点分别对应的对齐状态,以及所述每个划分子节点分别对应的对齐状态的树,确定所述全量差异树。8.根据权利要求7所述的方法,其特征在于,所述根据所述第一遍历结果确定所述融合父节点S
a
对应的对齐状态,包括:若所述第一遍历结果为所述第一父节点集合中存在所述融合父节点S
a
...
【专利技术属性】
技术研发人员:高力量,李斌,朱标亦,潘唐磊,曾楚伟,
申请(专利权)人:广州腾讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。