基于机器学习的迁移数据确定方法、装置、设备及介质制造方法及图纸

技术编号:22387312 阅读:30 留言:0更新日期:2019-10-29 06:30
本发明专利技术公开了一种基于机器学习的迁移数据确定方法、装置、设备及介质,属于网络技术领域。包括:获取服务器分别向多个终端进行数据迁移的迁移过程数据;确定每个终端对应的个性化数据和每个终端的终端侧数据之间的相似度;基于相似度,确定多个终端的数据迁移性能指标;基于每个终端的数据迁移性能指标对待训练模型进行训练,获得迁移模型;响应于终端的迁移请求,基于迁移模型确定向终端迁移的数据。本发明专利技术通过获取服务器向多个终端进行数据迁移的迁移过程数据,基于机器学习对服务器侧的模型进行训练,获得针对于终端进行定制化的迁移模型,基于该迁移模型向终端高效迁移终端所需的数据,提高了迁移数据的准确性和效率,同时节省了大量人力。

Method, device, device and medium of migration data determination based on machine learning

【技术实现步骤摘要】
基于机器学习的迁移数据确定方法、装置、设备及介质
本专利技术涉及网络
,特别涉及一种基于机器学习的迁移数据确定方法、装置、计算机设备及存储介质。
技术介绍
目前,在特定的应用场景下,比如智能客服应用场景,该智能客服能够基于终端侧已有的用户对话记录分析出用户的特征,比如用户的兴趣、习惯以及语言模式等,当智能客服在与用户进行对话时,使得智能客服能够以符合用户的特征的方式与用户进行交互,实现智能客服的个性定制化。但是,由于终端侧所积累的用户对话记录的数据量非常小,无法对该智能客服进行训练,也就导致了智能客服无法以符合用户的特征的方式与用户进行交互。在这种背景下,为了解决上述问题,从服务器侧向终端迁移对应的数据对终端侧的模型进行训练的迁移技术应运而生,具体的,通过在服务器上将所有终端的终端侧数据进行匿名汇总之后,在服务器侧进行模型训练,获得多个通用模型,再通过人工匹配的方式,从多个通用模型中确定出符合终端需求的模型,再基于该模型向终端迁移相应的数据,以解决终端侧数据量小而无法实现智能客服训练的问题。在实现本专利技术的过程中,专利技术人发现上述迁移技术至少存在以下问题:由于在服务器侧所训本文档来自技高网...

【技术保护点】
1.一种基于机器学习的迁移数据确定方法,其特征在于,包括:获取服务器分别向多个终端进行数据迁移的迁移过程数据,所述迁移过程数据包括被迁移的个性化数据以及所述每个终端的终端侧数据;确定每个终端对应的个性化数据和所述每个终端的终端侧数据之间的相似度;基于所述相似度,确定多个终端的数据迁移性能指标;基于所述每个终端的数据迁移性能指标对待训练模型进行训练,获得迁移模型,所述迁移模型用于从所述服务器的通用数据中确定出待迁移的个性化数据;响应于终端的迁移请求,基于所述迁移模型确定向所述终端迁移的数据。

【技术特征摘要】
1.一种基于机器学习的迁移数据确定方法,其特征在于,包括:获取服务器分别向多个终端进行数据迁移的迁移过程数据,所述迁移过程数据包括被迁移的个性化数据以及所述每个终端的终端侧数据;确定每个终端对应的个性化数据和所述每个终端的终端侧数据之间的相似度;基于所述相似度,确定多个终端的数据迁移性能指标;基于所述每个终端的数据迁移性能指标对待训练模型进行训练,获得迁移模型,所述迁移模型用于从所述服务器的通用数据中确定出待迁移的个性化数据;响应于终端的迁移请求,基于所述迁移模型确定向所述终端迁移的数据。2.根据权利要求1所述的方法,其特征在于,所述确定每个终端对应的个性化数据和所述每个终端的终端侧数据之间的相似度包括:对所述每个终端对应的个性化数据和所述每个终端的终端侧数据进行非线性变换;确定所述每个终端的非线性变换后的个性化数据和终端侧数据之间的相似度。3.根据权利要求2所述的方法,其特征在于,所述确定所述每个终端的非线性变换后的个性化数据和终端侧数据之间的相似度包括:确定所述每个终端的非线性变换后的个性化数据和终端侧数据之间共有特征对应的数据;分别计算所述共有特征对应的数据的核距离、核距离的方差以及协方差;将所述共有特征对应的数据之间的核距离、核距离的方差以及协方差的加权值确定为所述相似度。4.根据权利要求3所述的方法,其特征在于,所述分别计算所述共有特征对应的数据的核距离、核距离的方差以及协方差包括:对所述共有特征对应的个性化数据与终端侧数据之间进行内积平方运算,获得共有特征对应的数据的核距离;构建任意两个共有特征对应的个性化数据与终端侧数据之间核距离的方差矩阵;将所述共有特征对应的数据的距离与所述核距离之间的差异值作为所述共有特征对应的数据的协方差。5.根据权利要求4所述的方法,其特征在于,所述构建任意两个共有特征对应的个性化数据与终端侧数据之间核距离的方差矩阵之后,还包括:基于所述核距离的方差矩阵,将所述共有特征对应的数据中方差值大于预设阈值的个性化数据和终端侧数据进行补偿。6...

【专利技术属性】
技术研发人员:魏颖黄俊洲
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1