文档格式推荐模型训练方法、装置以及电子设备制造方法及图纸

技术编号：26762719 阅读：13 留言：0更新日期：2020-12-18 23:15

本申请公开了文档格式推荐模型训练方法、装置以及电子设备，涉及深度学习技术领域。具体实现方案为：获取训练样本，所述训练样本包括第一文档的文档分类，所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息；利用所述训练样本对基础网络模型进行训练，获取目标网络模型，所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。可通过目标网络模型为用户提供文档的文档格式的推荐顺序，便于用户方便快捷的获得所需要的文档格式的文档，提高所需文档格式的文档的获取效率。

全部详细技术资料下载

【技术实现步骤摘要】
文档格式推荐模型训练方法、装置以及电子设备
本申请涉及人工智能
中的深度学习技术，尤其涉及一种文档格式推荐模型训练方法、装置以及电子设备。
技术介绍
目前，用户常常需要在网络上下载文档资料，网络上提供的文档资料的格式可能不是用户所需要的格式，用户需要将文档下载到本地后，再运用文档格式转化工具进行格式转换，最终获取符合自身需求的文档格式类型。
技术实现思路
本公开提供了一种文档格式推荐模型训练方法、装置以及电子设备。根据本公开的第一方面，提供了一种文档格式推荐模型训练方法，包括：获取训练样本，所述训练样本包括第一文档的文档分类，所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息；利用所述训练样本对基础网络模型进行训练，获取目标网络模型，所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。根据本公开的第二方面，提供了一种文档格式推荐模型训练装置，包括：第一获取模块，用于获取训练样本，所述训练样本包括第一文档的文档分类，所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息；训练模块，用于利用所述训练样本对基础网络模型进行训练，获取目标网络模型，所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。根据本公开的第三方面，提供了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所...

【技术保护点】
1.一种文档格式推荐模型训练方法，包括：/n获取训练样本，所述训练样本包括第一文档的文档分类，所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息；/n利用所述训练样本对基础网络模型进行训练，获取目标网络模型，所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。/n

【技术特征摘要】
1.一种文档格式推荐模型训练方法，包括：
获取训练样本，所述训练样本包括第一文档的文档分类，所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息；
利用所述训练样本对基础网络模型进行训练，获取目标网络模型，所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。

2.根据权利要求1所述的方法，其中，所述第一文档的历史下载信息包括所述历史下载信息的时间区间，在所述时间区间内所述第一文档支持的各文档格式对应的下载次数，在所述时间区间内所述第一文档的转换文档格式以及所述转换文档格式的次数；
所述转换文档格式为对所述第一文档进行转换后，获得的文档格式。

3.根据权利要求1所述的方法，其中，在所述利用所述训练样本对基础网络模型进行训练，获取目标网络模型之后，还包括：
获取第二文档；
利用所述目标网络模型对所述第二文档进行预测，获得所述第二文档的文档格式的初始推荐顺序；
利用用户基于所述第二文档的所述初始推荐顺序的第一下载信息，对所述目标网络模型进行更新。

4.根据权利要求3所述的方法，其中，所述利用用户基于所述第二文档的所述初始推荐顺序的第一下载信息，对所述目标网络模型进行更新，包括：
对所述初始推荐顺序中文档格式的推荐顺序进行调整，获得所述第二文档的文档格式的新的推荐顺序；
获取用户基于所述初始推荐顺序的第一下载信息和所述新的推荐顺序的第二下载信息；
根据所述第一下载信息和所述第二下载信息，获得所述第二文档的文档格式的优选推荐顺序；
每隔预设时间，利用所述第一下载信息、所述第二下载信息和用户基于所述第二文档的所述优选推荐顺序的第三下载信息，对所述目标网络模型进行更新。

5.根据权利要求4所述的方法，其中，所述根据第一下载信息和所述第二下载信息，获得所述第二文档的文档格式的优选推荐顺序，包括：
获取针对所述初始推荐顺序，M个第一用户对所述第二文档的各个文档格式的第一下载信息，M为正整数；
获取针对所述新的推荐顺序，M个第二用户对所述第二文档的各个文档格式的第二下载信息；
根据所述第一下载信息和所述第二下载信息，对所述第二文档的文档格式的推荐顺序进行调整，获得所述第二文档的优选推荐顺序。

6.一种文档格式推荐模型训练装置，包括：
第一获取模块，用于获取训练样本，所述训练样本包括第一文档的文档分类，所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息；
训练模块，用于利用所述...

【专利技术属性】
技术研发人员：李嘉茜，邵世臣，李永恒，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人