文档格式推荐模型训练方法、装置以及电子设备制造方法及图纸

技术编号:26762719 阅读:13 留言:0更新日期:2020-12-18 23:15
本申请公开了文档格式推荐模型训练方法、装置以及电子设备,涉及深度学习技术领域。具体实现方案为:获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。可通过目标网络模型为用户提供文档的文档格式的推荐顺序,便于用户方便快捷的获得所需要的文档格式的文档,提高所需文档格式的文档的获取效率。

【技术实现步骤摘要】
文档格式推荐模型训练方法、装置以及电子设备
本申请涉及人工智能
中的深度学习技术,尤其涉及一种文档格式推荐模型训练方法、装置以及电子设备。
技术介绍
目前,用户常常需要在网络上下载文档资料,网络上提供的文档资料的格式可能不是用户所需要的格式,用户需要将文档下载到本地后,再运用文档格式转化工具进行格式转换,最终获取符合自身需求的文档格式类型。
技术实现思路
本公开提供了一种文档格式推荐模型训练方法、装置以及电子设备。根据本公开的第一方面,提供了一种文档格式推荐模型训练方法,包括:获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。根据本公开的第二方面,提供了一种文档格式推荐模型训练装置,包括:第一获取模块,用于获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;训练模块,用于利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。根据本公开的第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面任一项所述的方法。根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行第一方面任一项所述的方法。本申请的技术解决了用户不能下载到所需要的文档格式的文档,需要手动进行文档格式转换的问题。通过获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。可通过目标网络模型为用户提供文档的文档格式的推荐顺序,便于用户方便快捷的获得所需要的文档格式的文档,提高所需文档格式的文档的获取效率。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请实施例提供的文档格式推荐模型训练方法的流程图;图2是本申请实施例提供的文档格式推荐模型训练方法的另一流程图;图3是本申请实施例提供的文档格式推荐模型训练装置的结构图;图4是用来实现本申请实施例的文档格式推荐模型训练方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。参见图1,图1是本申请实施例提供的文档格式推荐模型训练方法的流程图,如图1所示,本实施例提供一种文档格式推荐模型训练方法,应用于电子设备,包括以下步骤:步骤101、获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息。第一文档可从供用户下载的文档数据库中获取,第一文档可包括多个文档,训练样本可理解为文档数据库中多个文档的整体统计数据。其中,文档分类可包括试卷类文档、汇报类文档、数据类文档、图纸类文档等。在确定第一文档的文档格式时,可根据第一文档的标题及摘要内容,通过语义分析工具来确定第一文档所属的文档分类,第一文档包括多个文档时,分别确定每个文档的文档分类,第一文档的文档分类即第一文档包括的各个文档的文档分类。文档格式可包括doc、docx、ppt、pptx、pps、pot、xls、xlsx、pdf、txt、vsd、epub、rtf、wps、et、dps和dwg等格式。历史下载信息是指根据用户对第一文档的历史下载情况确定的信息,例如,对第一文档的各文档格式的下载次数,第一文档的各文档格式被转换的次数等等。步骤102、利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。基础网络模型可为神经网络模型。利用训练样本对基础网络模型进行训练,获得目标网络模型,目标网络模型可用于对文档的文档格式的推荐顺序进行预测。例如,若目标文档的文档格式有doc、docx、ppt三种,利用目标网络模型对目标文档的文档格式的推荐顺序进行预测,获得的排序依次为ppt、doc、docx,则目标文档的ppt格式为优先推荐的文档格式。用户可直接通过点击推荐的文档格式对目标文档进行下载,获得对应的文档格式的目标文档,用户下载的文档格式即为其所需要的文档格式,避免下载的文档格式与用户的需求不一致,需要用户手动转换格式类型的问题。电子设备可以为手机、平板电脑、膝上型电脑、个人数字助理、移动上网装置或可穿戴式设备等。本实施例中,获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。可通过目标网络模型为用户提供文档的文档格式的推荐顺序,便于用户方便快捷的获得所需要的文档格式的文档,提高所需文档格式的文档的获取效率。在本申请一个实施例中,所述第一文档的历史下载信息包括所述历史下载信息的时间区间,在所述时间区间内所述第一文档支持的各文档格式对应的下载次数,在所述时间区间内所述第一文档的转换文档格式以及所述转换文档格式的次数;所述转换文档格式为对所述第一文档进行转换后,获得的文档格式。具体的,时间区间可为一周,一个月等等,或者时间区间为包括特定时间节点的时间区间,例如特定时间节点可为中考月、高考月、期末考月或者节假日等,具体可根据实际情况进行设置,在此不做限定。统计在时间区间内,第一文档支持的各文档格式对应的下载次数,例如,时间区间为一周,第一文档包括文档A和文档B,文档A对应的文档格式包括ppt、doc,文档B对应的文档格式包括docx、ppt,则统计出一周内,文档格式为ppt的文档A的下载次数为5次,文档格式为doc的文档A的下载次数为3次,文档格式为ppt的文档B的下载次数为6次,文档格式为docx的文档B的下载次数为3次,则在所述时间区间内所述第一文档支持的各文档格式对应的下载次数分别为:文档格式为ppt的文档的下载次数为11次本文档来自技高网...

【技术保护点】
1.一种文档格式推荐模型训练方法,包括:/n获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;/n利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。/n

【技术特征摘要】
1.一种文档格式推荐模型训练方法,包括:
获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;
利用所述训练样本对基础网络模型进行训练,获取目标网络模型,所述目标网络模型用于对文档的文档格式的推荐顺序进行预测。


2.根据权利要求1所述的方法,其中,所述第一文档的历史下载信息包括所述历史下载信息的时间区间,在所述时间区间内所述第一文档支持的各文档格式对应的下载次数,在所述时间区间内所述第一文档的转换文档格式以及所述转换文档格式的次数;
所述转换文档格式为对所述第一文档进行转换后,获得的文档格式。


3.根据权利要求1所述的方法,其中,在所述利用所述训练样本对基础网络模型进行训练,获取目标网络模型之后,还包括:
获取第二文档;
利用所述目标网络模型对所述第二文档进行预测,获得所述第二文档的文档格式的初始推荐顺序;
利用用户基于所述第二文档的所述初始推荐顺序的第一下载信息,对所述目标网络模型进行更新。


4.根据权利要求3所述的方法,其中,所述利用用户基于所述第二文档的所述初始推荐顺序的第一下载信息,对所述目标网络模型进行更新,包括:
对所述初始推荐顺序中文档格式的推荐顺序进行调整,获得所述第二文档的文档格式的新的推荐顺序;
获取用户基于所述初始推荐顺序的第一下载信息和所述新的推荐顺序的第二下载信息;
根据所述第一下载信息和所述第二下载信息,获得所述第二文档的文档格式的优选推荐顺序;
每隔预设时间,利用所述第一下载信息、所述第二下载信息和用户基于所述第二文档的所述优选推荐顺序的第三下载信息,对所述目标网络模型进行更新。


5.根据权利要求4所述的方法,其中,所述根据第一下载信息和所述第二下载信息,获得所述第二文档的文档格式的优选推荐顺序,包括:
获取针对所述初始推荐顺序,M个第一用户对所述第二文档的各个文档格式的第一下载信息,M为正整数;
获取针对所述新的推荐顺序,M个第二用户对所述第二文档的各个文档格式的第二下载信息;
根据所述第一下载信息和所述第二下载信息,对所述第二文档的文档格式的推荐顺序进行调整,获得所述第二文档的优选推荐顺序。


6.一种文档格式推荐模型训练装置,包括:
第一获取模块,用于获取训练样本,所述训练样本包括第一文档的文档分类,所述第一文档支持的多个文档格式以及所述第一文档的历史下载信息;
训练模块,用于利用所述...

【专利技术属性】
技术研发人员:李嘉茜邵世臣李永恒
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1