一种信息处理模型训练方法、装置及信息处理方法及装置制造方法及图纸

技术编号：46623219 阅读：0 留言：0更新日期：2025-10-14 21:18

本发明专利技术涉及一种信息处理模型训练方法、装置及信息处理方法及装置，所述训练方法包括：获取模型训练数据，所述模型训练数据包括用户的搜索数据和用户的推荐数据；构建训练数据集，所述训练数据集包括多个训练数据子集，每个训练数据子集包括搜索正样本、推荐正样本、搜索负样本和推荐负样本；构建多场景信息处理模型，所述多场景信息处理模型包括信息塔、搜索塔和推荐塔；以及以训练数据子集中的样本作为一次训练数据，迭代训练所述多场景信息处理模型，直到所述多场景信息处理模型满足评估要求为止。本发明专利技术能够应用信息搜索与推荐的数据协同效应，进而提高了信息处理的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种计算机数据处理，特别地涉及一种信息处理模型训练方法、装置及信息处理方法及装置。

技术介绍

1、随着互联网及计算机数据处理技术的发展，提供各种信息的信息平台也应运而生。所述的信息平台例如电商平台、招聘平台、生活信息平台、旅游信息平台、短期用工信息平台等等。信息平台的用户通常分为两类，一类是提供信息的用户，以下简称第一用户。一类是需求信息的用户，以下简称第二用户。第一用户通过信息平台发布信息，以下简称第一信息，如商品信息、招聘信息，各类生活信息、旅游线路信息等等。第二用户通过信息平台搜索满足其需求的信息，例如，作为消费者，第二用户通过电商平台查找并购买其所需要的商品；作为求职者，第二用户通过招聘平台查找企业发布的职位信息。而对于一些信息平台，第一用户和第二用户的身份可以互换。以招聘平台为例，招聘者和求职者都可以在招聘平台发布信息，招聘者发布职位招聘信息，求职者发布简历。招聘者通过招聘平台查找简历，求职者通过招聘平台查找职位信息。

2、推荐系统和搜索系统是信息平台中的两类基础且重要的系统。推荐系统在推荐场景根据当...

【技术保护点】

1.一种多场景信息处理模型训练方法，所述信息处理模型应用于特定信息平台，其中，所述多场景信息处理模型训练方法包括：

2.根据权利要求1所述的多场景信息处理模型训练方法，其中，以训练数据子集中的样本作为一次训练数据迭代训练所述多场景信息处理模型的一次训练过程包括：

3.根据权利要求2所述的多场景信息处理模型训练方法，其中，根据对应于所述训练数据子集中每个样本的相似度计算损失值时调整损失参数，以最大化正样本相似度和/或最小化负样本相似度。

4.根据权利要求1所述的多场景信息处理模型训练方法，其中，在以训练数据子集中的样本作为一次训练数据迭代训练所述多场景信...

【技术特征摘要】

1.一种多场景信息处理模型训练方法，所述信息处理模型应用于特定信息平台，其中，所述多场景信息处理模型训练方法包括：

4.根据权利要求1所述的多场景信息处理模型训练方法，其中，在以训练数据子集中的样本作为一次训练数据迭代训练所述多场景信息处理模型时，在将样本输入给所述多场景信息处理模型时，将搜索样本中的信息特征输入到信息塔的输入层，将搜索样本中的用户搜索特征输入到搜索塔的输入层，将推荐样本中的信息特征输入到信息塔的输入层，将推荐样本中的用户推荐特征输入到推荐塔的输入层；

5.根据权利要求4所述的多场景信息处理模型训练方法，其中，所述分词器为经过从所述信息平台收集的数据训练得到的分词器；所述预训练语言模型为经过从所述信息平台收集的数据预训练得到的模型。

6.根据权利要求1所述的多场景信息处理模型训练方法，其中，所述特定信息平台为招聘平台，所述用户为求职用户时，所述信息处理模型中的信息塔为职位塔，所述信息特征为职位特征，所述职位塔输出职位向量；

7.根据权利要求1所述的多场景信息处理模型训练方法，其中，构建训练数据集中的一个训练数据子集的步骤包括：

8.一种多场景信息处理方法，其应用于特定信息平台，所述特定信息平台包括第一用户和第二用户，其中，所述多场景信息处理方法包括：

<...

【专利技术属性】
技术研发人员：蔡令令，高飞，蔡致礼，
申请(专利权)人：前锦网络信息技术上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人