【技术实现步骤摘要】
本申请涉及计算机,特别是涉及一种相关度模型数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、随着计算机技术的发展,出现了人工智能(artificial intelligence, ai)技术,它是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。目前,可以通过人工智能技术来进行相关性判定,进行根据判定结果实现在搜索、推荐、相似度等业务应用场景下的相关数据处理。目前的相关性量化及预测主要采用基于分类的方法,将相关的样本设定为1,不相关的样本设定为0,利用交叉熵等损失函数,训练分类模型,判断样本是否与特定场景下目标相关,最终根据归一化的后概率值作为相关程度的量化得分,这种反复最终所得到的概率值并不能直接反应相关程度。
2、目前,为了精准识别出输入数据的相关度,可以通过人工标注的方式来对样本的相关度进行一一标注,进而构建出模型训练数据,完成对相关度模型的训练,然而这种模型训练方式,需要构造出大量带标注的相关度样本数据,因此在
...【技术保护点】
1.一种相关度模型数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述相对等级标记,得到所述相关性样本组中相关性样本之间的等级比较结果,构建带等级比较结果标记的样本对数据包括:
3.根据权利要求1所述的方法,其特征在于,所述通过所述样本对数据对预训练相关性识别模型进行微调训练,得到所述样本对数据的比较损失参数、相等损失参数和得分损失参数包括:
4.根据权利要求3所述的方法,其特征在于,所述等级比较结果标记包括相等标记和不等标记;
5.根据权利要求1所述的方法,其特征在于,所述方
<...【技术特征摘要】
1.一种相关度模型数据处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述相对等级标记,得到所述相关性样本组中相关性样本之间的等级比较结果,构建带等级比较结果标记的样本对数据包括:
3.根据权利要求1所述的方法,其特征在于,所述通过所述样本对数据对预训练相关性识别模型进行微调训练,得到所述样本对数据的比较损失参数、相等损失参数和得分损失参数包括:
4.根据权利要求3所述的方法,其特征在于,所述等级比较结果标记包括相等标记和不等标记;
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
6.根据权利要求1至5任意一项所述的方法,其特征在于,所述基于所述比较损失参数、所述相等损失参数和所述得分损失参数,对所述预训练相关性识别模型进行参数调整处理,得到目标相关度模型包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述比较损失参数、所述相等损失参数和所述得分损失参数,对所述预训练相关性识别模型中的可调参数进行参数调整处理,得到目标相关度模型包括:
【专利技术属性】
技术研发人员:康昇,汪翔,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。