当前位置: 首页 > 专利查询>之江实验室专利>正文

文献检索方法、系统、计算机设备和存储介质技术方案

技术编号:45048491 阅读:24 留言:0更新日期:2025-04-22 17:34
本申请涉及一种文献检索方法、系统、计算机设备和存储介质,方法包括:提取训练数据的特征数据;构建至少一个优化损失函数,包括:根据特征域相同的特征数据之间的距离构建第一损失函数;根据特征域不同的特征数据之间的距离构建第二损失函数;将特征数据、扰动的特征数据输入编码器得到的第一压缩特征和第二压缩特征,根据第一压缩特征和第二压缩特征之间的距离构建第三损失函数;根据预测模型预测得到点击率的预测值、对应的真实值构建基础损失函数;根据至少一个优化损失函数和基础损失函数调整预测模型的参数;基于调整参数后的预测模型预测得到与目标用户请求关联的候选文献的点击率。采用本方法能够提高用户对文献点击率预测的准确性。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及文献检索方法、系统、计算机设备和存储介质


技术介绍

1、天文领域相关研究的快速发展,带来了天文科研文献数量的爆发式增长。据统计,主流天文期刊和预印本平台每年发表的论文数量已超过10万篇,且以年均15%的速度递增。这些文献不仅包含传统的文本内容,还包括大量的观测图像、光谱数据、射电数据等多模态科学数据。对天文工作者而言,如何从海量的文献中快速准确地找到与其研究方向相关的文献,并能够根据用户个性化数据实现有效的文献推荐,已成为一个亟待解决的难题。

2、当前的点击率预测方法以及对应的天文搜索推荐系统面临着较多问题,例如数据稀疏、特征稀疏和特征分布不均匀等问题,这些问题导致仅使用有监督学习的训练方法无法对特征表示进行充分的优化,限制了大部分模型取得更好的预测效果。而使用点击率预测模型作为排序模块的天文推荐搜索系统的效果也受到了限制。

3、针对相关技术中存在的文献点击率预测结果不准确的问题,目前还没有提出有效的解决方案。


技术实现思路

1、基于此,有必要针对上述技本文档来自技高网...

【技术保护点】

1.一种文献检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,构建至少一个优化损失函数,包括:

3.根据权利要求1所述的方法,其特征在于,构建至少一个优化损失函数,包括:

4.根据权利要求2或权利要求3所述的方法,其特征在于,计算特征域中的虚拟中心节点,包括:

5.根据权利要求1所述的方法,其特征在于,构建至少一个优化损失函数,包括:

6.根据权利要求1所述的方法,其特征在于,根据预测模型基于所述特征数据预测得到的点击率的预测值、与所述预测值对应的特征数据的真实值,构建用于训练预测模型的基础损失函数...

【技术特征摘要】

1.一种文献检索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,构建至少一个优化损失函数,包括:

3.根据权利要求1所述的方法,其特征在于,构建至少一个优化损失函数,包括:

4.根据权利要求2或权利要求3所述的方法,其特征在于,计算特征域中的虚拟中心节点,包括:

5.根据权利要求1所述的方法,其特征在于,构建至少一个优化损失函数,包括:

6.根据权利要求1所述的方法,其特征在于,根据预测模型基于所述特征数据预测得到的点击率的预测值、与所述预测值对应的特征数据的真实值,构建用于...

【专利技术属性】
技术研发人员:汪方野陆矜菁陆亚飞陈一家严笑然
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1