基于大模型的关键词扩充与多信息融合数据要素搜索方法技术

技术编号:40257363 阅读:26 留言:0更新日期:2024-02-02 22:49
本发明专利技术涉及智能搜索技术领域,公开了基于大模型的关键词扩充与多信息融合数据要素搜索方法,包括以下步骤:S 1、根据用户输入的关键词,利用大语言模型扩充关键词;S2、搜索引擎调用用户在平台上的身份信息,将用户背景信息与搜索词相融合;S3、通过向量化模型进优化后的关键词生成特征向量,并计算与向量数据库里的待匹配资料之间的相似度。本发明专利技术通过大语言模型技术与向量搜索技术,通过关键词扩充机制、多信息融合机制两大关键技术,实现根据不同领域、背景、需求反馈给用户不同内容的搜索结果,从而形成个性化的搜索引擎,大大提高搜索体验。

【技术实现步骤摘要】

本专利技术涉及智能搜索,具体为基于大模型的关键词扩充与多信息融合数据要素搜索方法


技术介绍

1、目前,从web产生以来,网络中信息量几乎是以几何级数的形式递增,近几年尤其明显,原因主要有两方面:一是web2.0的用户正在由单纯的信息消费者向生产者与消费者是的双重身份转变;二是deep web的发展,同时,信息的更新速度也在不断加快,研究表明,每星期将有25%的新链接产生;

2、搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统,因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅,

3、现有搜索引擎的工作原理以最简单的语言描述,即是:

4、搜集信息:首先通过一个称为网络蜘蛛的机器人程序来追踪互联网上每一个网页的超链接,由于互联网上每一个网页都不是单独存在的(必存在到其它网页的链接),然后这个机器人程序便由原始网页链接到其它网页,一链十,十链百,至此,网络蜘蛛便爬满了绝大多数网页;本文档来自技高网...

【技术保护点】

1.基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述S1中关键词扩充通过将用户输入的关键词与Prompt相结合,输入给大语言模型进行关键词扩充来完成。

3.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述S2中多信息融合根据用户ID将用户的专业、领域、方向、常搜索方向前五项提取出来,与扩充后的关键词和Prompt相结合,输入给大语言模型进行多信息融合。

4.根据权利要求1所述的基于大模型的关...

【技术特征摘要】

1.基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述s1中关键词扩充通过将用户输入的关键词与prompt相结合,输入给大语言模型进行关键词扩充来完成。

3.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述s2中多信息融合根据用户id将用户的专业、领域、方向、常搜索方向前五项提取出来,与扩充后的关键词和prompt相结合,输入给大语言模型进行多信息融合。

4.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述p-tuning技术将一些伪prompt输入至lstm中,然后利用lstm的输出向量替代原始pr...

【专利技术属性】
技术研发人员:田聪聪林传文王佐成宾健冰崔海鹰高巨强
申请(专利权)人:数据空间研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1