【技术实现步骤摘要】
本专利技术涉及智能搜索,具体为基于大模型的关键词扩充与多信息融合数据要素搜索方法。
技术介绍
1、目前,从web产生以来,网络中信息量几乎是以几何级数的形式递增,近几年尤其明显,原因主要有两方面:一是web2.0的用户正在由单纯的信息消费者向生产者与消费者是的双重身份转变;二是deep web的发展,同时,信息的更新速度也在不断加快,研究表明,每星期将有25%的新链接产生;
2、搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统,因特网上的信息浩瀚万千,而且毫无秩序,所有的信息像汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为用户绘制一幅一目了然的信息地图,供用户随时查阅,
3、现有搜索引擎的工作原理以最简单的语言描述,即是:
4、搜集信息:首先通过一个称为网络蜘蛛的机器人程序来追踪互联网上每一个网页的超链接,由于互联网上每一个网页都不是单独存在的(必存在到其它网页的链接),然后这个机器人程序便由原始网页链接到其它网页,一链十,十链百,至此,网络蜘蛛便
...【技术保护点】
1.基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述S1中关键词扩充通过将用户输入的关键词与Prompt相结合,输入给大语言模型进行关键词扩充来完成。
3.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述S2中多信息融合根据用户ID将用户的专业、领域、方向、常搜索方向前五项提取出来,与扩充后的关键词和Prompt相结合,输入给大语言模型进行多信息融合。
4.根据权利要求1
...【技术特征摘要】
1.基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述s1中关键词扩充通过将用户输入的关键词与prompt相结合,输入给大语言模型进行关键词扩充来完成。
3.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述s2中多信息融合根据用户id将用户的专业、领域、方向、常搜索方向前五项提取出来,与扩充后的关键词和prompt相结合,输入给大语言模型进行多信息融合。
4.根据权利要求1所述的基于大模型的关键词扩充与多信息融合数据要素搜索方法,其特征在于:所述p-tuning技术将一些伪prompt输入至lstm中,然后利用lstm的输出向量替代原始pr...
【专利技术属性】
技术研发人员:田聪聪,林传文,王佐成,宾健冰,崔海鹰,高巨强,
申请(专利权)人:数据空间研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。