【技术实现步骤摘要】
本申请涉及计算机,尤其涉及一种搜索方法、装置、电子设备及存储介质。
技术介绍
1、相关技术中,信息搜索系统主要基于用户输入的搜索词和系统内部的内容进行匹配,匹配得分较高的内容会返回给用户。目前对搜索词的处理方式主要有以下几种:
2、第一:分词,将搜索词通过分词技术,切分为多个词语。
3、第二:词权重,通过自然语言处理技术,计算多个词的重要程度,有些冗余词的重要性会很低。在找相关内容时,词权重低的词作用可以忽略不计。
4、第三:纠错,如果用户输入的检索词存在语法错误或者错别字,搜索系统会进行纠错,帮助用户使用正确的词语进行检索。
5、然而,现在的搜索词理解技术中,如果用户输入的搜索词很短,则可能导致难以获得较为全面的搜索结果。
技术实现思路
1、鉴于此,为解决上述部分或全部技术问题,本申请实施例提供一种搜索方法、装置、电子设备及存储介质。
2、第一方面,本申请实施例提供一种搜索方法,所述方法包括:
3、获取搜索词,以及从
...【技术保护点】
1.一种搜索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述搜索词的扩展词,包括:
3.根据权利要求1所述的方法,其特征在于,所述确定所述搜索词的扩展词,包括:
4.根据权利要求3所述的方法,其特征在于,所述大型语言模型采用如下方式训练获得:
5.根据权利要求4所述的方法,其特征在于,所述训练样本集合采用如下方式确定:
6.根据权利要求4所述的方法,其特征在于,所述对预训练的大型语言模型进行微调,包括:
7.根据权利要求1-6之一所述的方法,其特征在于,所述
...【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述确定所述搜索词的扩展词,包括:
3.根据权利要求1所述的方法,其特征在于,所述确定所述搜索词的扩展词,包括:
4.根据权利要求3所述的方法,其特征在于,所述大型语言模型采用如下方式训练获得:
5.根据权利要求4所述的方法,其特征在于,所述训练样本集合采用如下方式确定:
6.根据权利要求4所述的方法,其特征在于,...
【专利技术属性】
技术研发人员:申利彬,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。