头部用户搜索词纠错方法、装置、设备及存储介质制造方法及图纸

技术编号:41265636 阅读:13 留言:0更新日期:2024-05-11 09:22
本发明专利技术公开了一种头部用户搜索词纠错方法、装置、设备及存储介质,方法包括:获取用户搜索词中,搜索词频大于M,且词频排序在N以上的头部用户搜索词;对头部用户搜索词,计算其与其他头部用户搜索词的文字编辑距离及拼音编辑距离;根据文字编辑距离、拼音编辑距离及阈值,判断任意两个头部用户搜索词是否相关,并对相关的头部用户搜索词进行聚类;根据N个头部用户搜索词进行用户搜索,并记录搜索的头部用户的用户信息;根据用户信息,向每个聚类设置一个主用户,得到最终聚类结果,即纠错词对;将纠错词对应用到用户环境中,根据纠错词对每天被点击的情况,调节所述阈值及搜词词频,并上传到用户环境的纠错词对,以进行头部用户的搜索词纠错。

【技术实现步骤摘要】

本专利技术涉及大模型领域,特别公开了一种头部用户搜索词纠错方法、装置、设备及存储介质


技术介绍

1、基于搜索引擎的中文关键字纠错系统是基于当前流行的搜索引擎所设计的一个用户帮助系统,它的主要功能是发现用户使用搜索引擎在输入关键字时可能发生的错误,并给向用户推荐可能正确的关键字。纠错系统使用分词与纠错并行处理的方法,可以纠正中文输入中可能出现的选字错误,注音错误和字形错误等常见错误。

2、传统的搜索词纠错方案一般是通过构建语料库来获得有效的平行语料进行纠错。但在一些垂直的搜索领域下,由于搜索词含有大量专有名词,传统的搜索词纠错方案直接进行应用可能存在难以直接获取平行语料对,搜索人名时出现拼音、字形都无法完全匹配的情况出现。为此目前也有了一些针对垂直搜索领域的搜索词纠错方案,但这些纠错方案需要依赖于历史数据来构建纠错词对,且在纠错出现错误时,仅能显示错误的纠错结果,无法满足用户的实际使用需求。


技术实现思路

1、本专利技术提供了一种头部用户搜索词纠错方法、装置、设备及存储介质,能至少部分的改善上述问本文档来自技高网...

【技术保护点】

1.一种头部用户搜索词纠错方法,其特征在于,包括:

2.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述M为5,N为1000;若头部用户搜索词的字数为3个字及以下,则阈值为0.43,若头部用户搜索词的字数为3个字以上,则阈值为0.7。

3.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述用户信息包括粉丝量、粉丝增量、近7日点击率。

4.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:

5.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:

6.根据权利要求1所述的头部用户搜索...

【技术特征摘要】

1.一种头部用户搜索词纠错方法,其特征在于,包括:

2.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述m为5,n为1000;若头部用户搜索词的字数为3个字及以下,则阈值为0.43,若头部用户搜索词的字数为3个字以上,则阈值为0.7。

3.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述用户信息包括粉丝量、粉丝增量、近7日点击率。

4.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:

5.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:

6.根据权利要求...

【专利技术属性】
技术研发人员:陈鑫邢东进杨洪进
申请(专利权)人:厦门蝉羽网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1