【技术实现步骤摘要】
本专利技术涉及大模型领域,特别公开了一种头部用户搜索词纠错方法、装置、设备及存储介质。
技术介绍
1、基于搜索引擎的中文关键字纠错系统是基于当前流行的搜索引擎所设计的一个用户帮助系统,它的主要功能是发现用户使用搜索引擎在输入关键字时可能发生的错误,并给向用户推荐可能正确的关键字。纠错系统使用分词与纠错并行处理的方法,可以纠正中文输入中可能出现的选字错误,注音错误和字形错误等常见错误。
2、传统的搜索词纠错方案一般是通过构建语料库来获得有效的平行语料进行纠错。但在一些垂直的搜索领域下,由于搜索词含有大量专有名词,传统的搜索词纠错方案直接进行应用可能存在难以直接获取平行语料对,搜索人名时出现拼音、字形都无法完全匹配的情况出现。为此目前也有了一些针对垂直搜索领域的搜索词纠错方案,但这些纠错方案需要依赖于历史数据来构建纠错词对,且在纠错出现错误时,仅能显示错误的纠错结果,无法满足用户的实际使用需求。
技术实现思路
1、本专利技术提供了一种头部用户搜索词纠错方法、装置、设备及存储介质,能
...【技术保护点】
1.一种头部用户搜索词纠错方法,其特征在于,包括:
2.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述M为5,N为1000;若头部用户搜索词的字数为3个字及以下,则阈值为0.43,若头部用户搜索词的字数为3个字以上,则阈值为0.7。
3.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述用户信息包括粉丝量、粉丝增量、近7日点击率。
4.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:
5.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:
6.根据权利要求
...【技术特征摘要】
1.一种头部用户搜索词纠错方法,其特征在于,包括:
2.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述m为5,n为1000;若头部用户搜索词的字数为3个字及以下,则阈值为0.43,若头部用户搜索词的字数为3个字以上,则阈值为0.7。
3.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,所述用户信息包括粉丝量、粉丝增量、近7日点击率。
4.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:
5.根据权利要求1所述的头部用户搜索词纠错方法,其特征在于,还包括:
6.根据权利要求...
【专利技术属性】
技术研发人员:陈鑫,邢东进,杨洪进,
申请(专利权)人:厦门蝉羽网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。