【技术实现步骤摘要】
搜索方法、终端、电子设备以及可读存储介质
[0001]本申请涉及终端检索
,特别是涉及一种搜索方法、终端、电子设备以及可读存储介质。
技术介绍
[0002]通常,在端侧的搜索场景中,由于计算资源的限制,而用户又有快速获取所搜索信息的需要,因而需要设备上的应用程序能够根据用户查询(query)快速精确的判断出用户检索的意图,进而将端侧设备计算资源集中在用户所需信息的检索中。
[0003]一般来说,端侧意图识别的主流方法是配置高频query的意图词典,如果用户的query命中词典,就能获取对应query的意图;如果没有命中query的词典,则认为用户对所有的信息都要检索。还有一些方案会在服务器端部署相应的意图识别模型,终端通过网络将用户query发送到服务器端,利用服务器的计算资源对用户意图进行识别后在发送到终端搜索。
[0004]目前,为了尽快地准确地获取检索结果,往往采用配置意图词典对用户查询进行检索,然而词典中的词组与查询的文本往往一一对应,通常是人工罗列而且人工罗列也无法覆盖所有口语化表达,这容易导 ...
【技术保护点】
【技术特征摘要】
1.一种搜索方法,其特征在于,应用于终端设备,所述方法包括:获取文本信息;将所述文本信息输入至预先训练的文本分类器,以得到对应的分类结果;将所述文本信息与所述分类结果对应的标签模板进行匹配,以得到所述文本信息对应的标签信息;将所述文本信息、以及对应的分类结果和标签信息,发送至所述终端设备的搜索引擎,以使基于所述搜索引擎对所述文本信息、以及对应的分类结果和标签信息进行搜索,得到对应的搜索结果。2.根据权利要求1所述的方法,其特征在于,在所述将所述文本信息输入至预先训练的文本分类器,以得到对应的分类结果之前,所述方法还包括:对待训练的文本信息进行数据清洗和数据增强,得到增强后的文本信息;对所述增强后的文本信息进行分词,得到多个字或词,其中每个字对应词典中的一个id;采用多个字或词对所述文本分类器的参数进行训练,得到更新后的权重参数,所述文本分类器至少包括text CNN模型。3.根据权利要求2所述的方法,其特征在于,所述采用多个字或词对所述文本分类器的权重参数进行训练,得到更新后的权重参数,包括:采用词嵌入的方式,按照预设维度对多个字或词进行数值转换,得到转换的数值;基于梯度下降法的迭代,将所述转换的数值经预设函数进行参数训练,所述参数至少包括嵌入矩阵的参数和卷积网络的参数;通过软件接口,将所述训练后的参数固化入所述终端,以形成所述预先训练的文本分类器。4.根据权利要求3所述的方法,其特征在于,所述预设函数为:其中,t是时间,W
t
为上一次的参数权重,W
t+1
为这一次的参数权重,α为学习率,Loss为...
【专利技术属性】
技术研发人员:曹俊年,
申请(专利权)人:OPPO广东移动通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。