一种搜索方法、装置及存储介质制造方法及图纸

技术编号:22076009 阅读:21 留言:0更新日期:2019-09-12 14:14
本发明专利技术实施例公开了一种搜索方法和装置,其中搜索方法包括:将样本数据集结合卷积神经网络进行训练,获得目标模型,样本数据集根据当前搜索用户的历史搜索记录获取;获取当前搜索关键字,将当前搜索关键字输入目标模型中,得到多个当前搜索特征;将多个当前搜索特征采用二类分类算法进行分类排序,并根据多个当前搜索特征的排序确定当前搜索关键字对应的当前搜索结果。采用本发明专利技术,能够通过将当前搜索关键字输入目标模型中,获得当前搜索特征,然后对搜索特征进行分类排序,确定搜索结果,这个过程中避免了手动获取搜索特征的过程,简化了搜索过程,提升了搜索效率。

A search method, device and storage medium

【技术实现步骤摘要】
一种搜索方法、装置及存储介质
本专利技术涉及数据处理领域,具体涉及一种搜索方法、装置及存储介质。
技术介绍
个性化搜索是指基于用户之前的搜索记录为其定制搜索结果。通过个性化搜索可以根据用户的历史搜索记录、历史浏览情况、点击情况或交互行为,为用户的下一次搜索行为提供搜索结果。在这个过程中,采用传统的个性化搜索方法,需要手动提取适合个性化搜索行为的特征,但是针对不同领域的搜索行为特征的提取需要花费大量的时间,并且需要大量的相关领域的经验,这使得在获取搜索结果时需要耗费大量的时间成本和运算成本,亟待发现一种优化方法以便更高效地进行个性化搜索。
技术实现思路
本专利技术实施例提供一种搜索方法、装置及存储介质,能够通过将当前搜索关键字输入目标模型中,获得当前搜索特征,然后对搜索特征进行分类排序,确定搜索结果,这个过程中避免了手动获取搜索特征的过程,简化了搜索过程,提升了搜索效率。本专利技术实施例的第一方面提供了一种搜索方法,所述方法包括:将样本数据集结合卷积神经网络进行训练,获得目标模型,所述样本数据集根据当前搜索用户的历史搜索记录获取;获取当前搜索关键字,将所述当前搜索关键字输入所述目标模型中,得到多个当前搜索特征;将所述多个当前搜索特征采用二类分类算法进行分类排序,并根据所述多个当前搜索特征的排序确定所述当前搜索关键字对应的当前搜索结果。本专利技术实施例的第二方面提供了一种搜索装置,所述搜索装置包括:训练单元,用于将样本数据集结合卷积神经网络进行训练,获得目标模型,,所述样本数据集根据当前搜索用户的历史搜索记录获取;获取单元,用于获取当前搜索关键字,将所述当前搜索关键字输入所述目标模型中,得到多个当前搜索特征;搜索单元,用于将所述多个当前搜索特征采用二类分类算法进行分类排序,并根据所述多个当前搜索特征的排序确定所述当前搜索关键字对应的当前搜索结果。本专利技术实施例第三方面提供了一种电子装置,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行第一方面任一方法中的步骤的指令。本专利技术实施例第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其中,所述计算机程序被处理器执行以实现第一方面任一方法所述的步骤的指令。本申请实施例中提供的搜索方法和装置,首先将样本数据集结合卷积神经网络进行训练,获得目标模型;然后获取当前搜索关键字,将搜索方法当前搜索关键字输入搜索方法目标模型中,得到多个当前搜索特征;最后将搜索方法多个当前搜索特征采用二类分类算法进行分类排序,并根据搜索方法多个当前搜索特征的排序确定搜索方法当前搜索关键字对应的当前搜索结果。因为搜索方法样本数据集根据当前搜索用户的历史搜索记录获取的,因此目标模型是当前搜索用户对应的个性化目标模型,将当前搜索关键字输入目标模型后,可以自动提取出多个当前搜索特征而不需要人工参与,简化了特征获取的步骤,提升了特征获取的效率,最后将多个当前搜索特征进行分类排序获得当前搜索结果,提升了搜索效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1A为本专利技术实施例提供的一种搜索方法流程示意图;图1B本申请实施例提供的一种卷积神经网络结构示意图;图2为本专利技术实施例提供的另一种搜索方法的流程示意图;图3为本专利技术实施例提供的另一种搜索方法的流程示意图;图4为本专利技术实施例提供的另一种搜索方法的流程示意图;图5为本专利技术实施例提供的一种电子装置的结构示意图;图6为本专利技术实施例提供的一种搜索装置的结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本专利技术的至少一个实施例中。在说明书中的各个位置展示该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。下面对本专利技术实施例进行详细介绍。请参阅图1A,图1A为本专利技术实施例中一种搜索方法流程示意图,如图1A所示,所述搜索方法包括:101、将样本数据集结合卷积神经网络进行训练,获得目标模型,所述样本数据集根据当前搜索用户的历史搜索记录获取。用户在进行搜索的过程中,将产生一系列的历史搜索记录,包括用户在搜索界面输入的搜索关键字,根据搜索关键字获得的搜索结果,用户点击搜索页面的概率、次数,用户点击链接的路线,在每个页面停留的时间,在页面是否进行消费、评论等互动行为等。收集这些历史搜索记录,然后进行预处理或向量化,即可作为样本数据集,用于进行卷积神经网络运算,训练出目标模型,用于进行后续的搜索任务。请参阅图1B,图1B为本申请实施例提供的一种卷积神经网络的结构示意图,卷积神经网络的训练过程中,采用反向传播算法和随机梯度下降方法,根据前向传播的loss值的大小,来进行反向传播迭代更新每一层的权重,直到模型的loss值趋向于收敛时,停止训练模型,得到深度学习模型。如图1B所示,卷积神经网络中包括卷积层、池化层和全连接层,经过不同层对样本数据集的训练,获得卷积神经网络中的参数,得出目标模型,即为样本数据集对应的目标模型。样本数据集为用户历史搜索记录,将历史输入关键字作为输入值,将历史搜索结果作为输出值,对历史搜索行为结合卷积神经网络进行特征提取,进而训练出历史搜索记录对应的目标模型。可选的,在将样本数据集结合卷积神经网络进行训练之前,所述方法还包括:根据当前搜索用户的历史搜索记录采集样本数据,历史搜索记录包括历史输入关键字,历史搜索行为,历史搜索结果;对样本数据进行预处理,得到清洁样本数据;对清洁样本数据进行向量化,得到文本向量数据,文本向量数据组成样本数据集。具体地,用户的历史搜索记录是多种多样的,包括搜索关键字,搜索行为,搜索结果等,这些数据的种类繁多,并不能直接用于进行目标模型的训练。因此首先要对这些数据进行标准化。标准化的方法包括预处理和向量化,其中,因为搜索过程中涉及的都是网页,而网页中包括大量文本内容,因此涉及文本的预处理和向量化。文本的预处理方法包括分词,取出停用词,过滤低频词,编码归一化等;文本向量化即使用向量空间模型VSM或者概率统计模型对文本进行表示,使计算机能够理解计算,用的方法基于集合论模型、基于代数轮模型、基于频率统计模型等等。此外,除了对网页的标准化,还包括对搜索行为的标准化,例如根据用户点击搜索页面的概率、次数,确定网页的搜索有效性,根据用户在搜索页面停留的时间,在页面是否进行消费、评论等互动行为,确定用户对网页的满意度等。可选的,对清洁样本数据进行向量化,得到文本向量数据,包括:获取清洁样本数据对应的样本文本;对样本文本本文档来自技高网...

【技术保护点】
1.一种搜索方法,其特征在于,所述方法包括:将搜索用户的样本数据集结合卷积神经网络进行训练,获得目标模型,所述样本数据集根据所述搜索用户的历史搜索记录获取;获取当前搜索关键字,将所述当前搜索关键字输入所述目标模型中,得到多个当前搜索特征;将所述多个当前搜索特征采用二类分类算法进行分类排序,并根据所述多个当前搜索特征的排序确定所述当前搜索关键字对应的当前搜索结果。

【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括:将搜索用户的样本数据集结合卷积神经网络进行训练,获得目标模型,所述样本数据集根据所述搜索用户的历史搜索记录获取;获取当前搜索关键字,将所述当前搜索关键字输入所述目标模型中,得到多个当前搜索特征;将所述多个当前搜索特征采用二类分类算法进行分类排序,并根据所述多个当前搜索特征的排序确定所述当前搜索关键字对应的当前搜索结果。2.根据权利要求1所述的方法,其特征在于,所述将所述当前搜索关键字输入所述目标模型中,得到多个当前搜索特征,包括:将所述当前搜索关键字进行语义分析,得到至少一个目标分词;将所述多个目标分词输入所述目标模型,进行一次或多次卷积运算;获取最后一次卷积运算的特征作为所述多个目标分词对应的多个当前搜索特征。3.根据权利要求2所述的方法,其特征在于,所述二类分类算法为支持向量机SVM算法,所述将所述多个当前搜索特征采用二类分类算法进行分类排序,包括:将所述多个当前搜索特征中的每两个当前搜索特征进行成对组合,获得多个特征组;对所述多个特征组中的每个特征组采用SVM算法进行评分排序,确定所述每个特征组中的两个当前搜索特征的相对大小;根据所述每个特征组中的两个当前搜索特征的相对大小确定所述多个当前搜索特征的排序。4.根据权利要求1所述的方法,其特征在于,在将样本数据集结合卷积神经网络进行训练之前,所述方法还包括:根据当前搜索用户的历史搜索记录采集样本数据,所述历史搜索记录包括历史输入关键字,历史搜索行为,历史搜索结果;对所述样本数据进行预处理,得到清洁样本数据;对所述清洁样本数据进行向量化,得到文本向量数据,所述文本向量数据组成所述样本数据集。5.根据权利要求4所述的方法,其特征在于,所述对所述...

【专利技术属性】
技术研发人员:刘利
申请(专利权)人:深圳壹账通智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1