【技术实现步骤摘要】
信息流搜索方法、装置及设备
[0001]本申请涉及人工智能
,尤其涉及机器学习
,提供一种信息流搜索方法、装置及设备。
技术介绍
[0002]随着互联网的不断发展,逐渐出现了各类内容服务平台,例如,新闻服务平台,部分新闻服务平台可以根据当前发生的热点事件,向用户及时推送热点新闻。但在新闻服务平台上已发布的热点新闻较多,如何从大量的热点新闻中快速为用户提供符合其需求的热点新闻是亟需解决的技术问题。
技术实现思路
[0003]本申请实施例提供一种信息流搜索方法、装置及设备,用于提高搜索的信息流内容的速度。
[0004]一方面,本申请实施例提供了一种信息流搜索方法,包括:获取搜索关键字;确定与所述搜索关键字匹配的信息流描述文本;所述信息流描述文本用于对相应的信息流标题集合中信息流标题所对应信息流内容进行描述;获取与所述信息流描述文本对应的信息流标题集合;基于所述信息流标题集合中信息流标题,拉取信息流内容;展示拉取到的信息流内容作为所述搜索关键字匹配的搜索结果。
[0005]一方面,本申请 ...
【技术保护点】
【技术特征摘要】
1.一种信息流搜索方法,其特征在于,包括:获取搜索关键字;确定与所述搜索关键字匹配的信息流描述文本;所述信息流描述文本用于对相应的信息流标题集合中信息流标题所对应信息流内容进行描述;获取与所述信息流描述文本对应的信息流标题集合;基于所述信息流标题集合中信息流标题,拉取信息流内容;展示拉取到的信息流内容作为所述搜索关键字匹配的搜索结果。2.如权利要求1所述的方法,其特征在于,所述确定与所述搜索关键字匹配的信息流描述文本之前,所述方法还包括:针对各个目标事件,分别执行以下操作:获取所述各个目标事件中一个目标事件对应的各个信息流标题;基于所述各个信息流标题,确定所述一个目标事件对应的信息流描述文本;所述确定与所述搜索关键字匹配的信息流描述文本,包括:从各个目标事件对应的信息流描述文本中,确定与所述搜索关键字匹配的信息流描述文本。3.如权利要求2所述的方法,其特征在于,所述基于所述各个信息流标题,确定所述一个目标事件对应的信息流描述文本,包括:获取一个目标事件的目标文本序列,所述目标文本序列包括所述一个目标事件的信息流标题集合的第一目标文本子序列,以及包括字符遮掩标记的第二目标文本子序列;通过已训练的目标文本生成模型中的多个编解码器,基于所述目标文本序列执行多轮迭代操作,其中:在第一轮迭代操作中,所述多个编解码器中第一个编解码器的编码输出是基于所述第一目标文本子序列获得的,所述第一个编解码器的解码输出是基于所述第二目标文本子序列获得的;在所述多轮迭代操作中的除第一轮迭代操作之外的每一轮迭代操作中,所述第一个编解码器的解码输出是基于历史轮迭代操作的预测结果获得的,所述历史轮迭代操作是指在本轮迭操作之前进行的迭代操作,每轮迭代操作对应的预测结果是基于所述多个编解码器中的最后一个编解码器的解码输出获得的;在所述多轮迭代操作中每一轮迭代操作中,除所述第一个编解码器之外的每个编解码器的解码输出是基于前一个编解码器的编码输出和解码输出获得的;基于多轮迭代操作对应的预测结果,获得所述一个目标事件对应的信息流描述文本。4.如权利要求3所述的方法,其特征在于,所述历史轮迭代操作的预测结果包括预测概率满足预设概率条件的多个预测结果;所述在所述多轮迭代操作中的除第一轮迭代操作之外的每一轮迭代操作的预测结果是通过如下方式获得的:将多个组合中每个组合分别输入所述目标文本生成模型,获得本轮迭代操作中每个组合对应的预测结果,其中,所述多个组合为所述第一目标文本子序列与所述历史轮迭代操作的多个预测结果中每个预测结果分别组合的结果;在本轮迭代操作中所述多个组合对应的预测结果中,将满足预测概率条件的预测结果作为本轮迭代操作的预测结果。
5.如权利要求2所述的方法,其特征在于,所述一个目标事件对应的信息流描述文本是通过已训练的文本生成模型获得的,所述已训练的文本生成模型是通过如下方式训练得到的:获取样本文本序列集合,每个样本文本序列包括一个样本事件的样本信息流标题集合的第一样本文本子序列,以及一个样本事件的样本信息流遮掩描述文本的第二样本文本子序列;基于所述文本序列样本集合,对所述文本生成模型中的多个编解码器进行多轮迭代训练,直到满足模型收敛条件为止,得到已训练的目标文本生成模型,其中,每一轮迭代训练包括以下过程:将基于所述样本文本序列集合选取的样本文本序列,输入所述多个编解码器,获得最后一个编解码器的解码输出,其中,所述多个编解码器中的第一个编解码器的编码输出是基于所述样本文本序列中的第一样本文本子序列获得的,所述第一个编解码器的解码输出是基于所述样本文本序列中的第二样本文本子序列获得的,除所述第一个编解码器之外的每个编解码器的解码输出是基于前一个编解码器的编码输出和解码输出获得的;基于所述最后一个编解码器的解码输出,对所述多个编解码器的模型参数进行调整。6.如权利要求5所述的方法,其特征在于,将基于所述样本文本序列集合选取的样本文本序列,输入所述多个编解码器,获得最后一个编解码器的解码输出,包括:针对所述多个编解码器,分别执行以下操作:所述多个编解码器中的一个编解码器为第一个编解码器,则基于所述一个编解码器对所述样本文本序列中的第一样本文本子序列进行编码,获得所述第一个编解码器的编码输出,并基于所述第一个编解码器对所述样本文本序列中的第二样本文本子序列进行解码,获得所述第一个编解码器的解码输出;若所述多个编解码器中的一个编解码器为第i个编解码器,则基于所述第i个编解码器对第i
‑
1个编解码器的编码输出进行编码,获得所述第i个编解码器的编码输出,并基于所述第i个编解码器对第i
‑
1个编解码器的编码输出和解码输出进行解码,获得所述第i个编解码器的解码输出,其中,i为大于1且不小于N的整数,N为所述多个编码器的总数;获得第N个编解码器的解码输出。7.如权利要求6所述的方法,其特征在于,基于所述第一个编解码器对所述样本文本序列中的第二样本文本子序列进行解码,获得所述第一个编解码器的解码输出,包括:基于所述第一个编解码器,获得第一权重矩阵,其中,所述第一权重矩阵中的各行,分别与所述样本文本序列中各个第一输入一一对应,所述第一权重矩阵中的一行包括所述一行对应的第一输入...
【专利技术属性】
技术研发人员:岳天驰,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。