基于人工智能的搜索方法和装置制造方法及图纸

技术编号:16779616 阅读:114 留言:0更新日期:2017-12-12 23:54
本申请实施例公开了基于人工智能的搜索方法和装置。该方法的一具体实施方式包括:接收用户输入的搜索用信息;基于搜索用信息,确定候选推送信息集合;利用预先训练的评分模型基于搜索用信息和候选推送信息集合,预测候选推送信息集合中的每条候选推送信息被点击的概率,其中,评分模型是基于预先存储的第一搜索用信息集合、第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合和推送信息集合中的每条推送信息所具有的预设的优先级训练得到的;按照被点击的概率由大到小的顺序,从候选推送信息集合中选取预置数目条候选推送信息组成推送信息序列,将推送信息序列推送至用户的终端设备。该实施方式提高了信息推送的有效性。

Search method and device based on Artificial Intelligence

The present application embodiment discloses a search method and device based on artificial intelligence. One embodiment of the method includes: receiving user input to search for information; information search based on push information to determine a candidate set; using the scoring model of pre training search for information and push information collection based on the candidate, the candidate prediction push each candidate to send information in the collection to push information on the probability. The scoring model is the first search on the basis of previously stored information collection, the first search information set in each of the first search for the corresponding information push each send the information collection and information push in the collection of information push a preset priority training; according to the order from big to click probability small, send the collection of information to select a preset number candidate push information push information sequence from the candidate will push, push the information pushed to the user terminal sequence End equipment. The implementation method improves the effectiveness of information push.

【技术实现步骤摘要】
基于人工智能的搜索方法和装置
本申请涉及计算机
,具体涉及互联网
,尤其涉及基于人工智能的搜索方法和装置。
技术介绍
人工智能(ArtificialIntelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。现有的搜索引擎针对某个查询所返回的经排序后的搜索结果通常综合了多方面的信息,例如相关性、领域权威性、时效性等等,但通常未能重点突出某一方面的信息,例如未能重点突出搜索结果所体现的领域权威性或时效性等等。这里,领域权威性可以指针对该查询词所指向的意图领域,搜索结果所表现出来的针对该领域话题的集中度和可信度。
技术实现思路
本申请实施例的目的在于提出一种改进的基于人工智能的搜索方法和装置,来解决以上
技术介绍
部分提到的技术问题。第一方面,本申请实施例提供了一种基于人工智能的搜索方法,该方法包括:接收用户输入的搜索用信息;基于上述搜索用信息,确定候选推送信息集合;利用预先训练的评分模型基于上述搜索用信息和上述候选推送信息集合,预测上述候选推送信息集合中的每条候选推送信息被点击的概率,其中,上述评分模型是基于预先存储的第一搜索用信息集合、上述第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合和上述推送信息集合中的每条推送信息所具有的预设的优先级训练得到的;按照被点击的概率由大到小的顺序,从上述候选推送信息集合中选取预置数目条候选推送信息组成推送信息序列,将上述推送信息序列推送至上述用户的终端设备。在一些实施例中,上述基于上述搜索用信息,确定候选推送信息集合,包括:确定预先存储的历史搜索用信息列表中是否存在与上述搜索用信息匹配的目标历史搜索用信息,若是,则将上述目标历史搜索用信息所对应的拟推送信息集合作为上述候选推送信息集合,其中,上述历史搜索用信息列表中的每条历史搜索用信息对应拟推送信息集合。在一些实施例中,上述基于上述搜索用信息,确定候选推送信息集合,包括:若不存在上述目标历史搜索用信息,则将上述搜索用信息发送至所连接的数据库服务器,以使上述数据库服务器返回上述候选推送信息集合。在一些实施例中,上述利用预先训练的评分模型基于上述搜索用信息和上述候选推送信息集合,预测上述候选推送信息集合中的每条候选推送信息被点击的概率,包括:从上述搜索用信息中提取出关键词生成第一关键词向量;从上述候选推送信息集合中的每条候选推送信息中提取出关键词生成与该候选推送信息对应的第二关键词向量;对于所生成的每个第二关键词向量,将上述第一关键词向量和该第二关键词向量导入上述评分模型,得到该第二关键词向量所对应的候选推送信息被点击的概率。在一些实施例中,在上述接收用户输入的搜索用信息之前,上述方法还包括:执行以下模型训练步骤:对于上述第一搜索用信息集合中的每条第一搜索用信息,将该第一搜索用信息所对应的推送信息集合中的推送信息进行两两组合得到多个推送信息对,基于该第一搜索用信息、上述多个推送信息对和上述多个推送信息对中的推送信息当前的优先级对预设的机器学习模型进行训练,其中,上述多个推送信息对中的每个推送信息对所包括的推送信息的优先级互不相同;利用经训练的上述机器学习模型对预先存储的测试样本集合中的测试样本进行预测操作得到预测结果,其中,上述测试样本集合中的每个测试样本包括第二搜索用信息和上述第二搜索用信息所对应的测试用信息对,上述测试用信息对中的各条测试用信息具有预设的互不相同的优先级;基于上述测试样本集合中的每个测试样本所包括的测试用信息对中的测试用信息的优先级,确定上述预测结果的错误率;若上述错误率低于阈值,则将当前经训练后的上述机器学习模型作为上述评分模型;若上述错误率不低于上述阈值,则基于上述预测结果中的错误结果,对上述第一搜索用信息集合中的第一搜索用信息所对应的推送信息集合中的推送信息的优先级进行调整,并继续执行上述模型训练步骤。在一些实施例中,上述第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合中的至少两条推送信息来源于不同的网站,并且对于上述测试样本集合中的各个测试样本所包括的测试用信息对中的各条测试用信息,上述各条测试用信息中的至少两条测试用信息来源于不同的网站。在一些实施例中,上述基于上述预测结果中的错误结果,对上述第一搜索用信息集合中的第一搜索用信息所对应的推送信息集合中的推送信息的优先级进行调整,包括:将上述错误结果所对应的测试用信息基于所归属的网站进行聚类,得到多个测试用信息组;将上述多个测试用信息组中的所包括的测试用信息条数最多的测试用信息组所对应的网站作为目标网站,对上述第一搜索用信息集合中的第一搜索用信息所对应的推送信息集合中的来源于上述目标网站的推送信息的优先级进行调整。在一些实施例中,上述基于该第一搜索用信息、上述多个推送信息对和上述多个推送信息对中的推送信息当前的优先级对预设的机器学习模型进行训练,包括:分别获取该第一搜索用信息对应的第一词向量和上述多个推送信息对中的每个推送信息对所包括的每条推送信息对应的第二词向量,其中,上述第二词向量是基于该推送信息所包括的关键词生成的,上述第一词向量是基于该第一搜索用信息所包括的关键词生成的;对于上述多个推送信息对中的每个推送信息对,将上述第一词向量和该推送信息对中的各条推送信息分别对应的第二词向量导入上述机器学习模型,得到该推送信息对中的各条推送信息被点击的概率,基于该推送信息对中的各条推送信息的优先级和被点击的概率之间的差异信息,对上述机器学习模型进行调整。第二方面,本申请实施例提供了一种基于人工智能的搜索装置,该装置包括:接收单元,配置用于接收用户输入的搜索用信息;确定单元,配置用于基于上述搜索用信息,确定候选推送信息集合;预测单元,配置用于利用预先训练的评分模型基于上述搜索用信息和上述候选推送信息集合,预测上述候选推送信息集合中的每条候选推送信息被点击的概率,其中,上述评分模型是基于预先存储的第一搜索用信息集合、上述第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合和上述推送信息集合中的每条推送信息所具有的预设的优先级训练得到的;推送单元,配置用于按照被点击的概率由大到小的顺序,从上述候选推送信息集合中选取预置数目条候选推送信息组成推送信息序列,将上述推送信息序列推送至上述用户的终端设备。在一些实施例中,上述确定单元包括:确定子单元,配置用于确定预先存储的历史搜索用信息列表中是否存在与上述搜索用信息匹配的目标历史搜索用信息,若是,则将上述目标历史搜索用信息所对应的拟推送信息集合作为上述候选推送信息集合,其中,上述历史搜索用信息列表中的每条历史搜索用信息对应拟推送信息集合。在一些实施例中,上述确定单元包括:发送子单元,配置用于若不存在上述目标历史搜索用信息,则将上述搜索用信息发送至所连接的数据库服务器,以使上述数据库服务器返回上述候选推送信息集合。在一些实施例中,上述预测单元包括:第一提取子单元,配置用于从上述搜索用信息中提取出关键词生成第一关键词向量;第二提取本文档来自技高网...
基于人工智能的搜索方法和装置

【技术保护点】
一种基于人工智能的搜索方法,其特征在于,所述方法包括:接收用户输入的搜索用信息;基于所述搜索用信息,确定候选推送信息集合;利用预先训练的评分模型基于所述搜索用信息和所述候选推送信息集合,预测所述候选推送信息集合中的每条候选推送信息被点击的概率,其中,所述评分模型是基于预先存储的第一搜索用信息集合、所述第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合和所述推送信息集合中的每条推送信息所具有的预设的优先级训练得到的;按照被点击的概率由大到小的顺序,从所述候选推送信息集合中选取预置数目条候选推送信息组成推送信息序列,将所述推送信息序列推送至所述用户的终端设备。

【技术特征摘要】
1.一种基于人工智能的搜索方法,其特征在于,所述方法包括:接收用户输入的搜索用信息;基于所述搜索用信息,确定候选推送信息集合;利用预先训练的评分模型基于所述搜索用信息和所述候选推送信息集合,预测所述候选推送信息集合中的每条候选推送信息被点击的概率,其中,所述评分模型是基于预先存储的第一搜索用信息集合、所述第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合和所述推送信息集合中的每条推送信息所具有的预设的优先级训练得到的;按照被点击的概率由大到小的顺序,从所述候选推送信息集合中选取预置数目条候选推送信息组成推送信息序列,将所述推送信息序列推送至所述用户的终端设备。2.根据权利要求1所述的方法,其特征在于,所述基于所述搜索用信息,确定候选推送信息集合,包括:确定预先存储的历史搜索用信息列表中是否存在与所述搜索用信息匹配的目标历史搜索用信息,若是,则将所述目标历史搜索用信息所对应的拟推送信息集合作为所述候选推送信息集合,其中,所述历史搜索用信息列表中的每条历史搜索用信息对应拟推送信息集合。3.根据权利要求2所述的方法,其特征在于,所述基于所述搜索用信息,确定候选推送信息集合,包括:若不存在所述目标历史搜索用信息,则将所述搜索用信息发送至所连接的数据库服务器,以使所述数据库服务器返回所述候选推送信息集合。4.根据权利要求1所述的方法,其特征在于,所述利用预先训练的评分模型基于所述搜索用信息和所述候选推送信息集合,预测所述候选推送信息集合中的每条候选推送信息被点击的概率,包括:从所述搜索用信息中提取出关键词生成第一关键词向量;从所述候选推送信息集合中的每条候选推送信息中提取出关键词生成与该候选推送信息对应的第二关键词向量;对于所生成的每个第二关键词向量,将所述第一关键词向量和该第二关键词向量导入所述评分模型,得到该第二关键词向量所对应的候选推送信息被点击的概率。5.根据权利要求1-4之一所述的方法,其特征在于,在所述接收用户输入的搜索用信息之前,所述方法还包括:执行以下模型训练步骤:对于所述第一搜索用信息集合中的每条第一搜索用信息,将该第一搜索用信息所对应的推送信息集合中的推送信息进行两两组合得到多个推送信息对,基于该第一搜索用信息、所述多个推送信息对和所述多个推送信息对中的推送信息当前的优先级对预设的机器学习模型进行训练,其中,所述多个推送信息对中的每个推送信息对所包括的推送信息的优先级互不相同;利用经训练的所述机器学习模型对预先存储的测试样本集合中的测试样本进行预测操作得到预测结果,其中,所述测试样本集合中的每个测试样本包括第二搜索用信息和所述第二搜索用信息所对应的测试用信息对,所述测试用信息对中的各条测试用信息具有预设的互不相同的优先级;基于所述测试样本集合中的每个测试样本所包括的测试用信息对中的测试用信息的优先级,确定所述预测结果的错误率;若所述错误率低于阈值,则将当前经训练后的所述机器学习模型作为所述评分模型;若所述错误率不低于所述阈值,则基于所述预测结果中的错误结果,对所述第一搜索用信息集合中的第一搜索用信息所对应的推送信息集合中的推送信息的优先级进行调整,并继续执行所述模型训练步骤。6.根据权利要求5所述的方法,其特征在于,所述第一搜索用信息集合中的每条第一搜索用信息所对应的推送信息集合中的至少两条推送信息来源于不同的网站,并且对于所述测试样本集合中的各个测试样本所包括的测试用信息对中的各条测试用信息,所述各条测试用信息中的至少两条测试用信息来源于不同的网站。7.根据权利要求6所述的方法,其特征在于,所述基于所述预测结果中的错误结果,对所述第一搜索用信息集合中的第一搜索用信息所对应的推送信息集合中的推送信息的优先级进行调整,包括:将所述错误结果所对应的测试用信息基于所归属的网站进行聚类,得到多个测试用信息组;将所述多个测试用信息组中的所包括的测试用信息条数最多的测试用信息组所对应的网站作为目标网站,对所述第一搜索用信息集合中的第一搜索用信息所对应的推送信息集合中的来源于所述目标网站的推送信息的优先级进行调整。8.根据权利要求5所述的方法,其特征在于,所述基于该第一搜索用信息、所述多个推送信息对和所述多个推送信息对中的推送信息当前的优先级对预设的机器学习模型进行训练,包括:分别获取该第一搜索用信息对应的第一词向量和所述多个推送信息对中的每个推送信息对所包括的每条推送信息对应的第二词向量,其中,所述第二词向量是基于该推送信息所包括的关键词生成的,所述第一词向量是基于该第一搜索用信息所包括的关键词生成的;对于所述多个推送信息对中的每个推送信息对,将所述第一词向量和该推送信息对中的各条推送信息分别对应的第二词向量导入所述机器学习模型,得到该推送信息对中的各条推送信息被点击的概率,基于该推送信息对中的各条推送信息的优先级和被点击的概率之间的差异信息,对所述机器学习模型进行调整。9.一种基于人工智能的搜索装置,其特征在于,所述装置包括:接收单元,配置用于接收用户输入的搜索用信息;确定...

【专利技术属性】
技术研发人员:周坤胜冯仕堃朱志凡何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1