一种数据处理方法、装置、电子设备以及存储介质制造方法及图纸

技术编号:21629914 阅读:19 留言:0更新日期:2019-07-17 11:24
本发明专利技术实施例提供了一种数据处理方法、装置、电子设备以及存储介质,以提高相关性确定的准确性。所述的方法包括:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。无需人工的分类处理,有效提高相关度确定的准确性。

A Data Processing Method, Device, Electronic Equipment and Storage Media

【技术实现步骤摘要】
一种数据处理方法、装置、电子设备以及存储介质
本专利技术涉及计算机
,特别是涉及一种数据处理方法、一种数据处理装置、一种电子设备,以及一种存储介质。
技术介绍
随着网络技术的发展,越来越多的用户通过网络查询所需的各种信息,例如查询热播的影视作品、热门游戏,以及各种商品的性能、排行等,从而能够基于查询的结果辅助进行信息的选择。通常在查询时需要对查询结果进行排序后反馈,一些方式是对站点的质量进行打分,但是这种方式没有考虑查询词和站点之间的相关性,排序结果可能不符合用户的要求,而造成查询效率的降低。而一些确定关键词和站点间相关性的方式通常是按照类别确定相关性,即通过类别的匹配程度来计算查询词和站点的相关性,但是这种方式的类别和分类特征通常是人工设置的,分类的准确性也不能得到保证,因此相关性计算的准确性难以保证,依据该相关性执行的排序准确性也较低。
技术实现思路
本专利技术实施例所要解决的技术问题是提供一种数据处理方法,以提高相关性确定的准确性。相应的,本专利技术实施例还提供了一种数据处理装置、一种电子设备及一种存储介质,用以保证上述方法的实现及应用。为了解决上述问题,本专利技术实施例公开了一种数据处理方法,所述的方法包括:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。可选的,所述依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径,包括:确定多个目标搜索结果,并从各目标搜索结果中分别提取关键词和所述关键词对应的站点信息;采用所述关键词和站点信息的对应关系构成关联路径。可选的,所述采用所述关键词和站点信息的对应关系构成关联路径,包括:依据所述关键词和站点信息的对应关系,将各关键词和相应的站点信息连接,构成所述关键词和站点信息的二部图;依据二部图确定多个所述关键词和站点信息的关联路径。可选的,所述依据二部图确定多个所述关键词和站点信息的关联路径,包括:依据所述二部图,通过随机游走方式将关键词和站点信息串联,生成多个关联路径。可选的,所述依据关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量,包括:依据所述关联路径生成向量信息,其中,所述向量信息包括关键词的第一路径向量和站点信息的第二路径向量;将所述向量信息输入到预设模型中,得到关键词的第一词向量和站点信息的第二词向量。可选的,所述依据第一词向量和第二词向量,计算所述关键词和站点信息的相关性,包括:选择关键词和站点信息;将关键词的第一词向量和站点信息的第二词向量进行相关性计算,得到所述关键词和站点信息之间的相关性。可选的,还包括:在通过查询词执行设定业务时,从查询结果中获取查询词对应的网址信息,其中,所述设定业务包括以下至少一种:搜索业务、推荐业务;将所述查询词作为关键词,将所述网址信息作为站点信息,查询对应关键词和站点信息的相关性。本专利技术实施例还提供了一种数据处理装置,包括:路径确定模块,用于依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;词向量确定模块,用于依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;相关性计算模块,用于依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。可选的,所述路径确定模块,包括:数据提取子模块,用于确定多个目标搜索结果,并从各目标搜索结果中分别提取关键词和所述关键词对应的站点信息;路径生成子模块,用于采用所述关键词和站点信息的对应关系构成关联路径。可选的,所述路径生成子模块,包括:二部图生成单元,用于依据所述关键词和站点信息的对应关系,将各关键词和相应的站点信息连接,构成所述关键词和站点信息的二部图;路径确定单元,用于依据二部图确定多个所述关键词和站点信息的关联路径。可选的,路径确定单元,用于依据所述二部图,通过随机游走方式将关键词和站点信息串联,生成多个关联路径。可选的,所述词向量确定模块,用于依据所述关联路径生成向量信息,其中,所述向量信息包括关键词的第一路径向量和站点信息的第二路径向量;将所述向量信息输入到预设模型中,得到关键词的第一词向量和站点信息的第二词向量。可选的,所述相关性计算模块,用于选择关键词和站点信息;将关键词的第一词向量和站点信息的第二词向量进行相关性计算,得到所述关键词和站点信息之间的相关性。可选的,还包括:相关性查询模块,用于在通过查询词执行设定业务时,从查询结果中获取查询词对应的网址信息,其中,所述设定业务包括以下至少一种:搜索业务、推荐业务;将所述查询词作为关键词,将所述网址信息作为站点信息,查询对应关键词和站点信息的相关性。本专利技术实施例还提供了一种可读存储介质,其特征在于,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如本专利技术实施例中任一所述的数据处理方法。本专利技术实施例还提供了一种电子设备,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。可选的,所述依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径,包括:确定多个目标搜索结果,并从各目标搜索结果中分别提取关键词和所述关键词对应的站点信息;采用所述关键词和站点信息的对应关系构成关联路径。可选的,所述采用所述关键词和站点信息的对应关系构成关联路径,包括:依据所述关键词和站点信息的对应关系,将各关键词和相应的站点信息连接,构成所述关键词和站点信息的二部图;依据二部图确定多个所述关键词和站点信息的关联路径。可选的,所述依据二部图确定多个所述关键词和站点信息的关联路径,包括:依据所述二部图,通过随机游走方式将关键词和站点信息串联,生成多个关联路径。可选的,所述依据关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量,包括:依据所述关联路径生成向量信息,其中,所述向量信息包括关键词的第一路径向量和站点信息的第二路径向量;将所述向量信息输入到预设模型中,得到关键词的第一词向量和站点信息的第二词向量。可选的,所述依据第一词向量和第二词向量,计算所述关键词和站点信息的相关性,包括:选择关键词和站点信息;将关键词的第一词向量和站点信息的第二词向量进行相关性计算,得到所述关键词和站点信息之间的相关性。可选的,由一个或者一个以上处理器执行所述一个或者一个以上程序包含还用于进行以下操作的指令:在通过查询词执行设定业务时,从查询结果中获取查询词对应的网址信息,其中,所述设定业务包括以下至少一种:搜索业务、推荐业务;将所述查询词作为关键词,将所述网址信息作为站点信息,查询对应关键词和站点信息的相关性。本专利技术实施例包括以下优点:本专利技术实施例可依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径,从而依据大量搜索结果建立关键词和站点信息本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述的方法包括:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述的方法包括:依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径;依据所述关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量;依据所述第一词向量和第二词向量,计算所述关键词和站点信息的相关性。2.根据权利要求1所述的方法,其特征在于,所述依据目标搜索结果中关键词和站点信息,构成关键词和站点信息的关联路径,包括:确定多个目标搜索结果,并从各目标搜索结果中分别提取关键词和所述关键词对应的站点信息;采用所述关键词和站点信息的对应关系构成关联路径。3.根据权利要求2所述的方法,其特征在于,所述采用所述关键词和站点信息的对应关系构成关联路径,包括:依据所述关键词和站点信息的对应关系,将各关键词和相应的站点信息连接,构成所述关键词和站点信息的二部图;依据二部图确定多个所述关键词和站点信息的关联路径。4.根据权利要求3所述的方法,其特征在于,所述依据二部图确定多个所述关键词和站点信息的关联路径,包括:依据所述二部图,通过随机游走方式将关键词和站点信息串联,生成多个关联路径。5.根据权利要求1所述的方法,其特征在于,所述依据关联路径和预设模型,确定关键词的第一词向量和站点信息的第二词向量,包括:依据所述关联路径生成向量信息,其中,所述向量信息包括关键词的第一路径向量和站点信息的第二路径向量;将所述向量信息输入到预设模型中,得到关键词的第一词向量和站点信息的第二词向量。6.根据权利要求1所述的方法,其特征在于,所述依据第一词向...

【专利技术属性】
技术研发人员:贺宇董国盛周泽南苏雪峰佟子健
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1