一种产品文本的确定方法、装置、计算机设备和介质制造方法及图纸

技术编号:24035724 阅读:20 留言:0更新日期:2020-05-07 01:50
本发明专利技术公开了一种产品文本的确定方法、装置、计算机设备和介质,所述方法包括:获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;生成与所述查询文本的语义相似度大于预设数值的拓展文本;根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。

A method, device, computer equipment and medium for determining product text

【技术实现步骤摘要】
一种产品文本的确定方法、装置、计算机设备和介质
本申请涉及数据分析领域,尤其涉及一种产品文本的确定方法、装置、计算机设备和介质。
技术介绍
网络中的信息多种多样,可供用户查阅的资料能达到几万个或几十万个,甚至是更多,为了让用户快速的找到用户所需要的资料,出现了搜索引擎以供可以对资料进行筛选,在众多的资料中,快速的找到用户所需要的资料。通过搜索引擎所搜索资料时,仅仅是将包含有用户在搜索引擎中所输入文本的全部或部分内容的资料筛选出来,但是,这种搜索资料的方式搜索到的资料比较片面。
技术实现思路
有鉴于此,本申请的目的在于提供了一种产品文本的确定方法、装置、计算机设备和介质,以解决现有技术中如何提高搜索结果的全面性的问题。第一方面,本申请实施例提供了一种产品文本的确定方法,包括:获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;生成与所述查询文本的语义相似度大于预设数值的拓展文本;根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。可选的,在获取用户所提交的查询请求之后,在生成与所述查询文本的语义相似度大于预设数值的拓展文本之前,还包括:根据正确语料对所述查询文本进行纠错,以得到正确的查询文本。可选的,所述根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本,包括:分别对所述查询文本和所述拓展文本进行分词;针对所述查询文本中的每一个分词,在所述产品文本数据库中筛选出该分词所对应的产品文本;针对拓展文本中的每一个分词,在所述产品文本数据库中筛选出该分词所对应的产品文本。可选的,根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性,包括:根据所述查询文本和所述拓展文本生成标准文本;根据标准文本,计算每一个筛选出来的产品文本的第一相关性。可选的,所述根据标准文本,计算每一个筛选出来的产品文本的第一相关性,包括:对所述标准文本进行分词,以得到分词结果;针对每一个筛选出来的产品文本,根据所述分词结果中每一个分词在该产品文本的相关性,计算该产品文本与所述标准文本的第一相关性。可选的,还包括:针对每一个筛选出来的产品文本,将筛选出的产品文本和所述用户的用户数据输入至预先训练好的相关性计算模型,以该产品文本的第二相关性;根据每一个筛选出来的产品文本的第二相关性,确定用于向所述用户推送的产品文本。可选的,构建训练好的相关性计算模型包括如下步骤:获取产品文本训练样本集;其中,所述产品文本训练样本集中包含有多个训练样本,每个训练样本中包括产品文本和该产品文本所对应的用户数据;针对每一个训练样本,该训练样本中的产品文本作为相关性计算模型的正样本,该训练样本中该产品文本所对应的用户数据作为相关性计算模型的负样本,将正样本和负样本同时输入至待训练的相关性计算模型中,对待训练的相关性计算模型记性训练。第二方面,本申请实施例提供了一种产品文本的确定装置,包括:获取模块,用于获取用户所输入的目标产品的查询请求;其中,所述查询请求中携带有查询文本;拓展模块,用于生成与所述查询文本的语义相似度大于预设数值的拓展文本;筛选模块,用于根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本。计算模块,用于根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;确定模块,用于根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。第三方面,本申请实施例提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述方法的步骤。本申请实施例提供了一种产品文本的确定方法,首先,获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;其次,生成与所述查询文本的语义相似度大于预设数值的拓展文本;再次,根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;再一次,根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;最后,根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。为了提高现有技术中向用户提供的资料不全面的问题,对用户所输入的查询文本进行拓展,得到拓展后的拓展文本后,利用拓展文本和查询文本同时在产品数据库中进行筛选,使得筛选出来的产品文本不仅包含了用户所输入的原始查询文本,还包含了拓展文本,将筛选出来的产品文本推送给用户,使得用户可以得到更加全面的产品文本,更能满足用户的需求。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。图1为本申请实施例提供的一种产品文本的确定方法的基本流程示意图;图2为本申请实施例提供的另一种产品文本的确定方法的基本流程示意图;图3为本申请实施例提供的一种产品文本的确定装置的结构示意图;图4为本申请实施例提供的一种计算机设备400的结构示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。在现有技术中,通过搜索引擎搜索用户所需要的资料时,用户在搜索引擎中输入文本后,展示给本文档来自技高网...

【技术保护点】
1.一种产品文本的确定方法,其特征在于,包括:/n获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;/n生成与所述查询文本的语义相似度大于预设数值的拓展文本;/n根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;/n根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;/n根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。/n

【技术特征摘要】
1.一种产品文本的确定方法,其特征在于,包括:
获取用户所提交的查询请求;其中,所述查询请求中携带有查询文本;
生成与所述查询文本的语义相似度大于预设数值的拓展文本;
根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本;其中,所述产品文本存储的产品文本包括以下至少一种或几种:从网络中获取的产品文本、从线下资料中获取的产品文本;
根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性;
根据每一个筛选出来的产品文本的第一相关性,确定用于向所述用户推送的产品文本。


2.根据权利要求1所述的确定方法,其特征在于,在获取用户所提交的查询请求之后,在生成与所述查询文本的语义相似度大于预设数值的拓展文本之前,还包括:
根据正确语料对所述查询文本进行纠错,以得到正确的查询文本。


3.根据权利要求1所述的确定方法,其特征在于,所述根据所述查询文本和所述拓展文本,在产品文本数据库中筛选出多个产品文本,包括:
分别对所述查询文本和所述拓展文本进行分词;
针对所述查询文本中的每一个分词,在所述产品文本数据库中筛选出该分词所对应的产品文本;
针对拓展文本中的每一个分词,在所述产品文本数据库中筛选出该分词所对应的产品文本。


4.根据权利要求1所述的确定方法,其特征在于,根据所述查询文本和所述拓展文本,计算每一个筛选出来的产品文本的第一相关性,包括:
根据所述查询文本和所述拓展文本生成标准文本;
根据标准文本,计算每一个筛选出来的产品文本的第一相关性。


5.根据权利要求4所述的确定方法,其特征在于,所述根据标准文本,计算每一个筛选出来的产品文本的第一相关性,包括:
对所述标准文本进行分词,以得到分词结果;
针对每一个筛选出来的产品文本,根据所述分词结果中每一个分词在该产品文本的相关性,计算该产品文本与所述标准文本的第一相关性。


6.根据权利要...

【专利技术属性】
技术研发人员:王千梁新敏陈羲
申请(专利权)人:上海风秩科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1