一种查询意图确定方法、装置及处理设备制造方法及图纸

技术编号:25123254 阅读:46 留言:0更新日期:2020-08-05 02:52
本说明书提供一种查询意图确定方法、装置及处理设备,对搜索文本进行语义向量得转换,计算出搜索文本的搜索语义向量,再基于搜索语义向量喝和意图词库中各个意图文本的意图向量对意图词库中的意图文本进行初步的筛选,确定出搜索文本对应的意图候选集。再根据输入搜索文本的用户的历史行为数据对意图候选集中的意图文本进一步筛选,确定出搜索文本对应的目标意图。结合语义向量分析以及用户的历史行为特征对用户的查询意图进行识别确定。

【技术实现步骤摘要】
一种查询意图确定方法、装置及处理设备
本说明书属于计算机
,尤其涉及一种查询意图确定方法、装置及处理设备。
技术介绍
随着计算机和互联网技术的发展,利用网络搜索、查询已经是人们获取信息或服务的重要手段。越来越多的网络平台提供搜索查询窗口,以便用户能够快速的获取到自己需要的服务或信息。通常用户可以通过搜索查询窗口输入搜索词,网络平台可以根据用户输入的搜索词在数据库中匹配对应的意图词,以确定用户的查询意图。用户搜索时,如果搜索词与意图词一致,则认为命中服务意图,该服务或信息可以被展示出来。但是若用户输入的搜索词一旦稍有变化,虽然意义不变,就可能无法命中意图词,导致相关的内容无法被搜索出。并且,数据库的扩充周期长,对于新出现的搜索词可能无法匹配。
技术实现思路
本说明书实施例的目的在于提供一种查询意图确定方法、装置及处理设备,提高了查询意图确定的准确性。一方面,本说明书实施例提供了一种查询意图确定方法,所述方法包括:将接收到的搜索文本进行语义向量转换,获得所述搜索文本对应的搜索语义向量;根据所述搜索语义向量和意图词库中各个意图文本的意图向量,从所述意图词库中确定出所述搜索文本对应的意图候选集;根据所述搜索文本对应的用户的历史行为数据,对所述意图候选集中的意图文本进行筛选,确定出所述搜索文本对应的目标意图。另一方面,本说明书提供了一种查询意图确定装置,包括:语义向量转换模块,用于将接收到的搜索文本进行语义向量转换,获得所述搜索文本对应的搜索语义向量;<br>意图候选确定模块,用于根据所述搜索语义向量和意图词库中各个意图文本的意图向量,从所述意图词库中确定出所述搜索文本对应的意图候选集;意图排序模块,用于根据所述搜索文本对应的用户的历史行为数据,对所述意图候选集中的意图文本进行筛选,确定出所述搜索文本对应的目标意图。还一方面,本说明书实施例提供了一种查询意图确定处理设备,至少一个处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述查询意图确定方法。本说明书提供的查询意图确定方法、装置及处理设备,可以对搜索文本进行语义向量得转换,计算出搜索文本的搜索语义向量,再基于搜索语义向量喝和意图词库中各个意图文本的意图向量对意图词库中的意图文本进行初步的筛选,确定出搜索文本对应的意图候选集。再根据输入搜索文本的用户的历史行为数据对意图候选集中的意图文本进一步筛选,确定出搜索文本对应的目标意图。利用语义向量检索意图向量索引,只要语义向量计算模型能够捕获搜索文本中的语义,即使是从来没有见过的新搜索文本,也可以成功匹配,提高了查询意图确定的覆盖面和准确性。同时通过用户历史行为数据作为筛选特征,可以避免语义相似但是意图不符的情况,使得确定出的目标意图更符合用户的需求,提高意图识别确定的准确性。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本说明书实施例提供的查询意图确定方法实施例的流程示意图;图2是本说明书又一个实施例中查询意图确定方法的流程示意图;图3是本说明书又一个实施例中查询意图确定方法的流程示意图;图4是本说明书提供的查询意图确定装置一个实施例的模块结构示意图;图5是本说明书一个实施例中进行查询意图确定的服务器的硬件结构框图。具体实施方式为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。随着计算机、互联网技术的发展,越来越多的服务由互联网平台提供,用户通过网络就可以实现线上业务的办理或者信息的获取。例如:网上缴纳水电费、网上给手机进行充值、网上预约旧衣回收等,但是一般平台提供的服务种类可能比较多,用户在界面上很难直接找到自己需要的服务,可能需要通过平台提供的搜索窗口查询到所需的服务或功能,平台需要根据用户输入的搜索文本确定出用户所需的服务意图,即确定出用户的查询意图,才能够为用户提供其所需的服务。图1是本说明书实施例提供的查询意图确定方法实施例的流程示意图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者部分合并后更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例或附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置、服务器或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境、甚至包括分布式处理、服务器集群的实施环境)。具体的一个实施例如图1所示,本说明书提供的查询意图确定方法的一个实施例中,所述方法可以应用于为用户提供服务的网络平台或者一些信息查询平台中,具体可以用于客户端(如:智能手机、平板电脑、计算机、车载设备、智能穿戴设备等)、服务器等终端,所述方法可以包括如下步骤:步骤102、将接收到的搜索文本进行语义向量转换,获得所述搜索文本对应的搜索语义向量。在具体的实施过程中,搜索文本可以指用户在一些网络服务平台中输入的查询文本,可以是词语或短语或一句话等,具体可以以文字或语音或视频或图片等形式输入,若用户以语音、视频、图片的形式输入查询文本,可以将语音、视频、图片转换为文字,再将转换后的文字作为搜索文本。接收到用户的搜索文本后,可以将搜索文本进行语义向量转换,确定出搜索文本对应的搜索语义向量。例如:可以利用语义向量模型计算搜索文本的语义向量,语义向量模型可以有多种形式如:RNN(RecurrentNeuralNetwork,循环神经网络模型),BERT(BidirectionalEncoderRepresentationsfromTransformers,一个语言表征模型),语义向量模型的特征可以是将搜索文本的分词序列作为输入,如:按字分词的分词序列、汉语拼音序列、拼音字符序列等作为语义向量模型的输入。可以基于历史搜索文本或者其他文本进行分词序列后训练语义向量模型,将接收到的搜索文本的这些分词序列的全部或组合作为训练获得的语义向量模型的输入,即可以输出搜索文本对应的搜索语义向量。本说明书一些实施例中,可以在对接收到的搜索文本进行语义向量的转换之前,先将接收到的搜索文本与意图词库中的意图词进行基于字符的匹配,若匹配失败,再将接收到的搜索文本进行语义向量转换,进行后续的查询意图的确本文档来自技高网
...

【技术保护点】
1.一种查询意图确定方法,所述方法包括:/n将接收到的搜索文本进行语义向量转换,获得所述搜索文本对应的搜索语义向量;/n根据所述搜索语义向量和意图词库中各个意图文本的意图向量,从所述意图词库中确定出所述搜索文本对应的意图候选集;/n根据所述搜索文本对应的用户的历史行为数据,对所述意图候选集中的意图文本进行筛选,确定出所述搜索文本对应的目标意图。/n

【技术特征摘要】
1.一种查询意图确定方法,所述方法包括:
将接收到的搜索文本进行语义向量转换,获得所述搜索文本对应的搜索语义向量;
根据所述搜索语义向量和意图词库中各个意图文本的意图向量,从所述意图词库中确定出所述搜索文本对应的意图候选集;
根据所述搜索文本对应的用户的历史行为数据,对所述意图候选集中的意图文本进行筛选,确定出所述搜索文本对应的目标意图。


2.如权利要求1所述的方法,所述方法还包括:
对所述搜索文本进行分词处理,确定所述搜索文本分词后的各个词语的权重;
根据所述搜索文本分词后各个词语的权重对所述搜索文本分词后的各个词语进行筛选,确定出筛选搜索词语;
将所述筛选搜索词语和所述意图词库中的意图文本进行匹配,将匹配成功的意图文本加入到所述意图候选集中。


3.如权利要求2所述的方法,所述将所述筛选搜索词语和所述搜索文本对应的意图文本进行匹配包括:
根据所述筛选搜索词语对所述意图词库中的意图文本进行倒排索引检索,将检索到的意图文本作为匹配成功的意图文本加入到所述意图候选集中。


4.如权利要求1-3任一项所述的方法,所述根据所述搜索文本对应的用户的历史行为数据,对所述意图候选集中的意图文本进行筛选,包括:
根据所述搜索文本对应的用户的历史行为数据,利用意图排序模型对所述意图候选集中的意图文本进行排序筛选;
其中,所述意图排序模型被设置为按照下述方法构建:
建立所述意图排序模型;
将多个所述历史搜索文本输入数据,将多个所述历史搜索文本对应的目标意图作为输出数据,将所述历史搜索文本对应的用户的历史行为数据作为模型特征,对模型进行训练直至达到预设要求。


5.如权利要求4所述的方法,所述意图排序模型的模型特征还包括:
所述历史搜索文本与意图词库中的意图文本之间的相似度、所述历史搜索文本对应的用户所处的环境信息、所述意图词库中各个意图文本对应的业务类型中的一个或多个;
所述利用意图排序模型对所述意图候选集中的意图文本进行排序,包括:
将所述搜索文本对应的用户的历史行为数据、所述意图候选集中的意图文本和所述意图文本对应的业务类型、所述搜索文本与所述意图候选集中各意图文本之间的相似度、所述搜索文本对应的用户所处的环境信息输入到构建好的意图排序模型中,对所述意图候选集中的意图文本进行打分排序。


6.如权利要求1所述的方法,所述将接收到的搜索文本进行语义向量转换之前还包括:
将接收到的搜索文本与意图词库中的意图词进行基于字符的匹配,若匹配失败,则将接收到的搜索文本进行语义向量转换。


7.如权利要求1所述的方法,所述根据所述搜索语义向量和意图词库中各个意图文本的意图向量,从所述意图词库中确定出所述搜索文本对应的意图候选集,包括:
根据所述搜索语义向量,利用邻近算法对所述意图词库中各个意图文本的意图向量进行检索,从所述意图词库中确定出指定数量个意图文本,获得所述意图候选集。


8.一种查询意图确定装置,包括:
语义向量转换模块,用于将接收...

【专利技术属性】
技术研发人员:昌晋雄
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1