意图识别方法、装置、可读介质及电子设备制造方法及图纸

技术编号:25950195 阅读:31 留言:0更新日期:2020-10-17 03:42
本公开涉及一种意图识别方法、装置、可读介质及电子设备。该方法包括:获取检索信息,所述检索信息包括至少一个检索词;针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;根据所述目标概率,识别所述检索信息对应的目标意图。通过上述技术方案,对于检索词表征不同意图的情况,根据确定出的目标概率,可以准确识别检索信息对应的目标意图,提高意图识别的准确性,从而可以为用户提供更符合其需求的检索结果。

【技术实现步骤摘要】
意图识别方法、装置、可读介质及电子设备
本公开涉及检索
,具体地,涉及一种意图识别方法、装置、可读介质及电子设备。
技术介绍
在检索领域,用户想要进行信息查询时,通常输入一个或多个检索词来进行查询。其中,不同的检索词可能表征不同的意图,同一个检索词也可能表征多种不同的意图。相关技术中,在对用户的检索意图进行识别时,并未考虑检索词表征不同意图的情况,因此无法准确识别出用户的检索意图,使得意图识别的结果不够准确,从而无法提供满足用户检索需求的检索结果。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。第一方面,本公开提供一种意图识别方法,所述方法包括:获取检索信息,所述检索信息包括至少一个检索词;针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;根据所述目标概率,识别所述检索信息对应的目标意图。第二方面,本公开提供一种意图识别装置,所述装置包括:获取模块,被配置成用于获取检索信息,所述检索信息包括至少一个检索词;目标概率确定模块,被配置成用于针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;识别模块,被配置成用于根据所述目标概率,识别所述检索信息对应的目标意图。第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面提供的所述方法的步骤。第四方面,本公开提供一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面提供的所述方法的步骤。通过上述技术方案,检索信息中可包括至少一个检索词,针对每一检索词,分别确定该检索词在检索信息中属于每一预设主题的目标概率,该目标概率可以指的是,该检索词在用户输入的检索信息中所表征的意图与该预设主题的相关性。对于检索词表征不同意图的情况,根据确定出的目标概率,可以准确识别检索信息对应的目标意图,提高意图识别的准确性,从而可以为用户提供更符合其需求的检索结果。本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:图1是根据一示例性实施例示出的一种意图识别方法的流程图。图2是根据一示例性实施例示出的一种分别确定检索词在检索信息中属于每一预设主题的目标概率的方法的流程图。图3是根据一示例性实施例示出的一种确定检索词属于目标预设主题的概率的方法的流程图。图4根据一示例性实施例示出的一种确定第一检索词和第二检索词同时属于目标预设主题的第二概率的方法的流程图。图5根据一示例性实施例示出的一种确定第一检索词和第二检索词中其中一个属于目标预设主题且另一个属于其他预设主题的第三概率的方法的流程图。图6是根据另一示例性实施例示出的一种意图识别方法的流程图。图7是根据一示例性实施例示出的一种意图识别装置的框图。图8是根据一示例性实施例示出的一种电子设备的结构示意图。具体实施方式下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。在检索领域,用户可输入检索信息以获得相关的检索结果。其中,检索信息可包括一个或多个检索词。当检索信息包括多个检索词时,不同的检索词可能表征不同的意图。示例地,以歌曲为例,用户在检索时,可能会通过歌手姓名加歌曲名称的方式来搜索,歌手姓名和歌曲名称即表征不同的意图。当用户输入一个检索词时,该检索词也可能表征多种意图。例如,如果用户输入的检索词为歌手姓名,该检索词表征的意图可以为歌手的介绍信息,也可以为该歌手创作的歌曲。相关技术中,在对用户的检索意图进行识别时,并未考虑检索词表征不同意图的情况,使得意图识别不够准确。并且,当检索信息中包括多个检索词时,相关技术中一般是对检索信息进行整体的意图识别,识别检索信息整体所表征的意图,然而当出现上述提及的不同检索词表征不同意图的情况时,按照相关技术中的意图识别方式,便无法准确识别出用户的检索意图,从而无法提供满足用户检索需求的结果。鉴于此,本公开提供一种意图识别方法、装置、可读介质及电子设备,以准确识别检索信息对应的目标意图。值得说明的是,本公开在以下介绍中,以对媒体文件的检索为例进行解释说明,媒体文件可包括歌曲、音乐、短视频、音乐短片等,但本公开的应用场景并不局限于此,例如,对物品的检索、对文献资料的检索等等,同样适用于本公开。图1是根据一示例性实施例示出的一种意图识别方法的流程图,该方法可应用于具有处理能力的电子设备中,如终端或服务器等。如图1所示,该方法可包括S101~S103。在S101中,获取检索信息。该检索信息可以是用户想要进行信息查询时所输入的检索词、检索语句等。该检索信息中可包括至少一个检索词。其中,如果用户输入的是检索语句,可先对该检索语句进行分词操作,以确定其中的至少一个检索词。分词操作的具体方式可参照本领域相关技术。在S102中,针对每一检索词,分别确定该检索词在检索信息中属于每一预设主题的目标概率。预设主题可以是预先设置的标签,不同的预设主题用于从不同的维度来描述一个媒体文件。示例地,对于媒体文件来说,预设主题可包括媒体文件的创作者、名称、所属专辑、风格等。本文档来自技高网...

【技术保护点】
1.一种意图识别方法,其特征在于,所述方法包括:/n获取检索信息,所述检索信息包括至少一个检索词;/n针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;/n根据所述目标概率,识别所述检索信息对应的目标意图。/n

【技术特征摘要】
1.一种意图识别方法,其特征在于,所述方法包括:
获取检索信息,所述检索信息包括至少一个检索词;
针对每一所述检索词,分别确定该检索词在所述检索信息中属于每一预设主题的目标概率;
根据所述目标概率,识别所述检索信息对应的目标意图。


2.根据权利要求1所述的方法,其特征在于,所述检索信息包括多个所述检索词;
所述分别确定该检索词在所述检索信息中属于每一预设主题的目标概率,包括:
遍历每一所述预设主题,并将当前遍历到的所述预设主题作为目标预设主题;
将该检索词作为第一检索词,该检索词外的其他每一所述检索词分别作为第二检索词;
获取所述第一检索词属于所述目标预设主题的第一概率;
针对每一所述第二检索词,获取所述第一检索词和该第二检索词同时属于所述目标预设主题的第二概率,以及所述第一检索词和该第二检索词中其中一个属于所述目标预设主题且另一个属于其他预设主题的第三概率,并分别获取该第二检索词属于每一所述预设主题的第四概率;
根据所述第一概率、所述第二概率、所述第三概率和所述第四概率,确定所述第一检索词在所述检索信息中属于所述目标预设主题的目标概率。


3.根据权利要求2所述的方法,其特征在于,通过如下公式确定检索词在检索信息中属于预设主题的目标概率:



其中,Fx表示第x个预设主题,Wy表示第y个检索词,Q表示检索信息,P(Fx|Wy|Q)表示第y个检索词在检索信息中属于第x个预设主题的目标概率,P(Fx|Wy)表示第y个检索词属于第x个预设主题的概率,Fi表示第i个预设主题,Wj表示第j个检索词,P(Fi|Wj)表示第j个检索词属于第i个预设主题的概率,P(bothinFx|Wj,Wy)表示第j个检索词和第y个检索词同时属于第x个预设主题的概率,P(onlyoneinFx|Wj,Wy)表示第j个检索词和第y个检索词中其中一个属于第x个预设主题且另一个属于其他预设主题的概率,m表示预设主题的个数,n表示检索词的个数。


4.根据权利要求2所述的方法,其特征在于,所述检索信息为针对媒体文件的检索信息,所述媒体文件具有在每一所述预设主题下的主题内容;
所述检索词属于目标预设主题的概率是通过如下方式确定的:
针对每一所述预设主题,获取所述检索词包括在该预设主题的主题内容中的媒体文件的第一使用量,并确定该第一使用量之和;
根据所述检索词包括在所述目标预设主题的主题内容中的媒体文件的第一使用量,以及所述第一使用量之和,确定所述检索词属于所述目标预设主题的概率。


5.根据权利要求4所述的方法,其特征在于,通过如下公式,确定所述检索词属于所述目标预设主题的概率:



其中,Ft表示所述目标预设主题,W表示检索词,P(Ft|W)表示该检索词属于所述目标预设主题的概率,count(WinFt)表示该检索词包括在所述目标预设主题的主题内容中的媒体文件的第一使用量,Fi表示第i个预设主题,count(WinFi)表示该检索词包括在第i个预设主题的主题内容中的媒体文件的第一使用量,m表示预设主题的个数。


6.根据权利要求2所述的方法,其特征在于,所述检索信息为针对媒体文件的检索信息,所述媒体文件具有在每一所述预设主题下的主题内容;
所述第一检索词和所述第二检索词同时属于所述目标预设主题的所述第二概率是通过如下方式确定的:
针对每一所述预设主题,获取所述第一检索词和所述第二检索词同时包括在该预设主题的主题内容中的媒体文件的第二使用量,并确定该第二使用量之和;
获取所述第一检索词和所述第二检索词包括在不同预设主题的主题内容中的媒体文件的第三使用量;
根据所述第一检索词和所述第二检索词同时包括在所述目标预设主题的主题内容中的媒体文件的第二使用量、所述第二使用量之和、以及所述第三使用量,确定所述第二概率。


7.根据权利要求6所述的方法...

【专利技术属性】
技术研发人员:王鑫宇张永华
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1