基于人机交互的搜索方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:21629937 阅读:24 留言:0更新日期:2019-07-17 11:24
本发明专利技术提出一种基于人机交互的搜索方法、装置、计算机设备和存储介质,其中,方法包括:对用户提问进行实体词提取,得到目标搜索词,确定与目标搜索词存在共现关系的多个候选词,根据目标搜索词所属的第一类别,确定与其存在共现关系的第二类别,并从多个候选词中选取属于第二类别的至少两个补充搜索词,生成引导问题,根据用户选定的补充搜索词和目标搜索词搜索得到问题回复。通过从用户提出的问题中,提取得到目标搜索词,确定与目标搜索词存在共现关系的多个候选词,并从中选出至少两个补充搜索词生成引导问题供用户选择,实现了模糊问题的细化,解决了现有技术中,针对用户提问,回答仅给出搜索列表或通用的回答,导致回答不准确的技术问题。

Search methods, devices, computer equipment and storage media based on human-computer interaction

【技术实现步骤摘要】
基于人机交互的搜索方法、装置、计算机设备和存储介质
本专利技术涉及互联网
,尤其涉及一种基于人机交互的搜索方法、装置、计算机设备和存储介质。
技术介绍
随着人工智能的发展,智能问答成为人工智能领域一个重要的应用,市场上出现了很多智能问答应用,比如百度度秘、微软小冰、苹果siri等。然而在智能问答系统中,在处理用户提出的问题时,会出现用户提问较模糊的情况,或者提问比较泛化的情况,比如用户在提问“申请书怎么写”时,我们无法确认是“入党申请书”还是“离职申请书”等。现有技术中,针对用户提问较模糊的情况,一般是通过搜索的途径提供全部可能的答案,或者直接给出一些通用的回答,致使不能明确给出用户想要的答案,回答不准确的问题。
技术实现思路
本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本专利技术的第一个目的在于提出一种基于人机交互的搜索方法,以实现通过从用户提出的待回复问题中,提取得到目标搜索词,确定与目标搜索词存在共现关系的多个候选词,并从中选出至少两个补充搜索词生成引导问题供用户选择,实现了模糊问题的细化,解决了现有技术中,针对用户提问,回答仅给出搜索列表,或通用的回答,导致回答不准确的问题。本专利技术的第二个目的在于提出一种基于人机交互的搜索装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种方法基于人工交互的搜索方法,包括:获取用户提出的待回复问题;对所述待回复问题进行实体词提取,得到目标搜索词;根据目标搜索词,查询实体词之间的共现关系,确定与所述目标搜索词存在共现关系的多个候选词;根据所述目标搜索词所属的第一类别,确定与所述第一类别存在共现关系的第二类别,并从所述多个候选词中选取属于所述第二类别的至少两个补充搜索词;根据所述至少两个补充搜索词,生成引导问题,以使用户从所述至少两个补充搜索词中进行选择;根据用户选定的补充搜索词和所述目标搜索词搜索得到问题回复。本专利技术实施例的一种基于人机交互的搜索方法中,获取用户提出的待回复问题,进行实体词提取,得到目标搜索词,查询实体词之间的共现关系,确定与目标搜索词存在共现关系的多个候选词,根据目标搜索词所属的第一类别,确定与第一类别存在共现关系的第二类别,并从多个候选词中选取属于第二类别的至少两个补充搜索词,根据至少两个补充搜索词,生成引导问题,根据用户选定的补充搜索词和目标搜索词搜索得到问题回复。通过从用户提出的待回复问题中,提取得到目标搜索词,确定与目标搜索词存在共现关系的多个候选词,并从中选出至少两个补充搜索词生成引导问题供用户选择,实现了模糊问题的细化,解决了现有技术中,针对用户提问,回答仅给出搜索列表,或通用的回答,导致回答不准确的技术问题。为达上述目的,本专利技术第二方面实施例提出了一种基于人机交互的搜索装置,包括:获取模块,用于获取用户提出的待回复问题;提取模块,用于对所述待回复问题进行实体词提取,得到目标搜索词;查询模块,用于根据目标搜索词,查询实体词之间的共现关系,确定与所述目标搜索词存在共现关系的多个候选词;第一确定模块,用于根据所述目标搜索词所属的第一类别,确定与所述第一类别存在共现关系的第二类别,并从所述多个候选词中选取属于所述第二类别的至少两个补充搜索词;生成模块,用于根据所述至少两个补充搜索词,生成引导问题,以使用户从所述至少两个补充搜索词中进行选择;回复模块,用于根据用户选定的补充搜索词和所述目标搜索词搜索得到问题回复。本专利技术实施例的一种基于人机交互的搜索装置中,获取模块用于获取用户提出的待回复问题,提取模块用于对待回复问题进行实体词提取,得到目标搜索词,查询模块用于查询实体词之间的共现关系,确定与目标搜索词存在共现关系的多个候选词,第一确定模块用于根据目标搜索词所属的第一类别,确定与第一类别存在共现关系的第二类别,并从多个候选词中选取属于第二类别的至少两个补充搜索词,生成模块用于根据至少两个补充搜索词,生成引导问题,以使用户从至少两个补充搜索词红进行选择,回复模块用于根据用户选定的补充搜索词和目标搜索词搜索得到问题回复。通过从用户提出的待回复问题中,提取得到目标搜索词,确定与目标搜索词存在共现关系的多个候选词,并从中选出至少两个补充搜索词生成引导问题供用户选择,实现了模糊问题的细化,解决了现有技术中,针对用户提问,回答仅给出搜索列表,或通用的回答,导致回答不准确的技术问题。为达上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如第一方面所述的基于人机交互的搜索方法。为达上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的基于人机交互的搜索方法。为达上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面所述的基于人机交互的搜索方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1为本专利技术实施例所提供的一种基于人工交互的搜索方法的流程示意图;图2为本专利技术实施例所提供用户提问和回复的示意图;图3为本专利技术实施例所提供的另一种基于人机交互的搜索方法的流程示意图;图4为本专利技术实施例所提供的又一种基于人机交互的搜索方法的流程示意图;图5为本专利技术实施例提供的一种基于人机交互的搜索装置的结构示意图;图6为本专利技术实施例所提供的另一种基于人机交互的搜索装置的结构示意图;以及图7示出了适于用来实现本申请实施方式的示例性计算机设备的框图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的基于人机交互的搜索方法、装置、计算机设备和存储介质。图1为本专利技术实施例所提供的一种基于人工交互的搜索方法的流程示意图。如图1所示,该方法包括:步骤101,获取用户提出的待回复问题。具体地,采集用户提出的待回复问题,可通过麦克风采集用户提出的待回复问题,或者可以通过键盘采集用户输入的待回复问题。图2为本专利技术实施例所提供用户提问和回复的示意图,如图2所示,获取到的用户提问为:钢笔工具怎么用?步骤102,对待回复问题进行实体词提取,得到目标搜索词。可选地,将获取到的待回复问题根据名词、动词和助词进行分词,去除出现频率最高的一些助词,如“是、的、在等”,并根据词性标注过滤掉不合适的词,比如副词等,只留下实词,即具有实际意义的词,如名词、数词等,提取得到的实体词即为目标搜索词,对于实体词提取的方法,本实施例中不作限定。例,如图2所示的用户提问,通过实词提取得到的目标搜索词则为“钢笔工具”。步骤103,根据目标搜索词,查询实体词之间的共本文档来自技高网...

【技术保护点】
1.一种基于人机交互的搜索方法,其特征在于,包括以下步骤:获取用户提出的待回复问题;对所述待回复问题进行实体词提取,得到目标搜索词;根据目标搜索词,查询实体词之间的共现关系,确定与所述目标搜索词存在共现关系的多个候选词;根据所述目标搜索词所属的第一类别,确定与所述第一类别存在共现关系的第二类别,并从所述多个候选词中选取属于所述第二类别的至少两个补充搜索词;根据所述至少两个补充搜索词,生成引导问题,以使用户从所述至少两个补充搜索词中进行选择;根据用户选定的补充搜索词和所述目标搜索词搜索得到问题回复。

【技术特征摘要】
1.一种基于人机交互的搜索方法,其特征在于,包括以下步骤:获取用户提出的待回复问题;对所述待回复问题进行实体词提取,得到目标搜索词;根据目标搜索词,查询实体词之间的共现关系,确定与所述目标搜索词存在共现关系的多个候选词;根据所述目标搜索词所属的第一类别,确定与所述第一类别存在共现关系的第二类别,并从所述多个候选词中选取属于所述第二类别的至少两个补充搜索词;根据所述至少两个补充搜索词,生成引导问题,以使用户从所述至少两个补充搜索词中进行选择;根据用户选定的补充搜索词和所述目标搜索词搜索得到问题回复。2.根据权利要求1所述的搜索方法,其特征在于,所述根据目标搜索词,查询实体词之间的共现关系,确定与所述目标搜索词存在共现关系的多个候选词之前,还包括:针对每一领域预先采用离线方式,获取所述领域的问答语料中出现的实体词,以建立实体词表;统计不同实体词的共现次数;所述不同实体词的共现次数,是指不同实体词,在同一个问题或同一个答案中出现的次数;根据不同实体词的共现次数,确定实体词之间的共现关系。3.根据权利要求2所述的搜索方法,其特征在于,所述获取所述领域的问答语料中出现的实体词,以建立实体词表,包括:对所述问答语料进行分词,并去除停用词;对去除停用词后保留的词语进行词性标注,保留词性为名词和/或动词的词语作为实体词;根据各实体词的词频,建立实体词表。4.根据权利要求2所述的搜索方法,其特征在于,所述确定实体词之间的共现关系之后,还包括:对所述实体词表中的实体词进行语义识别;确定所述实体词表中具有相同语义的实体词;对具有相同语义的实体词的共现关系进行合并。5.根据权利要求2所述的搜索方法,其特征在于,所述针对每一领域预先采用离线方式,获取所述领域的问答语料中出现的实体词,以建立实体词表之后,还包括:确定所述实体词表中的各实...

【专利技术属性】
技术研发人员:姚源林薛璐影李远肇
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1