动态交互式检索方法、系统、设备及存储介质技术方案

技术编号:35404147 阅读:16 留言:0更新日期:2022-11-03 10:56
本发明专利技术公开了一种动态交互式检索方法、系统、设备及存储介质,方法包括:获取答案句;根据所述答案句对已存储的内容进行检索,得到基于类别分类的内容集;基于内容集中的被选中内容,分别计算不同内容集的选择概率;计算内容集的信息增益,并根据内容集对应的选择概率对信息增益进行重新计算,并得到更新信息增益;基于更新信息增益最高的内容集给出提问句。本发明专利技术提供的动态交互式检索方法、系统、设备及存储介质,注重用户喜好和搜索目标数据结构的相结合,能够较早地缩小到应作为目标检索结果出现的提问句的范围,从而降低检索时间,提高检索结果的满意度。检索结果的满意度。检索结果的满意度。

【技术实现步骤摘要】
动态交互式检索方法、系统、设备及存储介质


[0001]本专利技术涉及人机交互检索领域,具体地说,涉及一种动态交互式检索方法、系统、设备及存储介质。

技术介绍

[0002]能够实现与人进行自然对话的交互系统正在变得越来越普遍,尤其是智能手机和平板电脑终端的使用正在不断被普及。
[0003]现有技术1:日本专利申请公开第2002

177647号公报公开了一种交互式游戏设备的技术,其基于回答者的心理状态来选择下一个问题句,来防止问题模式的固定化。该技术中具有将多个提问句与该提问句的选择基准一起被记录的数据库。然后,从回答者对提问句的声音中分析回答者的心理状态,将心理状态与提问句的选择标准进行对照,并从数据库中选择提问句。那个提问句作为指导被提供给提问者。也就是说该技术中的提问句的顺序不是固定的,而是根据用户的心理状态而发生改变的。
[0004]现有技术2:系统向用户提示关于检索条件的提问句,要求用户回答“是/否”,来缩小检索候补的范围。根据数据的分类,大量的提问句被存储在数据库中。然后,系统在检索候选的数据集合中选择具有最大信息增益(Informationgain)的提问句。
[0005]现有技术没有完全考虑到回答者自身会在意什么样的内容,只是凭借信息增益来判断回答者的下一个问题,这会导致检索时间的延长和检索结果的满意度降低。

技术实现思路

[0006]本专利技术的目的在于提供一种动态交互式检索方法、系统、设备及存储介质,注重用户喜好和搜索目标数据结构的相结合,能够较早地缩小到应作为目标检索结果出现的提问句的范围,从而降低检索时间,提高检索结果的满意度。
[0007]本专利技术公开的动态交互式检索方法所采用的技术方案是:
[0008]一种动态交互式检索方法,包括:获取答案句;根据所述答案句对已存储的内容进行检索,得到基于类别分类的内容集;基于内容集中的被选中内容,分别计算不同内容集的选择概率;计算内容集的信息增益,并根据内容集对应的选择概率对信息增益进行重新计算,并得到更新信息增益;基于更新信息增益最高的内容集给出提问句。
[0009]作为优选方案,所述基于内容集中的被选中内容的步骤之前包括:对不同内容集中的内容进行数量平均的选择。
[0010]作为优选方案,所述分别计算不同内容集的选择概率的步骤具体包括:获取被选中内容的数量,被选中内容所属内容集,以及内容集在被选中内容所属内容集中的出现次数;计算所述出现次数与被选中内容的数量的比值并作为出现概率;将所述出现概率作为内容集的选择概率。
[0011]作为优选方案,所述分别计算不同内容集的选择概率的步骤具体包括:获取被选中内容的数量,被选中内容所属内容集,以及内容集在被选中内容所属内容集中的出现次
数;计算所述出现次数与被选中内容的数量的比值并作为出现概率;获取内容集的历史选择数据,得到对应的偏好概率;基于所述出现概率和偏好概率得到内容集的选择概率。
[0012]作为优选方案,所述根据所述出现概率和偏好概率得到内容集的选择概率的步骤具体包括:将偏好概率作为前概率,然后通过最大后验概率对出现概率进行计算得到选择概率。
[0013]作为优选方案,所述根据内容集对应的选择概率对信息增益进行重新计算的步骤具体包括:将选择概率作为加权数对信息增益进行加权计算。
[0014]作为优选方案,所述将选择概率作为加权数对信息增益进行加权计算的步骤具体包括:
[0015]PIG(a)=IG(a)*p(a)+Δr
[0016]其中,PIG(a)为更新信息增益,IG(a)为信息增益,p(a)为选择概率,Δr为0

0.001的随机数;
[0017]或者:
[0018]PIG(a)=IG(a)*B
[0019]B=b

P(a)
[0020]其中,PIG(a)为更新信息增益,IG(a)为信息增益,b为大于1的自然数,p(a)为选择概率。
[0021]本方案还提供了一种动态交互式检索系统,包括:交互单元,用于提问句和内容的显示,以及获取用户答案句;内容检索单元,用于根据所述答案句对已存储的内容进行检索,得到基于类别分类的内容集;选择概率计算单元,用于基于内容集中的被选中内容,分别计算不同内容集的选择概率;信息增益单元,用于计算内容集的信息增益;更新信息增益计算单元,用于根据内容集对应的选择概率对信息增益进行重新计算,并得到更新信息增益。
[0022]本方案还提供了一种动态交互式检索设备,所述电子设备包括处理器和存储器,所述存储器存储有计算机程序用于所述处理器执行上述的方法。
[0023]本方案还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序用于处理器执行上述的方法。
[0024]本专利技术公开的实施例有益效果是:在获取用户的答案句后,根据答案句对已存储的内容进行检索,得到与答案句相关且基于类别分类的内容集。用户对内容集中的内容进行选择后,计算内容集的选择概率。计算内容集的信息增益,并根据其对应的选择概率对其信息增益进行重新计算得到更新信息增益,最后基于更新信息增益最高的内容集给出提问句。通过基于信息增益的选择提问句来与用户交互地进行检索的情况下,相比较于其他技术,基于选择概率更注重用户喜好和搜索目标数据结构的相结合,能够较早地缩小到应作为目标检索结果出现的提问句的范围,从而降低检索时间,提高检索结果的满意度。
附图说明
[0025]图1是本专利技术动态交互式检索方法的实施方式流程示意图。
[0026]图2是本专利技术动态交互式检索方法的另一实施方式流程示意图。
[0027]图3是本专利技术动态交互式检索方法的又一实施方式流程示意图。
[0028]图4是本专利技术动态交互式检索系统的结构示意图。
具体实施方式
[0029]下面结合具体实施例和说明书附图对本专利技术做进一步阐述和说明:
[0030]请参考图1,动态交互式检索方法包括:
[0031]S100:获取答案句。
[0032]本实施例中,答案句可以用户根据提问句进行回答的,也可以是用户主动输入的,其都是表达了用户的检索目的。
[0033]S200:根据所述答案句对已存储的内容进行检索,得到基于类别分类的内容集。
[0034]本实施例中,系统存储了大量可能成为检索对象的内容,并且对各条内容赋予一个或多个“类别”。例如,假定检索对象内容是食谱。在这种情况下,如下对每个内容赋予类别。
[0035][0036]检索时,通过将答案句中包含的单词作为搜索关键字,对已存储的内容进行检索。并将符合关键字的内容基于类别分类组合为内容集,即每一个类别都作为一个内容集。本实施例中,在进行内容分类时,可以使用机械学习库的在线学习法(Confidence

weightted linear classification)。矢量特征使用词袋模型,特征量使用名词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动态交互式检索方法,其特征在于,包括:获取答案句;根据所述答案句对已存储的内容进行检索,得到基于类别分类的内容集;基于内容集中的被选中内容,分别计算不同内容集的选择概率;计算内容集的信息增益,并根据内容集对应的选择概率对信息增益进行重新计算,并得到更新信息增益;基于更新信息增益最高的内容集给出提问句。2.如权利要求1所述的动态交互式检索方法,其特征在于,所述基于内容集中的被选中内容的步骤之前包括:对不同内容集中的内容进行数量平均的选择。3.如权利要求2所述的动态交互式检索方法,其特征在于,所述分别计算不同内容集的选择概率的步骤具体包括:获取被选中内容的数量,被选中内容所属内容集,以及内容集在被选中内容所属内容集中的出现次数;计算所述出现次数与被选中内容的数量的比值并作为出现概率;将所述出现概率作为内容集的选择概率。4.如权利要求2所述的动态交互式检索方法,其特征在于,所述分别计算不同内容集的选择概率的步骤具体包括:获取被选中内容的数量,被选中内容所属内容集,以及内容集在被选中内容所属内容集中的出现次数;计算所述出现次数与被选中内容的数量的比值并作为出现概率;获取内容集的历史选择数据,得到对应的偏好概率;基于所述出现概率和偏好概率得到内容集的选择概率。5.如权利要求4所述的动态交互式检索方法,其特征在于,所述根据所述出现概率和偏好概率得到内容集的选择概率的步骤具体包括:将偏好概率作为前概率,然后通过最大后验概率对出现概率进行计算得到选择概率。6.如权利要求1所述的动态交互式检索方法,其特征在于,所述根据...

【专利技术属性】
技术研发人员:徐昕
申请(专利权)人:安徽旭奇数据技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1