用于生成信息的方法及装置制造方法及图纸

技术编号:21034216 阅读:17 留言:0更新日期:2019-05-04 05:24
本公开的实施例公开了用于生成信息的方法及装置。该方法的一具体实施方式包括:获取初始问答信息,上述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于上述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,上述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过上述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。该实施方式提高了问答信息对中信息匹配的准确性。

【技术实现步骤摘要】
用于生成信息的方法及装置
本公开的实施例涉及数据处理
,具体涉及用于生成信息的方法及装置。
技术介绍
随着信息技术的发展,各种信息能够在网络上快速传递,提高了用户获取信息的效率。用户可以通过网络进行信息查询,并从查询的多个结果信息中选择需要的信息。
技术实现思路
本公开的实施例提出了用于生成信息的方法及装置。第一方面,本公开的实施例提供了一种用于生成信息的方法,该方法包括:获取初始问答信息,上述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于上述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,上述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过上述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。在一些实施例中,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过特征信息模板对上述初始问答信息进行特征提取,得到至少一条特征信息序列,上述特征信息模板包括以下至少一个信息位:问题标题信息位、回答信息位、位置信息位。在一些实施例中,上述问题标题信息位包括时间戳,上述时间戳用于标记问题标题信息上一次被查询的时间,以及,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:响应于时间戳对应的时间与当前时间之间的时间差超过时间阈值,删除该时间戳对应的特征信息序列。在一些实施例中,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:获取基准信息库中与该回答信息对应的目标基准信息;对该回答信息进行特征词提取,得到特征词集合;对于上述特征词集合中的特征词,当该特征词存在于上述目标基准信息中时,该特征词与上述目标基准信息匹配;计算匹配的特征词的数量与特征词集合中全部特征词数量的第一比值,将上述第一比值作为该回答信息与上述目标基准信息的匹配度。在一些实施例中,上述获取基准信息库中与该回答信息对应的目标基准信息,包括:对该回答信息进行语义识别,得到语义标签,上述语义标签用于表征该回答信息的信息内容;将上述语义标签与上述基准信息库进行匹配,确定对应该回答信息的目标基准信息。在一些实施例中,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过该回答信息包含的标点对该回答信息进行划分,得到句子信息集合;对于上述句子信息集合中的句子信息,当该句子信息存在于上述目标基准信息中时,该句子信息与上述目标基准信息匹配;计算匹配的句子信息的数量与句子信息集合中全部句子信息数量的第二比值,将上述第二比值作为该回答信息与上述目标基准信息的匹配度。在一些实施例中,上述通过上述初始问答信息包括的问题信息与该目标基准信息构建问答信息对,包括:通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;对于上述目标句子集合中的目标句子,对该目标句子进行语义识别,得到目标句子标签,上述目标句子标签用于表征目标句子的信息内容;将与上述目标句子集合对应的目标句子标签集合内相同的目标句子标签进行合并,将合并后的目标句子标签对应的目标句子组合成目标回答信息。在一些实施例中,上述通过上述初始问答信息包括的问题信息与该目标基准信息构建问答信息对,包括:通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;将同时存在于上述目标句子集合和句子信息集合中的目标句子组合成目标回答信息。第二方面,本公开的实施例提供了一种用于生成信息的装置,该装置包括:信息获取单元,被配置成获取初始问答信息,上述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;匹配度计算单元,对于上述初始问答信息包含的至少一条回答信息中的回答信息,被配置成计算该回答信息与基准信息库中基准信息的匹配度,上述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;问答信息对构建单元,响应于存在匹配度大于匹配阈值的回答信息,被配置成获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过上述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。在一些实施例中,上述匹配度计算单元包括:特征信息序列获取子单元,被配置成通过特征信息模板对上述初始问答信息进行特征提取,得到至少一条特征信息序列,上述特征信息模板包括以下至少一个信息位:问题标题信息位、回答信息位、位置信息位。在一些实施例中,上述问题标题信息位包括时间戳,上述时间戳用于标记问题标题信息上一次被查询的时间,以及,上述匹配度计算单元包括:特征信息序列筛选子单元,响应于时间戳对应的时间与当前时间之间的时间差超过时间阈值,被配置成删除该时间戳对应的特征信息序列。在一些实施例中,上述匹配度计算单元包括:目标基准信息获取子单元,被配置成获取基准信息库中与该回答信息对应的目标基准信息;特征词提取子单元,被配置成对该回答信息进行特征词提取,得到特征词集合;第一信息匹配判断子单元,对于上述特征词集合中的特征词,被配置成当该特征词存在于上述目标基准信息中时,该特征词与上述目标基准信息匹配;第一匹配度计算子单元,被配置成计算匹配的特征词的数量与特征词集合中全部特征词数量的第一比值,将上述第一比值作为该回答信息与上述目标基准信息的匹配度。在一些实施例中,上述目标基准信息获取子单元包括:语义识别模块,被配置成对该回答信息进行语义识别,得到语义标签,上述语义标签用于表征该回答信息的信息内容;目标基准信息获取模块,被配置成将上述语义标签与上述基准信息库进行匹配,确定对应该回答信息的目标基准信息。在一些实施例中,上述匹配度计算单元包括:句子信息获取子单元,被配置成通过该回答信息包含的标点对该回答信息进行划分,得到句子信息集合;第二信息匹配判断子单元,对于上述句子信息集合中的句子信息,被配置成当该句子信息存在于上述目标基准信息中时,该句子信息与上述目标基准信息匹配;第二匹配度计算子单元,被配置成计算匹配的句子信息的数量与句子信息集合中全部句子信息数量的第二比值,将上述第二比值作为该回答信息与上述目标基准信息的匹配度。在一些实施例中,上述问答信息对构建单元包括:第一目标句子获取子单元,被配置成通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;目标句子标签获取子单元,对于上述目标句子集合中的目标句子,被配置成对该目标句子进行语义识别,得到目标句子标签,上述目标句子标签用于表征目标句子的信息内容;第一问答信息对构建字单元,被配置成将与上述目标句子集合对应的目标句子标签集合内相同的目标句子标签进行合并,将合并后的目标句子标签对应的目标句子组合成目标回答信息。在一些实施例中,上述问答信息对构建单元包括:第二目标句子获取子单元,被配置成通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;第二问答信息对构建字单元,被配置成将同时存在于上述目标句子集合和句子信息集合中的目标句子组合成目标回答信息。第三方面,本公开的实施例提供了一种服务器,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于生成信息的方法。第四方面,本文档来自技高网...

【技术保护点】
1.一种用于生成信息的方法,包括:获取初始问答信息,所述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于所述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,所述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。

【技术特征摘要】
1.一种用于生成信息的方法,包括:获取初始问答信息,所述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于所述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,所述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。2.根据权利要求1所述的方法,其中,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过特征信息模板对所述初始问答信息进行特征提取,得到至少一条特征信息序列,所述特征信息模板包括以下至少一个信息位:问题标题信息位、回答信息位、位置信息位。3.根据权利要求2所述的方法,其中,所述问题标题信息位包括时间戳,所述时间戳用于标记问题标题信息上一次被查询的时间,以及,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:响应于时间戳对应的时间与当前时间之间的时间差超过时间阈值,删除该时间戳对应的特征信息序列。4.根据权利要求1所述的方法,其中,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:获取基准信息库中与该回答信息对应的目标基准信息;对该回答信息进行特征词提取,得到特征词集合;对于所述特征词集合中的特征词,当该特征词存在于所述目标基准信息中时,该特征词与所述目标基准信息匹配;计算匹配的特征词的数量与特征词集合中全部特征词数量的第一比值,将所述第一比值作为该回答信息与所述目标基准信息的匹配度。5.根据权利要求4所述的方法,其中,所述获取基准信息库中与该回答信息对应的目标基准信息,包括:对该回答信息进行语义识别,得到语义标签,所述语义标签用于表征该回答信息的信息内容;将所述语义标签与所述基准信息库进行匹配,确定对应该回答信息的目标基准信息。6.根据权利要求5所述的方法,其中,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过该回答信息包含的标点对该回答信息进行划分,得到句子信息集合;对于所述句子信息集合中的句子信息,当该句子信息存在于所述目标基准信息中时,该句子信息与所述目标基准信息匹配;计算匹配的句子信息的数量与句子信息集合中全部句子信息数量的第二比值,将所述第二比值作为该回答信息与所述目标基准信息的匹配度。7.根据权利要求4所述的方法,其中,所述通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对,包括:通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;对于所述目标句子集合中的目标句子,对该目标句子进行语义识别,得到目标句子标签,所述目标句子标签用于表征目标句子的信息内容;将与所述目标句子集合对应的目标句子标签集合内相同的目标句子标签进行合并,将合并后的目标句子标签对应的目标句子组合成目标回答信息。8.根据权利要求6所述的方法,其中,所述通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对,包括:通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;将同时存在于所述目标句子集合和句子信息集合中的目标句子组合成目标回答信息。9.一种用于生成信息的装置,包括:信息获取单元,被配置成获取初始问答信息,所述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;匹配度计算单元,对于所述初始问答信息包含的至少一条回答信息中的回答信息,被配置成计算该回答信息与基准信息库中基准信息的匹配度,所述匹配度用于表征回答信息与基准信息库中基准信息的相似程...

【专利技术属性】
技术研发人员:刘坤刘凯
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1