【技术实现步骤摘要】
用于生成信息的方法及装置
本公开的实施例涉及数据处理
,具体涉及用于生成信息的方法及装置。
技术介绍
随着信息技术的发展,各种信息能够在网络上快速传递,提高了用户获取信息的效率。用户可以通过网络进行信息查询,并从查询的多个结果信息中选择需要的信息。
技术实现思路
本公开的实施例提出了用于生成信息的方法及装置。第一方面,本公开的实施例提供了一种用于生成信息的方法,该方法包括:获取初始问答信息,上述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于上述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,上述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过上述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。在一些实施例中,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过特征信息模板对上述初始问答信息进行特征提取,得到至少一条特征信息序列,上述特征信息模板包括以下至少一个信息位:问题标题信息位、回答信息位、位置信息位。在一些实施例中,上述问题标题信息位包括时间戳,上述时间戳用于标记问题标题信息上一次被查询的时间,以及,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:响应于时间戳对应的时间与当前时间之间的时间差超过时间阈值,删除该时间戳对应的特征信息序列。在一些实施例中,上述计算该回答信息与基准信息库中基准信息的匹配度,包括:获取基准信息库中与该回答信息对应的目标基准信息;对 ...
【技术保护点】
1.一种用于生成信息的方法,包括:获取初始问答信息,所述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于所述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,所述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。
【技术特征摘要】
1.一种用于生成信息的方法,包括:获取初始问答信息,所述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;对于所述初始问答信息包含的至少一条回答信息中的回答信息,计算该回答信息与基准信息库中基准信息的匹配度,所述匹配度用于表征回答信息与基准信息库中基准信息的相似程度;响应于存在匹配度大于匹配阈值的回答信息,获取匹配度大于匹配阈值的回答信息对应的目标基准信息,并通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对。2.根据权利要求1所述的方法,其中,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过特征信息模板对所述初始问答信息进行特征提取,得到至少一条特征信息序列,所述特征信息模板包括以下至少一个信息位:问题标题信息位、回答信息位、位置信息位。3.根据权利要求2所述的方法,其中,所述问题标题信息位包括时间戳,所述时间戳用于标记问题标题信息上一次被查询的时间,以及,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:响应于时间戳对应的时间与当前时间之间的时间差超过时间阈值,删除该时间戳对应的特征信息序列。4.根据权利要求1所述的方法,其中,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:获取基准信息库中与该回答信息对应的目标基准信息;对该回答信息进行特征词提取,得到特征词集合;对于所述特征词集合中的特征词,当该特征词存在于所述目标基准信息中时,该特征词与所述目标基准信息匹配;计算匹配的特征词的数量与特征词集合中全部特征词数量的第一比值,将所述第一比值作为该回答信息与所述目标基准信息的匹配度。5.根据权利要求4所述的方法,其中,所述获取基准信息库中与该回答信息对应的目标基准信息,包括:对该回答信息进行语义识别,得到语义标签,所述语义标签用于表征该回答信息的信息内容;将所述语义标签与所述基准信息库进行匹配,确定对应该回答信息的目标基准信息。6.根据权利要求5所述的方法,其中,所述计算该回答信息与基准信息库中基准信息的匹配度,包括:通过该回答信息包含的标点对该回答信息进行划分,得到句子信息集合;对于所述句子信息集合中的句子信息,当该句子信息存在于所述目标基准信息中时,该句子信息与所述目标基准信息匹配;计算匹配的句子信息的数量与句子信息集合中全部句子信息数量的第二比值,将所述第二比值作为该回答信息与所述目标基准信息的匹配度。7.根据权利要求4所述的方法,其中,所述通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对,包括:通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;对于所述目标句子集合中的目标句子,对该目标句子进行语义识别,得到目标句子标签,所述目标句子标签用于表征目标句子的信息内容;将与所述目标句子集合对应的目标句子标签集合内相同的目标句子标签进行合并,将合并后的目标句子标签对应的目标句子组合成目标回答信息。8.根据权利要求6所述的方法,其中,所述通过所述初始问答信息包括的问题信息与该目标基准信息构建问答信息对,包括:通过该目标基准信息包含的标点对该目标基准信息进行划分,得到目标句子集合;将同时存在于所述目标句子集合和句子信息集合中的目标句子组合成目标回答信息。9.一种用于生成信息的装置,包括:信息获取单元,被配置成获取初始问答信息,所述初始问答信息包括问题信息和对应该问题信息的至少一条回答信息;匹配度计算单元,对于所述初始问答信息包含的至少一条回答信息中的回答信息,被配置成计算该回答信息与基准信息库中基准信息的匹配度,所述匹配度用于表征回答信息与基准信息库中基准信息的相似程...
【专利技术属性】
技术研发人员:刘坤,刘凯,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。