【技术实现步骤摘要】
一种知识库的生成方法、文本查找方法和装置
本专利技术涉及计算机
,特别是涉及一种知识库的生成方法、一种文本查找方法、一种知识库的生成装置和一种文本查找装置。
技术介绍
人可以通过获得知识,应用知识,或者信息加工的过程,得到个人的知识体系,以及个人对世界的认知。然而,个人的知识体系以及个人对世界的认知,只有本人可以了解。若他人希望向一个人咨询问题,获取个人基于其本人知识体系以及本人认知的形成的答案,那么他人一般只能向该个人本人进行咨询,而较难通过其他方式获取该个人对问题的回复。例如,对于医生、律师、心理咨询师等经常接收他人咨询的职业来说,若咨询者希望得到职业人士对其提出问题的回复,通常需要直接向职业人士咨询,而较难通过其他方式获取职业人士对问题的回复。
技术实现思路
鉴于上述问题,提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种知识库的生成方法、一种文本查找方法、一种知识库的生成装置和一种文本查找装置。为了解决上述问题,本专利技术实施例公开了一种知识库的生
【技术保护点】
1.一种知识库的生成方法,其特征在于,包括:/n获取目标用户与其他用户对话产生的对话语音;/n在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;/n基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;/n采用所述标准问题以及所述标准问题对应的标准答案,生成知识库。/n
【技术特征摘要】
1.一种知识库的生成方法,其特征在于,包括:
获取目标用户与其他用户对话产生的对话语音;
在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本;
基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案;
采用所述标准问题以及所述标准问题对应的标准答案,生成知识库。
2.根据权利要求1所述的方法,其特征在于,所述在所述对话语音中提取所述目标用户的目标语音,并将所述目标语音转换为目标文本的步骤,包括:
在所述对话语音中,确定至少一段有效语音;
提取所述有效语音的语音声纹特征;
将所述语音声纹特征与预设的目标用户声纹特征进行比对,若所述语音声纹特征与所述目标用户声纹特征相似,将所述有效语音确定为目标语音;
基于语音识别,将所述目标语音转换为目标文本。
3.根据权利要求1所述的方法,其特征在于,所述基于所述目标用户的所述目标文本,生成标准问题以及所述标准问题对应的标准答案的步骤,包括:
在所述目标文本获取至少一个标准答案;
基于所述标准答案,生成所述标准答案对应的标准问题。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采用预设的实体识别模型,在所述目标文本中,提取至少一个实体;
基于所述目标文本,确定所述实体对应的属性以及属性值,生成所述实体对应的三元组。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
确定所述知识点之间的相似度;所述知识点包括所述三元组,和/或,所述标准答案;
基于所述知识点之间的相似度,将所述知识点分为至少一个类别。
6.一种文本查找方法,其特征在于,所述方法包括:
获取提问文本;
在所述知识库中查找与所述提问文本相似度最高的标准问题,确定为目标标准问题;其中,所述知识库通过获取目标用户...
【专利技术属性】
技术研发人员:李翔,李健,武卫东,
申请(专利权)人:北京捷通华声科技股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。