一种知识库的生成方法、文本查找方法和装置制造方法及图纸

技术编号：26171127 阅读：27 留言：0更新日期：2020-10-31 13:41

本发明专利技术实施例提供了一种知识库的生成方法、文本查找方法和装置，所述知识库的生成方法包括：获取目标用户与其他用户对话产生的对话语音；在所述对话语音中提取所述目标用户的目标语音，并将所述目标语音转换为目标文本；基于所述目标用户的所述目标文本，生成标准问题以及所述标准问题对应的标准答案；采用所述标准问题以及所述标准问题对应的标准答案，生成知识库。从而可以得到包含目标用户个人知识体系以及个人认知的目标文本，并实现获得可以体现出目标用户的知识体系以及个人认知的知识库。其他用户可以通过所述知识库，获取基于目标用户的知识体系以及个人认知得到的答案。目标用户可以通过所述知识库，对自身的知识体系进行回溯。

A knowledge base generation method, text search method and device

全部详细技术资料下载

【技术实现步骤摘要】
一种知识库的生成方法、文本查找方法和装置
本专利技术涉及计算机
，特别是涉及一种知识库的生成方法、一种文本查找方法、一种知识库的生成装置和一种文本查找装置。
技术介绍
人可以通过获得知识，应用知识，或者信息加工的过程，得到个人的知识体系，以及个人对世界的认知。然而，个人的知识体系以及个人对世界的认知，只有本人可以了解。若他人希望向一个人咨询问题，获取个人基于其本人知识体系以及本人认知的形成的答案，那么他人一般只能向该个人本人进行咨询，而较难通过其他方式获取该个人对问题的回复。例如，对于医生、律师、心理咨询师等经常接收他人咨询的职业来说，若咨询者希望得到职业人士对其提出问题的回复，通常需要直接向职业人士咨询，而较难通过其他方式获取职业人士对问题的回复。
技术实现思路
鉴于上述问题，提出了本专利技术实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种知识库的生成方法、一种文本查找方法、一种知识库的生成装置和一种文本查找装置。为了解决上述问题，本专利技术实施例公开了一种知识库的生

【技术保护点】
1.一种知识库的生成方法，其特征在于，包括：/n获取目标用户与其他用户对话产生的对话语音；/n在所述对话语音中提取所述目标用户的目标语音，并将所述目标语音转换为目标文本；/n基于所述目标用户的所述目标文本，生成标准问题以及所述标准问题对应的标准答案；/n采用所述标准问题以及所述标准问题对应的标准答案，生成知识库。/n

【技术特征摘要】
1.一种知识库的生成方法，其特征在于，包括：
获取目标用户与其他用户对话产生的对话语音；
在所述对话语音中提取所述目标用户的目标语音，并将所述目标语音转换为目标文本；
基于所述目标用户的所述目标文本，生成标准问题以及所述标准问题对应的标准答案；
采用所述标准问题以及所述标准问题对应的标准答案，生成知识库。

2.根据权利要求1所述的方法，其特征在于，所述在所述对话语音中提取所述目标用户的目标语音，并将所述目标语音转换为目标文本的步骤，包括：
在所述对话语音中，确定至少一段有效语音；
提取所述有效语音的语音声纹特征；
将所述语音声纹特征与预设的目标用户声纹特征进行比对，若所述语音声纹特征与所述目标用户声纹特征相似，将所述有效语音确定为目标语音；
基于语音识别，将所述目标语音转换为目标文本。

3.根据权利要求1所述的方法，其特征在于，所述基于所述目标用户的所述目标文本，生成标准问题以及所述标准问题对应的标准答案的步骤，包括：
在所述目标文本获取至少一个标准答案；
基于所述标准答案，生成所述标准答案对应的标准问题。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括：
采用预设的实体识别模型，在所述目标文本中，提取至少一个实体；
基于所述目标文本，确定所述实体对应的属性以及属性值，生成所述实体对应的三元组。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：
确定所述知识点之间的相似度；所述知识点包括所述三元组，和/或，所述标准答案；
基于所述知识点之间的相似度，将所述知识点分为至少一个类别。

6.一种文本查找方法，其特征在于，所述方法包括：
获取提问文本；
在所述知识库中查找与所述提问文本相似度最高的标准问题，确定为目标标准问题；其中，所述知识库通过获取目标用户...

【专利技术属性】
技术研发人员：李翔，李健，武卫东，
申请(专利权)人：北京捷通华声科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人