【技术实现步骤摘要】
知识库文本同步方法、装置、电子设备及存储介质
本申请涉及数据处理
,尤其涉及一种知识库文本同步方法、装置、电子设备及存储介质。
技术介绍
随着计算机技术的发展,智能技术往往能在很多领域代替人们完成重复的工作,其中一个应用较广泛的就是智能问答系统,比如电商领域的客服系统。用户的问题和提问形式可能多种多样,有的智能问答系统,还需要能回答特定专业领域的问题,为了能满足这样的需求,智能问答系统需要从现实中获取知识,将知识存储于知识库中。相关技术中,在对知识库数据进行同步时,一般是人工导入、人工收集、标注、整理的方法,费时费力,并且往往需要人工同时维护多份数据的一致性,效率低下且容易出错。
技术实现思路
本申请提供了一种知识库文本同步方法、装置、电子设备及存储介质,用以解决相关技术中,在对知识库数据进行同步时,效率低下的问题。第一方面,本申请提供了一种知识库文本同步方法,包括:在同步任务被触发后,获取目标数据源中的待同步知识库文本;对所述待同步知识库文本进行文本分割,得到章节数 ...
【技术保护点】
1.一种知识库文本同步方法,其特征在于,应用于智能问答场景,包括:/n在同步任务被触发后,获取目标数据源中的待同步知识库文本;/n对所述待同步知识库文本进行文本分割,得到章节数据;以及,提取所述待同步知识库文本中的格式数据,将所述待同步知识库文本中,所述格式数据与知识库的预设格式数据匹配的文本数据,配置为标准问题数据和富文本问题数据,将所述标准问题数据和富文本问题数据作为问题数据;/n将所述章节数据和所述问题数据存储至智能问答系统的知识库,以使所述智能问答系统根据所述知识库中数据进行知识匹配。/n
【技术特征摘要】
1.一种知识库文本同步方法,其特征在于,应用于智能问答场景,包括:
在同步任务被触发后,获取目标数据源中的待同步知识库文本;
对所述待同步知识库文本进行文本分割,得到章节数据;以及,提取所述待同步知识库文本中的格式数据,将所述待同步知识库文本中,所述格式数据与知识库的预设格式数据匹配的文本数据,配置为标准问题数据和富文本问题数据,将所述标准问题数据和富文本问题数据作为问题数据;
将所述章节数据和所述问题数据存储至智能问答系统的知识库,以使所述智能问答系统根据所述知识库中数据进行知识匹配。
2.根据权利要求1所述的知识库文本同步方法,其特征在于,所述将所述待同步知识库文本中,所述格式数据与知识库的预设格式数据匹配的文本数据,配置为标准问题数据和富文本问题数据,将所述标准问题数据和富文本问题数据作为问题数据之后,还包括:
提取所述问题数据对应的格式数据中的标签信息;
将所述标签信息存储至所述知识库中。
3.根据权利要求1或2所述的知识库文本同步方法,其特征在于,所述对所述待同步知识库文本进行文本分割,得到章节数据;以及,提取所述待同步知识库文本中的格式数据,将所述待同步知识库文本中,所述格式数据与知识库的预设格式数据匹配的文本数据,配置为标准问题数据和富文本问题数据,将所述标准问题数据和富文本问题数据作为问题数据之后,还包括:
对所述章节数据和所述问题数据进行中文分词,得到分词结果;
根据所述分词结果计算各所述标签信息的权重,将所述标签信息的权重存储在所述知识库中,以使所述知识库基于所述权重进行知识匹配。
4.根据权利要求1所述的知识库文本同步方法,其特征在于,所述在同步任务被触发后,获取目标数据源中的待同步知识库文本之前,还包括:
获取预设的配置参数,所述配置参数包括数据源地址、数据在所述知识库中的分类、数据源中待同步知识库文本的获取路径中的至少一个;
根据预设的配置参数确定所述目标数据源。
5.根据权利要...
【专利技术属性】
技术研发人员:黄亚文,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。