The invention discloses a method and apparatus for updating the knowledge base data, relates to the technical field of data processing, the main purpose is to reduce the error rate and omission and update the knowledge base leads to the rate of artificial operation is simplified to update the knowledge base of the. Including the technical scheme of the invention: access to update data; on the need to update the data format, the format for the data to be updated data processing structure as the data structure of data consistent with the knowledge base of the central plains; format after processing the data and update the knowledge in the original data are compared; if the format after the update data and the original data are not consistent, is based on the format of the data to be updated after updating the knowledge base. The invention is mainly used in updating the knowledge base.
【技术实现步骤摘要】
知识库数据的更新方法及装置
本专利技术涉及数据处理
,特别是涉及一种知识库数据的更新方法及装置。
技术介绍
知识库(KnowledgeBase)是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。这些知识片包括与领域相关的理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。目前,在建立知识库后,基于知识库中的数据信息定期从第三方数据源检索是否存在更新的数据信息。在更新知识库中数据信息时,主要通过人工检索第三方数据源的方式实现,具体实现过程如下:基于爬虫程序从第三方数据源获取数据信息,或者通过人工检索的方式从第三方数据源获取数据信息;将获取到的数据信息进行筛选、核实、分类、整理;将整理后的数据信息与知识库中原有的数据信息进行比对,若整理后的数据信息与知识库中原有的数据信息不一致,则基于整理后的数据信息更新知识库。专利技术人在通过上述方式更新知识库时,发现其存在如下问题:由于知识库对应的领域所包含的数据信息非常庞大,并且数据信息较复杂,导致人工在对知识库进行更新时其操作过程复杂繁琐、耗时耗力,同时,更新知识库数据信息时依赖于人工,导致误差率和遗漏率增大。
技术实现思路
有鉴于此,本专利技术提供的一种知识库数据的更新方法及装置,主要目的在于简化更新知识库的操作过程及降低人工更新知识库导致的误差率及遗漏率。为了解决上述问题,本专利技术主要提供如下技术方案:一方面,本专利技术提供 ...
【技术保护点】
一种知识库数据的更新方法,其特征在于,包括:获取待更新数据;对所述待更新数据进行格式化处理,所述格式化处理为将所述待更新数据的数据结构处理为与知识库中原有数据一致的数据结构;将格式化处理后的所述待更新数据与所述知识库中所述原有数据进行比对;若格式化处理后的所述待更新数据与所述原有数据不一致,则基于格式化处理后的所述待更新数据更新所述知识库。
【技术特征摘要】
1.一种知识库数据的更新方法,其特征在于,包括:获取待更新数据;对所述待更新数据进行格式化处理,所述格式化处理为将所述待更新数据的数据结构处理为与知识库中原有数据一致的数据结构;将格式化处理后的所述待更新数据与所述知识库中所述原有数据进行比对;若格式化处理后的所述待更新数据与所述原有数据不一致,则基于格式化处理后的所述待更新数据更新所述知识库。2.根据权利要求1所述的方法,其特征在于,对所述待更新数据进行格式化处理包括:获取所述知识库中原有数据对应的数据结构;基于所述数据结构对所述待更新数据进行格式化处理。3.根据权利要求2所述的方法,其特征在于,在基于格式化处理后的所述待更新数据更新所述知识库之前,所述方法还包括:输出显示格式化处理后的所述待更新数据与所述原有数据不一致的数据。4.根据权利要求3所述的方法,其特征在于,基于格式化处理后的所述待更新数据更新所述知识库包括:接收确认更新所述知识库的执行指令;根据所述执行指令更新所述知识库。5.根据权利要求1-4中任一项所述的方法,其特征在于,获取待更新数据,包括:接收爬虫程序爬取的所述待更新数据,所述爬虫程序的爬取频次与获取待更新数据的数据源更新的频次一致;获取所述待更新数据。6.一种知识库数据的更新装置,其特征在于,包括:获取单元,用于获取待更新数据;处理单元,用于对所述获取单元获...
【专利技术属性】
技术研发人员:刘嘉,钦滨杰,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。