An embodiment of the present invention provides a method and device for building a knowledge base, which includes acquiring knowledge points, dividing the knowledge points into a plurality of knowledge blocks according to the knowledge points, and storing the knowledge blocks formed by the plurality of knowledge blocks in the knowledge base in accordance with the preset storage structure. By decomposing the knowledge points and storing the knowledge in the form of the set of knowledge blocks, the scheme reduces the complexity of knowledge in the integration and sharing. It can also achieve accurate knowledge feedback in the knowledge search, and meet the user's fast acquisition of different granularity knowledge.
【技术实现步骤摘要】
一种知识库的构建方法和装置
本专利技术涉及通信
,特别是指一种知识库的构建方法和装置。
技术介绍
在客服领域,知识库已经成为客服部门日常应答客户问题的知识来源。知识库是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。(1)知识采编方面在客服领域,存在着海量的以非结构化文档形式存储的知识,目前的知识采编过程还是以人工录入为主,效率低下。特别是要实现知识点的分割细化,就更加需要机器来自动完成而减少人工干预,进而才会提高知识的采编效率。(2)知识存储方面传统的文档式知识库采用大篇幅式存储,在知识维护、共享与扩展等方面都存在一些较为突出的问题,造成了工作效率的降低,已经被数据库管理系统所替代。而基于数据库管理系统的知识库,目前的存储形式分为两种,即基于关系型数据库和非关系型数据库,其优势在于知识的生产、审核与知识使用不会被割裂开来,同时提高了工作效率。在客服领域,针对某项业务下的知识点往往是由QA(问题-答案)和非QA组成,特别是非QA内容,又会包含图表等复杂内容,而现有的知识库往往对知识点内容进行整体性存储,并没有对其进行细粒度的分割,进而导致提供给客户的不是最精确的答案。(3)知识共享方面在客服领域,由于地域性的差异,各个地域客服部门会维护一套自己的知识库,很多共性的知识都是在进行重复性的存储。(4)知识获取方面大部分情况是客户写入关键词、自动关联一篇或几篇知识文档推送给客户,而这些知识文档之前是服务于座席培训、阅读 ...
【技术保护点】
一种知识库的构建方法,其特征在于,包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。
【技术特征摘要】
1.一种知识库的构建方法,其特征在于,包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。2.根据权利要求1所述的知识库的构建方法,其特征在于,所述知识块包括:(参数,知识)构成的键值对。3.根据权利要求2所述的知识库的构建方法,其特征在于,按照预设存储结构将所述多个知识块形成的知识块集存储在知识库的步骤包括:按照KM=(N,C,B,H,T,R,L)的存储结构,将所述多个知识块形成的知识块集存储在知识库中;其中,KM为知识块集;N表示知识点名称;C表示知识点分割后的知识块;B表示知识点所属的业务名称;H表示知识点所属的业务与其他业务的上下位关系或同位关系;T表示业务模板;R表示知识点之间的相近或互斥关系;L表示知识点所属的地域名称。4.根据权利要求3所述的知识库的构建方法,其特征在于,知识块的集合C={C1,C2,…,Ci},其中,Ci=(p,v,n),p是参数,v是具体的答案值,n是一个用来将知识块排序的数值;H={H1,H2,…,Hi},其中,Hi=(n,t),其中n是业务名称,t是关系的类型;所述业务模板中包括知识点的知识块的参数的集合,即T={p1,p2,…,pi},其中,pi为参数;知识点之间的关系R={R1,R2,…Ri},而Ri=(n,t),其中,n是关联的知识点名称,t是关系的类型;L=(n,p,c),其中n是国家,p是省份,c是城市。5.根据权利要求1所述的知识库的构建方法,其特征在于,还包括:建立所述知识点所属的业务以及与该业务关联的其它业务之间的关联关系,并将该关联关系存储在所述知识库中;和/或建立多个知识点中知识点与知识点之间的关联关系,并将该关联关系存储在所述知识库中。6.根据权利要求5所述的知识库的构建方法,其特征在于,建立所述知识点所属的业务以及与该业务关联的其它业务之间的关联关系的步骤包括:通过业务关系模型RM1=(B,K,R1),建立所述知识点所属的业务以及,该业务关联的其它业务之间的关联关系;其中,B表示业务名称的集合,即B={B1,B2,…,Bi};K表示知识点的集合,即K={K1,K2,…,Ki};R1代表示业务与业务之间的关系,所述关系包括:上下位关系或者同位关系。7.根据权利要求5所述的知识库的构建方法,其特征在于,建立多个知识点中知识点与知识点之间的关联关系的步骤包括:通过知识点关系模型RM2=(K,R2)建立多个知识点中知识点与知识点之间的关联关系;其中,K表示知识点的集合,即K={K1,K2,…,Ki};R2表示知识点与知识点之间的关系。8.根据权利要求2所述的知识库的构建方法,其特征在于,还包括:构建基于知识的同义词表、用代词表、上位词表和/或下位词表;将所述同义词表、用代词表、上位词表和/或下位词表存储在所述知识库中。9.根据权利要求2所述的知识库的构建方法,其特征在于,在非结构化文档中,知识点包括的知识块集合为:知识点A={(参数1,知识1),(参数2,知识2),…,(参数n,知识n)};Word文档中,参数与知识的键值对,通过标题进行识别和拆分;Html文档中,参数与知识的键值对,通过标签进行识别和拆分;Excel文档中,参数与知识的键值对,通过列标题进行识别和拆分。10.一种知识库的构...
【专利技术属性】
技术研发人员:段福高,冯俊兰,邓路,胡珉,王燕蒙,
申请(专利权)人:中国移动通信有限公司研究院,中国移动通信集团公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。