一种知识库的构建方法和装置制造方法及图纸

技术编号:17796697 阅读:43 留言:0更新日期:2018-04-25 20:11
本发明专利技术的实施例提供一种知识库的构建方法和装置,方法包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。本发明专利技术的方案通过对知识点进行分解,以知识块集合的形式进行细粒度存储,降低了知识在融合和共享方面的复杂性,在知识搜索方面也可以实现精确的知识反馈,满足用户对不同颗粒度的知识快速获取。

A method and device for building a knowledge base

An embodiment of the present invention provides a method and device for building a knowledge base, which includes acquiring knowledge points, dividing the knowledge points into a plurality of knowledge blocks according to the knowledge points, and storing the knowledge blocks formed by the plurality of knowledge blocks in the knowledge base in accordance with the preset storage structure. By decomposing the knowledge points and storing the knowledge in the form of the set of knowledge blocks, the scheme reduces the complexity of knowledge in the integration and sharing. It can also achieve accurate knowledge feedback in the knowledge search, and meet the user's fast acquisition of different granularity knowledge.

【技术实现步骤摘要】
一种知识库的构建方法和装置
本专利技术涉及通信
,特别是指一种知识库的构建方法和装置。
技术介绍
在客服领域,知识库已经成为客服部门日常应答客户问题的知识来源。知识库是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。(1)知识采编方面在客服领域,存在着海量的以非结构化文档形式存储的知识,目前的知识采编过程还是以人工录入为主,效率低下。特别是要实现知识点的分割细化,就更加需要机器来自动完成而减少人工干预,进而才会提高知识的采编效率。(2)知识存储方面传统的文档式知识库采用大篇幅式存储,在知识维护、共享与扩展等方面都存在一些较为突出的问题,造成了工作效率的降低,已经被数据库管理系统所替代。而基于数据库管理系统的知识库,目前的存储形式分为两种,即基于关系型数据库和非关系型数据库,其优势在于知识的生产、审核与知识使用不会被割裂开来,同时提高了工作效率。在客服领域,针对某项业务下的知识点往往是由QA(问题-答案)和非QA组成,特别是非QA内容,又会包含图表等复杂内容,而现有的知识库往往对知识点内容进行整体性存储,并没有对其进行细粒度的分割,进而导致提供给客户的不是最精确的答案。(3)知识共享方面在客服领域,由于地域性的差异,各个地域客服部门会维护一套自己的知识库,很多共性的知识都是在进行重复性的存储。(4)知识获取方面大部分情况是客户写入关键词、自动关联一篇或几篇知识文档推送给客户,而这些知识文档之前是服务于座席培训、阅读后用来回答客户问题的,但现在直接开放给客户。由于这些文档没做客户化的工作或者做的不够,存在着专业术语多、逻辑不清晰、官方立场而非客户立场等问题,用户看不懂或者与用户问题关联度较差,虽然能够解决一部分问题但满意度不高。另一部分做的比较好的是客户通过类似于聊天的自然语言与系统互动,系统建立了相应的词库进行分词,提取出相应的关键词后再进行搜索,回复给客户的是碎片化的片段内容。这种系统背后的核心仍然是搜索,只是将相应内容作了一定程度的碎片化并手动设置了相应的标签,客户体验好于前面的一种情况,但也只能在客户输入的语言比较专业时效果才好,而问题是大部分客户根本不专业。专利技术人实现本专利技术的过程中,发现现有技术存在如下缺点:1),知识结构优化问题。在实际的知识存储过程中,传统的知识存储方法在知识的共享、融合过程中存在先天性的缺陷。知识共享方面,目前各个地域城市会根据业务分类对知识点的共性知识进行重复性存储。比如“国际业务”下的-“国际长途”知识点,对于“取消国际长途”问题,有两条答案,其中共性的答案是“10086热线取消”,非共性的答案是“访问某城市移动网上营业厅取消”。共性知识的重复性存储严重影响了知识的唯一性和无二义性,在知识的扩充和更改方面也会增加难度和成本。知识融合方面,知识的粒度细分程度决定了知识的融合难易程度。目前客服领域知识的粒度不一,有的是粗粒度(如文档),有的是细粒度(如常见问题知识(FAQ))。很多知识库仅仅针对FAQ实现了细粒度划分,而针对某业务描述性的文档(带有图片、表格等)都是进行粗粒度的存储,如业务-知识点或业务-知识点-摘要的形式,粒度的细分程度不够,客户最终得到也不是精准的知识。2),知识的语义关联问题。目前对知识的关联主要还是在搜索层面上实现的,比如建立了“Family”与“家庭”的关联(同义词),那么无论是用“家庭套餐”还是用“Family套餐”去发现,都可以找到知识库中的“家庭套餐”。但是客户的问题是多样的,如果要给出准确或接近客户意图的知识,单纯在搜索层面上建立词-词关联,给出的仍然是孤立的知识点。如果能够从知识点本身出发,建立知识点与知识点之间的关联,用户会得到更多接近其搜索意图的知识。3),知识自动分割录入问题。目前,知识的生产人员多是通过知识库管理系统界面进行人工知识分割和录入。知识生产人员面临着在不同功能操作之间的反复切换,系统的延迟性与不稳定性都在制约着知识的录入效率。
技术实现思路
本专利技术提供了一种知识库的构建方法和装置,通过对知识点进行分解,以知识块集合的形式进行细粒度存储,降低了知识在融合和共享方面的复杂性,在知识搜索方面也可以实现精确的知识反馈,满足用户对不同颗粒度的知识快速获取。为解决上述技术问题,本专利技术的实施例提供如下方案:一种知识库的构建方法,包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。其中,所述知识块包括:(参数,知识)构成的键值对。其中,按照预设存储结构将所述多个知识块形成的知识块集存储在知识库的步骤包括:按照KM=(N,C,B,H,T,R,L)的存储结构,将所述多个知识块形成的知识块集存储在知识库中;其中,KM为知识块集;N表示知识点名称;C表示知识点分割后的知识块;B表示知识点所属的业务名称;H表示知识点所属的业务与其他业务的上下位关系或同位关系;T表示业务模板;R表示知识点之间的相近或互斥关系;L表示知识点所属的地域名称。其中,知识块的集合C={C1,C2,…,Ci},其中,Ci=(p,v,n),p是参数,v是具体的答案值,n是一个用来将知识块排序的数值;H={H1,H2,…,Hi},其中,Hi=(n,t),其中n是业务名称,t是关系的类型;所述业务模板中包括知识点的知识块的参数的集合,即T={p1,p2,…,pi},其中,pi为参数;知识点之间的关系R={R1,R2,…Ri},而Ri=(n,t),其中,n是关联的知识点名称,t是关系的类型;L=(n,p,c),其中n是国家,p是省份,c是城市。其中,知识库的构建方法还包括:建立所述知识点所属的业务以及与该业务关联的其它业务之间的关联关系,并将该关联关系存储在所述知识库中;和/或建立多个知识点中知识点与知识点之间的关联关系,并将该关联关系存储在所述知识库中。其中,建立所述知识点所属的业务以及与该业务关联的其它业务之间的关联关系的步骤包括:通过业务关系模型RM1=(B,K,R1),建立所述知识点所属的业务以及,该业务关联的其它业务之间的关联关系;其中,B表示业务名称的集合,即B={B1,B2,…,Bi};K表示知识点的集合,即K={K1,K2,…,Ki};R1代表示业务与业务之间的关系,所述关系包括:上下位关系或者同位关系。其中,建立多个知识点中知识点与知识点之间的关联关系的步骤包括:通过知识点关系模型RM2=(K,R2)建立多个知识点中知识点与知识点之间的关联关系;其中,K表示知识点的集合,即K={K1,K2,…,Ki};R2表示知识点与知识点之间的关系。其中,知识库的构建方法还包括:构建基于知识的同义词表、用代词表、上位词表和/或下位词表;将所述同义词表、用代词表、上位词表和/或下位词表存储在所述知识库中。其中,在非结构化文档中,知识点包括的知识块集合为:知识点A={(参数1,知识1),(参数2,知识2),…,(参数n,知识n)};Word文档中,参数与知识的键值对,通过标题进行识别和拆分;Html文档中,参数与知识的键值对,通过标签进行识别和拆分;Exc本文档来自技高网
...
一种知识库的构建方法和装置

【技术保护点】
一种知识库的构建方法,其特征在于,包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。

【技术特征摘要】
1.一种知识库的构建方法,其特征在于,包括:获取知识点;将知识点按照该知识点所属的业务划分为多个知识块;按照预设存储结构将所述多个知识块形成的知识块集存储在知识库中。2.根据权利要求1所述的知识库的构建方法,其特征在于,所述知识块包括:(参数,知识)构成的键值对。3.根据权利要求2所述的知识库的构建方法,其特征在于,按照预设存储结构将所述多个知识块形成的知识块集存储在知识库的步骤包括:按照KM=(N,C,B,H,T,R,L)的存储结构,将所述多个知识块形成的知识块集存储在知识库中;其中,KM为知识块集;N表示知识点名称;C表示知识点分割后的知识块;B表示知识点所属的业务名称;H表示知识点所属的业务与其他业务的上下位关系或同位关系;T表示业务模板;R表示知识点之间的相近或互斥关系;L表示知识点所属的地域名称。4.根据权利要求3所述的知识库的构建方法,其特征在于,知识块的集合C={C1,C2,…,Ci},其中,Ci=(p,v,n),p是参数,v是具体的答案值,n是一个用来将知识块排序的数值;H={H1,H2,…,Hi},其中,Hi=(n,t),其中n是业务名称,t是关系的类型;所述业务模板中包括知识点的知识块的参数的集合,即T={p1,p2,…,pi},其中,pi为参数;知识点之间的关系R={R1,R2,…Ri},而Ri=(n,t),其中,n是关联的知识点名称,t是关系的类型;L=(n,p,c),其中n是国家,p是省份,c是城市。5.根据权利要求1所述的知识库的构建方法,其特征在于,还包括:建立所述知识点所属的业务以及与该业务关联的其它业务之间的关联关系,并将该关联关系存储在所述知识库中;和/或建立多个知识点中知识点与知识点之间的关联关系,并将该关联关系存储在所述知识库中。6.根据权利要求5所述的知识库的构建方法,其特征在于,建立所述知识点所属的业务以及与该业务关联的其它业务之间的关联关系的步骤包括:通过业务关系模型RM1=(B,K,R1),建立所述知识点所属的业务以及,该业务关联的其它业务之间的关联关系;其中,B表示业务名称的集合,即B={B1,B2,…,Bi};K表示知识点的集合,即K={K1,K2,…,Ki};R1代表示业务与业务之间的关系,所述关系包括:上下位关系或者同位关系。7.根据权利要求5所述的知识库的构建方法,其特征在于,建立多个知识点中知识点与知识点之间的关联关系的步骤包括:通过知识点关系模型RM2=(K,R2)建立多个知识点中知识点与知识点之间的关联关系;其中,K表示知识点的集合,即K={K1,K2,…,Ki};R2表示知识点与知识点之间的关系。8.根据权利要求2所述的知识库的构建方法,其特征在于,还包括:构建基于知识的同义词表、用代词表、上位词表和/或下位词表;将所述同义词表、用代词表、上位词表和/或下位词表存储在所述知识库中。9.根据权利要求2所述的知识库的构建方法,其特征在于,在非结构化文档中,知识点包括的知识块集合为:知识点A={(参数1,知识1),(参数2,知识2),…,(参数n,知识n)};Word文档中,参数与知识的键值对,通过标题进行识别和拆分;Html文档中,参数与知识的键值对,通过标签进行识别和拆分;Excel文档中,参数与知识的键值对,通过列标题进行识别和拆分。10.一种知识库的构...

【专利技术属性】
技术研发人员:段福高冯俊兰邓路胡珉王燕蒙
申请(专利权)人:中国移动通信有限公司研究院中国移动通信集团公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1