【技术实现步骤摘要】
网页客服知识抽取方法及装置
本专利技术涉及数据处理
,尤其是涉及一种网页客服知识抽取方法及装置。
技术介绍
知识抽取即从不同来源、不同结构的数据中进行知识提取,形成知识条目(结构化知识、资源描述框架三元组)存入到知识图谱中,从而进行知识检索和知识推理。客服知识库用于存储知识图谱。客服知识库中存储的基本单元是知识本体,这些知识本体通常是知识维护人员根据业务经验从网页、文档等根据知识模板手动拆解得到,这种方式依赖人工以及知识梳理专家的模板,适用于小数据集。面对海量客服知识时,客服知识库数据更新迭代效率低。
技术实现思路
本专利技术提供了一种网页客服知识抽取方法及装置,可以用于提升客服知识库数据更新迭代效率。第一方面,本专利技术实施例提供了一种网页客服知识抽取方法,该方法包括:获取所述网页的客服数据;计算所述客服数据与模板库中各模板的匹配度;所述模板是用于进行知识筛选的组件;根据所述匹配度确定目标模板;利用所述目标模板对所述网页进行知识抽取。第二方面,本专利技术实施例还提供一种网页客服知识 ...
【技术保护点】
1.一种网页客服知识抽取方法,其特征在于,包括:/n获取所述网页的客服数据;/n计算所述客服数据与模板库中各模板的匹配度;所述模板是用于进行知识筛选的组件;/n根据所述匹配度确定目标模板;/n利用所述目标模板对所述网页进行知识抽取。/n
【技术特征摘要】
1.一种网页客服知识抽取方法,其特征在于,包括:
获取所述网页的客服数据;
计算所述客服数据与模板库中各模板的匹配度;所述模板是用于进行知识筛选的组件;
根据所述匹配度确定目标模板;
利用所述目标模板对所述网页进行知识抽取。
2.根据权利要求1所述的方法,其特征在于,获取所述网页的客服数据之前,还包括:
利用网页爬取组件,获取所述网页的业务数据;
对所述业务数据进行清洗处理,得到客服数据。
3.根据权利要求1所述的方法,其特征在于,根据所述匹配度确定目标模板,包括:
若第一模板对应的匹配度大于预设匹配度阈值,且所述第一模板对应的匹配度大于所述模板库中任意模板对应的匹配度,则将所述第一模板作为目标模板。
4.根据权利要求3所述的方法,其特征在于,利用所述目标模板对所述网页进行知识抽取,包括:
接收网页标注信息;
根据所述网页标注信息,利用所述目标模板对所述网页进行知识抽取。
5.根据权利要求3所述的方法,其特征在于,还包括:
若不存在目标模板,则生成知识抽取提醒信息,并将所述知识抽取提醒信息发送至显示模块,以使所述显示模块显示所述抽取提醒信息。
6.一种网页客服知识抽取装置,其特征在于,包括:
获取模块,用于获取所述网页的客服数据;
匹配模块,用于计算所述客服数据与模板库中各模板的匹配...
【专利技术属性】
技术研发人员:申亚坤,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。