数据处理方法、装置、存储介质及设备制造方法及图纸

技术编号:24455819 阅读:51 留言:0更新日期:2020-06-10 15:31
本申请实施例公开了一种数据处理的方法、装置、存储介质及设备,包括:将待识别的目标对象的关键信息集合输入至父分类模型,该父分类模型与至少两个子分类模型之间具有类别映射关系,采用该父分类模型对该目标对象的关键信息集合进行领域属性识别,得到该目标对象的领域属性类别,根据该类别映射关系从该至少两个子分类模型中选择与该目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型,采用该目标子分类模型对该目标对象的关键信息集合进行对象属性识别,得到该目标对象的对象属性类别。通过本申请实例能够提高获取对象的类别信息的效率和准确度。

Data processing method, device, storage medium and equipment

【技术实现步骤摘要】
数据处理方法、装置、存储介质及设备
本申请涉及人工智能
,尤其涉及一种数据处理方法、装置、存储介质及设备。
技术介绍
人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术、机器学习以及深度学习等几大方向。其中,自然语言处理技术是实现人与计算机之间用自然语言进行有效通信的各种理论和方法,被广泛应用于机器翻译、语音搜索、语音输入、语音对话、智能问答等各个领域。知识图谱是自然语言处理技术的核心模块之一,是一种语义网络的知识库,即具有有向图结构的一个知识库,其中图的节点代表实体,而图的边代表实体之间的各种语义关系。所谓实体是指具有可区别性且独立存在的某种事物,用于表示对象的类别,如人物、地名、植物、商品、概念等等,概念是指具有同种类别、种类的对象构成的集合,如国家、民族、书籍等;语义关系可以包括从属关系、对等关系等。通常在建立知识图谱的过程中,需要获取对象进行类别信息,从而根据对象的类别信息确定各个实体之间的语义关系。目前,主要是采用人工分类的方式来获取对象的类别信息,导致获取对象的类别信息的效率较低,并且,分类人员所熟悉的知识领域有限,导致获取到的类别信息的准确度不高。申请内容本申请实施例所要解决的技术问题在于,提供一种数据处理方法、装置、存储介质及设备,能够提高获取对象的类别信息的效率和准确度。本申请实施例一方面提供一种数据处理方法,包括:将待识别的目标对象的关键信息集合输入至父分类模型,该父分类模型与至少两个子分类模型之间具有类别映射关系;采用该父分类模型对该目标对象的关键信息集合进行领域属性识别,得到该目标对象的领域属性类别;根据该类别映射关系从该至少两个子分类模型中选择与该目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型;采用该目标子分类模型对该目标对象的关键信息集合进行对象属性识别,得到该目标对象的对象属性类别。本申请实施例一方面提供一种数据处理方法,包括:将第一样本对象的关键信息集合输入到初始父分类模型中进行领域属性预测,得到该第一样本对象的预测领域属性类别,该初始父分类模型与至少两个初始子分类模型之间具有类别映射关系;采用该第一样本对象的标注领域属性类别和预测领域属性类别对该初始父分类模型进行调整,将调整后的该初始父分类模型作为父分类模型;根据该类别映射关系从该至少两个初始子分类模型中选择与该第一样本对象的预测领域属性类别匹配的初始子分类模型,作为目标初始子分类模型;将该第一样本对象的关键信息集合输入到该目标初始子分类模型中进行对象属性预测,得到该第一样本对象的预测对象属性类别;采用该第一样本对象的标注对象属性类别和预测对象属性类别对该目标初始子分类模型进行调整,将调整后的该目标初始子分类模型作为目标子分类模型。本申请实施例一方面提供一种数据处理装置,包括:输入模块,用于将待识别的目标对象的关键信息集合输入至父分类模型,该父分类模型与至少两个子分类模型之间具有类别映射关系;识别模块,用于采用该父分类模型对该目标对象的关键信息集合进行领域属性识别,得到该目标对象的领域属性类别;选择模块,用于根据该类别映射关系从该至少两个子分类模型中选择与该目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型;该识别模块,还用于采用该目标子分类模型对该目标对象的关键信息集合进行对象属性识别,得到该目标对象的对象属性类别。可选的,选择模块,具体用于获取知识图谱,该知识图谱包括父分类层级和子分类层级,该父分类层级与该父分类模型对应,该子分类层级与该至少两个子分类模型对应,该父分类层级包括至少两个领域属性类别,该知识图谱用于指示该至少两个子分类模型中的每个子分类模型与该父分类层级中的领域属性类别之间的类别映射关系;根据该知识图谱从该至少两个子分类模型中选择与该目标对象的领域属性类别具有类别映射关系的子分类模型,作为该目标子分类模型。可选的,该装置还包括:建立模块,用于建立该关键词分别与该目标对象的领域属性类别和对象属性类别之间的词映射关系;添加模块,用于根据该词映射关系将该关键词添加至该知识图谱中。可选的,该父分类模型包括至少两个输出接口,该父分类模型通过该输出接口与每个该子分类模型相连接;选择模块,具体用于从该至少两个输出接口中获取输出该目标对象的领域属性类别的输出接口,作为目标输出接口;将与该目标输出接口相连接的子分类模型,作为目标子分类模型。可选的,识别模块,具体用于调用该父分类模型对该目标对象的关键信息集合进行特征提取,得到该目标对象的关键信息集合对应的特征向量;调用该父分类模型对该目标对象的关键信息集合对应的特征向量进行领域属性识别,得到该目标对象的领域属性类别。可选的,该目标对象的关键信息集合包括基础关键信息、结构化关键信息以及属性关键信息,该父分类模型包括全量词向量层和关键词向量层;识别模块,具体用于调用该全量词向量层对该基础关键信息、该结构化关键信息以及该属性关键信息进行全量特征提取,得到该基础关键信息对应的全量词向量、该结构化关键信息对应的全量词向量以及该属性关键信息对应的全量词向量;调用该关键词向量层提取该属性关键信息中的属性关键词,对该属性关键词进行特征提取,得到该属性关键信息对应的属性关键词向量;将该基础关键信息对应的全量词向量、该结构化关键信息对应的全量词向量、该属性关键信息对应的全量词向量以及该属性关键词向量,作为该目标对象的关键信息集合对应的特征向量。可选的,该父分类模型包括拼接层和分类层,识别模块,具体用于调用该拼接层对该基础关键信息对应的全量词向量、该结构化关键信息对应的全量词向量、该属性关键信息对应的全量词向量以及该属性关键词向量进行拼接处理,得到目标特征向量;调用该分类层对该目标特征向量进行领域属性识别,得到该目标对象的领域属性类别。可选的,识别模块,具体用于将该父分类模型进行特征提取得到的该目标对象的关键信息集合对应的特征向量,作为父特征向量;调用该目标子分类模型对该目标对象的关键信息集合进行特征提取,得到该目标对象的关键信息集合对应的特征向量,作为子特征向量;调用该目标子分类模型对该父特征向量和该子特征向量进行对象属性识别,得到该目标对象的对象属性类别。本申请实施例一方面提供一种数据处理装置,包括:输入模块,用于将第一样本对象的关键信息集合输入到初始父分类模型中进行领域属性预测,得到该第一样本对象的预测领域属性类别,该初始父分类模型与至少两个初始子分类模型之间具有类别映射关系;调整模块,用于采用该第一样本对象的标注领域属性类别和预测领域属性类别对该初始父分类模型进行调整,将调整后的该初始父分类模型作为父分类模型;选择模块,用于根据该类别映射关系从该至少两个初始子分类模型中选择与该第一样本对象的预测领域属性类别匹配的初始子分类模型,作为目标初始子分类模型;该输入模块,还用于将该第一样本对象的关键信息集合输入到该目标初始子分类模型中进本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,包括:/n将待识别的目标对象的关键信息集合输入至父分类模型,所述父分类模型与至少两个子分类模型之间具有类别映射关系;/n采用所述父分类模型对所述目标对象的关键信息集合进行领域属性识别,得到所述目标对象的领域属性类别;/n根据所述类别映射关系从所述至少两个子分类模型中选择与所述目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型;/n采用所述目标子分类模型对所述目标对象的关键信息集合进行对象属性识别,得到所述目标对象的对象属性类别。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:
将待识别的目标对象的关键信息集合输入至父分类模型,所述父分类模型与至少两个子分类模型之间具有类别映射关系;
采用所述父分类模型对所述目标对象的关键信息集合进行领域属性识别,得到所述目标对象的领域属性类别;
根据所述类别映射关系从所述至少两个子分类模型中选择与所述目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型;
采用所述目标子分类模型对所述目标对象的关键信息集合进行对象属性识别,得到所述目标对象的对象属性类别。


2.如权利要求1所述的方法,其特征在于,所述根据所述类别映射关系从所述至少两个子分类模型中选择与所述目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型,包括:
获取知识图谱,所述知识图谱包括父分类层级和子分类层级,所述父分类层级与所述父分类模型对应,所述子分类层级与所述至少两个子分类模型对应,所述父分类层级包括至少两个领域属性类别,所述知识图谱用于指示所述至少两个子分类模型中的每个子分类模型与所述父分类层级中的领域属性类别之间的类别映射关系;
根据所述知识图谱从所述至少两个子分类模型中选择与所述目标对象的领域属性类别具有类别映射关系的子分类模型,作为所述目标子分类模型。


3.如权利要求2所述的方法,其特征在于,所述目标对象的关键信息集合包括关键词,所述方法还包括:
建立所述关键词分别与所述目标对象的领域属性类别和对象属性类别之间的词映射关系;
根据所述词映射关系将所述关键词添加至所述知识图谱中。


4.如权利要求1所述的方法,其特征在于,所述父分类模型包括至少两个输出接口,所述父分类模型通过所述输出接口与每个所述子分类模型相连接;所述根据所述类别映射关系从所述至少两个子分类模型中选择与所述目标对象的领域属性类别匹配的子分类模型,作为目标子分类模型,包括:
从所述至少两个输出接口中获取输出所述目标对象的领域属性类别的输出接口,作为目标输出接口;
将与所述目标输出接口相连接的子分类模型,作为目标子分类模型。


5.如权利要求1所述的方法,其特征在于,所述采用所述父分类模型对所述目标对象的关键信息集合进行领域属性识别,得到所述目标对象的领域属性类别,包括:
调用所述父分类模型对所述目标对象的关键信息集合进行特征提取,得到所述目标对象的关键信息集合对应的特征向量;
调用所述父分类模型对所述目标对象的关键信息集合对应的特征向量进行领域属性识别,得到所述目标对象的领域属性类别。


6.如权利要求5所述的方法,其特征在于,所述目标对象的关键信息集合包括基础关键信息、结构化关键信息以及属性关键信息,所述父分类模型包括全量词向量层和关键词向量层;
所述调用所述父分类模型对所述目标对象的关键信息集合进行特征提取,得到所述目标对象的关键信息集合对应的特征向量,包括:
调用所述全量词向量层对所述基础关键信息、所述结构化关键信息以及所述属性关键信息进行全量特征提取,得到所述基础关键信息对应的全量词向量、所述结构化关键信息对应的全量词向量以及所述属性关键信息对应的全量词向量;
调用所述关键词向量层提取所述属性关键信息中的属性关键词,对所述属性关键词进行特征提取,得到所述属性关键信息对应的属性关键词向量;
将所述基础关键信息对应的全量词向量、所述结构化关键信息对应的全量词向量、所述属性关键信息对应的全量词向量以及所述属性关键词向量,作为所述目标对象的关键信息集合对应的特征向量。


7.如权利要求6所述的方法,其特征在于,所述父分类模型包括拼接层和分类层,所述调用所述父分类模型对所述目标对象的关键信息集合对应的特征向量进行领域属性识别,得到所述目标对象的领域属性类别,包括:
调用所述拼接层对所述基础关键信息对应的全量词向量、所述结构化关键信息对应的全量词向量、所述属性关键信息对应的全量词向量以及所述属性关键词向量进行拼接处理,得到目标特征向量;
调用所述分类层对所述目标特征向量进行领域属性识别,得到所述目标对象的领域属性类别。


8.如权利要求5所述的方法,其特征在于,所述采用所述目标子分类模型对所述目标对象的关键信息集合进行对象属性识别,得到所述目标对象的对象属性类别,包括:
将所述父分类模型进行特征提取得到的所述目标对象的关键信息集合对应的特征向量,作为父特征向量;
调用所述目标子分类模型对所述目标对象的关键信息集合进行特征提取,得到所述目标对象的关键信息集合对应的特...

【专利技术属性】
技术研发人员:吴旭辉荆宁张红林
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1