文本分类模型的更新训练方法、装置及设备制造方法及图纸

技术编号:20160524 阅读:19 留言:0更新日期:2019-01-19 00:13
本公开涉及人工智能技术领域,具体揭示了一种文本分类模型的更新训练方法、装置及设备,文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成语义提取层和分类层的训练,包括:获取新增知识点对应的样本文本以及对样本文本进行标注的标注标签;通过根据样本数据完成训练的语义提取层构建样本文本的特征向量;根据样本文本的特征向量以及样本文本对应的标注标签进行分类层的更新训练,以实现文本分类模型的更新训练。在需要对文本分类模型进行更新训练时,仅进行分类层的更新训练,从而可以大幅缩短文本分类模型更新训练的时间,实现文本分类模型的及时更新。

【技术实现步骤摘要】
文本分类模型的更新训练方法、装置及设备
本公开涉及人工智能
,特别涉及一种文本分类模型的更新训练方法、装置及设备。
技术介绍
现有客服机器人问答系统中的文本分类模型,在客服机器人的知识库新增新产品相关的知识点或者新增热点问题相关的知识点后,需要对文本分类模型进行重新训练,一般重新训练一个文本分类模型需要很长的时间,从而导致文本分类模型更新不及时,客服机器人无法回答新增知识点相关的问题。所以由于文本分类模型训练时间长导致文本分类模型更新不及时的问题还有待解决。
技术实现思路
为了解决相关技术中存在的问题,本公开提供了一种文本分类模型的更新训练方法及装置。一种文本分类模型的更新训练方法,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,所述文本分类模型的更新训练方法包括:获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。一种文本分类模型的更新训练装置,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,所述文本分类模型的更新训练装置包括:获取模块,被配置为执行:获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;特征向量构建模块,被配置为执行:通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;更新训练模块,被配置为执行:根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。在一实施例中,所述特征向量构建模块包括:分词单元,被配置为执行:通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词;特征向量构建单元,被配置为执行:根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。在一实施例中,所述装置还包括:分类标签补充模块,被配置为执行:根据所述样本文本对应的标注标签补充所述分类层的分类标签;分类标签集合更新模块,被配置为执行:根据所补充的分类标签更新所述分类层的分类标签集合。在一实施例中,所述更新训练模块包括:分类标签预测单元,被配置为执行:利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签;判断单元,被配置为执行:进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断;调整单元,被配置为执行:如果不一致,调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。在一实施例中,分类标签预测单元包括:概率预测单元,被配置为执行:利用所述分类层根据所述特征向量预测得到所述特征向量对应于更新后的所述分类标签集合中每一分类标签的概率;分类标签确定单元,被配置为执行:遍历所述每一分类标签的概率,以最大概率值所对应的分类标签作为所述样本文本对应的分类标签。在一实施例中,所述装置还包括:分类测试模块,被配置为执行:通过更新后的所述文本分类模型对若干测试样本进行分类;分类精度计算模块,被配置为执行:根据分类结果计算得到更新训练后的所述文本分类模型对所述若干测试样本的分类精度;更新训练结束模块,被配置为执行:如果所述分类精度达到指定精度,结束所述文本分类模型的更新训练。一种文本分类模型的更新训练设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为执行以上所述的方法。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以上所述的方法。通过本申请的技术方案,在文本分类模型已根据原有知识点的样本数据进行训练的基础上,在需要对文本分类模型进行更新训练时,仅进行分类层的更新训练,实现文本分类模型的更新训练,从而可以大幅缩短文本分类模型更新训练的时间,实现文本分类模型的及时更新,进而人工智能
中的客服机器人等可以及时用于进行新增知识点相关问题的回复。应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并于说明书一起用于解释本专利技术的原理。图1是根据本公开所涉及的实施环境的示意图;图2是根据一示例性实施例示出的一种服务器的框图;图3是根据一示例性实施例示出的一种文本分类模型的更新训练方法的流程图;图4是图3所示实施例的步骤S130的流程图;图5是是图3所示实施例的步骤S150之前步骤的流程图;图6是图3所示实施例的步骤S150的流程图;图7是图6所示实施例的步骤S151的流程图;图8是图3所示实施例的步骤S150之后步骤的流程图;图9是根据一示例性实施例示出的一种文本分类模型的更新训练装置的框图;图10是根据一示例性实施例示出的一种文本分类模型的更新训练设备的框图。具体实施方式这里将详细地对示例性实施例执行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本专利技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本专利技术的一些方面相一致的装置和方法的例子。图1是根据本公开所涉及的实施环境的示意图。该实施环境包括:服务器200和至少一个终端100。其中终端100可以是智能手机、平板电脑、笔记本电脑、台式电脑等可以与服务器200建立网络连接且可以运行客户端的电子设备,在此不进行具体限定。终端100与服务器200之间预先建立了无线或者有线的网络连接,从而,通过在终端100上运行的客户端实现终端100与服务器200进行交互。基于服务器200与终端100之间的交互,服务器200便可以获取到用户在终端100上输入的样本文本,然后构建该样本文本的特征向量、对特征向量进行分类预测实现文本分类模型的更新训练等。终端100可以接收服务器200所返回的针对样本文本的分类标签。应当说明的是,本公开文本分类方法,不限于在服务器200中部署相应的处理逻辑,其也可以是部署于其它机器中的处理逻辑。例如,在具备计算能力的终端设备中部署进行文本分类模型的更新训练的处理逻辑等。图2是根据一示例性实施例示出的一种服务器的框图。具有此硬件结构的服务器可用于进行文本分类模型的更新训练而部署在图1所示的实施环境中。需要说明的是,该服务器只是一个适配于本公开的示例,不能认为是提供了对本公开使用范围的任何限制。该服务器也不能解释为需要依赖于或者必须具有图2中示出的示例性的服务器200中的一个或者多个组件。该服务器的硬件结构可因配置或者性能的不同而产生较大的差异,如图2所示,服务器200包括:电源210、接口230、至少一存储器250、以及至少一中央处理器(CPU,CentralProcessingUnits)270。其中,电源210用于为服务器200上的各硬件设备提供工作电压。接口230包括至少一有线或无线网络接口231、至少一串并转换接口233、至少一输入输出接口235以及至少一US本文档来自技高网
...

【技术保护点】
1.一种文本分类模型的更新训练方法,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,其特征在于,包括:获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。

【技术特征摘要】
1.一种文本分类模型的更新训练方法,所述文本分类模型包括语义提取层和分类层,在新增知识点前,根据原有知识点的样本数据完成所述语义提取层和所述分类层的训练,其特征在于,包括:获取新增知识点对应的样本文本以及对所述样本文本进行标注的标注标签;通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量;根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练。2.根据权利要求1所述的方法,其特征在于,所述通过根据所述样本数据完成训练的所述语义提取层构建所述样本文本的特征向量,包括:通过根据原有知识点的样本数据完成训练的所述语义提取层对所述样本文本进行分词;根据所述样本文本中的每个词对应的编码以及每个词的语义权重构建所述样本文本的特征向量。3.根据权利要求1所述的方法,其特征在于,所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练之前,还包括:根据所述样本文本对应的标注标签补充所述分类层的分类标签;根据所补充的分类标签更新所述分类层的分类标签集合。4.根据权利要求3所述的方法,其特征在于,所述根据所述样本文本的特征向量以及所述样本文本对应的标注标签进行所述分类层的更新训练,以实现所述文本分类模型的更新训练,包括:利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签;进行所得到的所述分类标签与所述样本文本所对应标注标签的一致性判断;如果不一致,调整所述分类层的参数直至所得到的所述分类标签与所述标注标签一致。5.根据权利要求4所述的方法,其特征在于,所述利用所述分类层根据所述样本文本的特征向量预测得到所述样本文本所对应的分类标签,包括:利用所述分类层根据所述特征向量预测得到所述特征...

【专利技术属性】
技术研发人员:许开河杨坤王少军肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1