一种模型生成方法、实体识别方法、装置及电子设备制造方法及图纸

技术编号:23853149 阅读:14 留言:0更新日期:2020-04-18 09:42
本申请提供一种模型生成方法、实体识别方法、装置及电子设备,该模型生成方法包括:根据待训练的目标语句生成特征图像信息,该特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签,该目标语句包括多个字符,每一字符分别对应一区域图块;采用预设的神经网络模型来提取特征图像的特征向量;根据特征向量及对应的类别标签计算对应的训练损失;根据训练损失对神经网络模型进行迭代更新,以获得训练完成的实体识别模型。

A model generation method, entity recognition method, device and electronic equipment

【技术实现步骤摘要】
一种模型生成方法、实体识别方法、装置及电子设备
本申请涉及实体识别
,具体而言,涉及一种模型生成方法、实体识别方法、装置及电子设备。
技术介绍
传统的实体识别方法是通过word2vec将标注语料转化为向量的方式,进而通过神经网络模型对其进行实体识别,但将标注语料转换成向量保存的实体信息较少,进而造成实体识别精度不高的问题。
技术实现思路
本申请实施例的目的在于提供一种模型生成方法、实体识别方法、装置及电子设备,用以解决现有的实体识别方法中将标注语料转换成向量进而通过神经网络模型对其进行实体识别存在的向量保存实体信息较少造成的实体识别精度不高的问题。第一方面,实施例提供一种模型生成方法,所述方法包括:根据待训练的目标语句生成特征图像信息,所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签,所述目标语句包括多个字符,每一所述字符分别对应一所述区域图块;采用预设的神经网络模型来提取所述特征图像的特征向量;根据所述特征向量及对应的类别标签计算对应的训练损失;根据所述训练损失对所述神经网络模型进行迭代更新,以获得训练完成的实体识别模型。在上述设计的模型生成方法中,通过将待训练的目标语句中的每个字符转换成一区域图块,进而根据多个区域图块生成特征图像,也就是将目标语句转换成了特征图像,通过神经网络模型对该特征图像进行特征提取,进而完成实体识别模型的训练,由于特征提取中图像的方式可以保存更多的实体信息,进而提高了实体识别的精度,解决了现有的实体识别方法中将标注语料转换成向量进而通过神经网络模型对其进行实体识别存在的向量保存实体信息较少造成的实体识别精度不高的问题。在第一方面的可选实施方式中,所述根据待训练的目标语句生成特征图像信息,包括:提取所述待训练的目标语句中的每个字符;根据提取的每个字符查找对应的区域图块,每个字符与对应的区域图块预先建立映射关系并存储在数据库中;根据多个区域图块生成所述特征图像。在第一方面的可选实施方式中,在所述根据待训练的目标语句生成特征图像信息之前,所述方法还包括:获取实体数据库中的多个字符以及预设的多个区域图块,其中,所述多个字符中每个字符之间互不重复,预设的多个区域图块中每个区域图块之间互不重复;建立每个字符与一个预设的区域图块的映射关系并存储在所述数据库中。在第一方面的可选实施方式中,所述根据多个区域图块生成所述特征图像,包括:将查找得到的多个区域图块按照对应的字符在所述待训练的目标语句中的位置依次组合,获得组合图像;将所述组合图像填充在空白图像的预设区域,并将所述空白图像除所述预设区域外的其余区域设置为预设的统一字符,获得所述特征图像。在第一方面的可选实施方式中,所述根据多个区域图块生成所述特征图像,包括:将查找得到的多个区域图块按照对应的字符在所述待训练的目标语句中的位置依次组合,获得组合图像;复制多个所述组合图像进行拼接,获得组合拼接图像;将所述组合拼接图像填充在空白图像的预设区域,并将所述空白图像除所述预设区域外的其余区域设置为预设的统一字符,获得所述特征图像。在第一方面的可选实施方式中,所述根据多个区域图块生成所述特征图像,包括:将所述多个区域图块分散填充在空白图像的多个预设区域,所述预设区域的数量与所述区域图块的数量相同;将所述空白图像除所述多个预设区域外的其余区域设置为预设的统一字符,获得所述特征图像。在第一方面的可选实施方式中,在所述根据待训练的目标语句生成特征图像信息之后,所述方法还包括:对所述图像进行归一化以及数据增强处理。在上述设计的实施方式中,通过归一化处理以方便数据处理,加快神经网络学习速度,提高识别的鲁棒性;通过数据增强处理以此来防止深度学习模型过拟合,提高识别的可靠性。第二方面,实施例提供一种实体识别方法,所述方法包括:根据待识别的实体语句生成特征图像,所述特征图像信息包括由多个区域图块组成的特征图像,所述待识别的实体语句包括多个字符,每一所述字符分别对应一所述区域图块;将所述特征图像输入实体识别模型,所述实体识别模型为第一方面中任一可选实施方式生成的所述实体识别模型;获得所述实体识别模型输出的所述待识别的实体语句的预测标签。在上述设计的实体识别方法中,根据该待识别的实体语句生成特征图像,进而通过第一实施例训练完成得到的实体模型对待识别的实体语句生成的特征图像进行预测,进而得到该实体识别模型输出的预测标签,由于该实体识别方法是通过语句转换成特征图像,进而通过第一实施例训练得到的实体模型进行识别,因此,保留的实体识别信息更多,实体识别的精度更高。第三方面,实施例提供一种模型生成装置,所述装置包括:生成模块,用于根据待训练的目标语句生成特征图像信息,所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签,所述目标语句包括多个字符,每一所述字符分别对应一所述区域图块;提取模块,用于采用预设的神经网络模型来提取所述特征图像的特征向量;计算模块,用于根据所述特征向量及对应的类别标签计算对应的训练损失;更新模块,用于根据所述训练损失对所述神经网络模型进行迭代更新,以获得训练完成的实体识别模型。在上述设计的模型生成装置中,通过将待训练的目标语句中的每个字符转换成一区域图块,进而根据多个区域图块生成特征图像,也就是将目标语句转换成了特征图像,通过神经网络模型对该特征图像进行特征提取,进而完成实体识别模型的训练,由于特征提取中图像的方式可以保存更多的实体信息,进而提高了实体识别的精度,解决了现有的实体识别方法中将标注语料转换成向量进而通过神经网络模型对其进行实体识别存在的向量保存实体信息较少造成的实体识别精度不高的问题。在第三方面的可选实施方式中,所述生成模块具体用于提取所述待训练的目标语句中的每个字符;根据提取的每个字符查找对应的区域图块,每个字符与对应的区域图块预先建立映射关系并存储在数据库中;根据多个区域图块生成所述特征图像。在第三方面的可选实施方式中,所述装置还包括获取模块,用于获取实体数据库中的多个字符以及预设的多个区域图块,其中,所述多个字符中每个字符之间互不重复,预设的多个区域图块中每个区域图块之间互不重复;建立模块,用于建立每个字符与一个预设的区域图块的映射关系并存储在所述数据库中。在第三方面的可选实施方式中,所述装置还包括处理模块,用于对所述特征图像进行归一化以及数据增强处理。第四方面,实施例提供一种实体识别装置,所述装置包括:生成模块,用于根据待识别的实体语句生成特征图像,所述特征图像由多个区域图块组成,所述待识别的实体语句包括多个字符,每一所述字符分别对应一所述区域图块;输入模块,用于将所述特征图像输入实体识别模型,所述实体识别模型为前述实施方式中任一项生成的所述实体识别模型;获得模块,用于获得所述实体识别模型输出的所述待识别的实体语句的预测标签。在上述设计的实体识别装置中,根据该待识别的实体语句生成特征图像,进而通过第一实施例训练完成得到的实体模型对待识别的实体语句生成的特征图像进行预测,本文档来自技高网...

【技术保护点】
1.一种模型生成方法,其特征在于,所述方法包括:/n根据待训练的目标语句生成特征图像信息,所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签,所述目标语句包括多个字符,每一所述字符分别对应一所述区域图块;/n采用预设的神经网络模型来提取所述特征图像的特征向量;/n根据所述特征向量及对应的类别标签计算对应的训练损失;/n根据所述训练损失对所述神经网络模型进行迭代更新,以获得训练完成的实体识别模型。/n

【技术特征摘要】
1.一种模型生成方法,其特征在于,所述方法包括:
根据待训练的目标语句生成特征图像信息,所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签,所述目标语句包括多个字符,每一所述字符分别对应一所述区域图块;
采用预设的神经网络模型来提取所述特征图像的特征向量;
根据所述特征向量及对应的类别标签计算对应的训练损失;
根据所述训练损失对所述神经网络模型进行迭代更新,以获得训练完成的实体识别模型。


2.根据权利要求1所述方法,其特征在于,所述根据待训练的目标语句生成特征图像信息,包括:
提取所述待训练的目标语句中的每个字符;
根据提取的每个字符查找对应的区域图块,每个字符与对应的区域图块预先建立映射关系并存储在数据库中;
根据多个区域图块生成所述特征图像。


3.根据权利要求2所述方法,其特征在于,在所述根据待训练的目标语句生成特征图像信息之前,所述方法还包括:
获取实体数据库中的多个字符以及预设的多个区域图块,其中,所述多个字符中每个字符之间互不重复,预设的多个区域图块中每个区域图块之间互不重复;
建立每个字符与一个预设的区域图块的映射关系并存储在所述数据库中。


4.根据权利要求2所述方法,其特征在于,所述根据多个区域图块生成所述特征图像,包括:
将查找得到的多个区域图块按照对应的字符在所述待训练的目标语句中的位置依次组合,获得组合图像;
将所述组合图像填充在空白图像的预设区域,并将所述空白图像除所述预设区域外的其余区域设置为预设的统一字符,获得所述特征图像。


5.根据权利要求2所述方法,其特征在于,所述根据多个区域图块生成所述特征图像,包括:
将查找得到的多个区域图块按照对应的字符在所述待训练的目标语句中的位置依次组合,获得组合图像;
复制多个所述组合图像进行拼接,获得组合拼接图像;
将所述组合拼接图像填充在空白图像的预设区域,并将所述空白图像除所述预设区域外的其余区域设置为预设的统一字符,获得所述特征图像。


6.根据权利要求2所述方法,其特征在于,所述根据多个区域图...

【专利技术属性】
技术研发人员:胡仁伟陈效友张会杰
申请(专利权)人:北京知道创宇信息技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1