一种模型生成方法、实体识别方法、装置及电子设备制造方法及图纸

技术编号：23853149 阅读：14 留言：0更新日期：2020-04-18 09:42

本申请提供一种模型生成方法、实体识别方法、装置及电子设备，该模型生成方法包括：根据待训练的目标语句生成特征图像信息，该特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签，该目标语句包括多个字符，每一字符分别对应一区域图块；采用预设的神经网络模型来提取特征图像的特征向量；根据特征向量及对应的类别标签计算对应的训练损失；根据训练损失对神经网络模型进行迭代更新，以获得训练完成的实体识别模型。

A model generation method, entity recognition method, device and electronic equipment

全部详细技术资料下载

【技术实现步骤摘要】
一种模型生成方法、实体识别方法、装置及电子设备
本申请涉及实体识别
，具体而言，涉及一种模型生成方法、实体识别方法、装置及电子设备。
技术介绍
传统的实体识别方法是通过word2vec将标注语料转化为向量的方式，进而通过神经网络模型对其进行实体识别，但将标注语料转换成向量保存的实体信息较少，进而造成实体识别精度不高的问题。
技术实现思路
本申请实施例的目的在于提供一种模型生成方法、实体识别方法、装置及电子设备，用以解决现有的实体识别方法中将标注语料转换成向量进而通过神经网络模型对其进行实体识别存在的向量保存实体信息较少造成的实体识别精度不高的问题。第一方面，实施例提供一种模型生成方法，所述方法包括：根据待训练的目标语句生成特征图像信息，所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签，所述目标语句包括多个字符，每一所述字符分别对应一所述区域图块；采用预设的神经网络模型来提取所述特征图像的特征向量；根据所述特征向量及对应的类别标签计算对应的训练损失；根据所述训练损失对所述神经网络模型进行迭代更新，以获得训练完成的实体识别模型。在上述设计的模型生成方法中，通过将待训练的目标语句中的每个字符转换成一区域图块，进而根据多个区域图块生成特征图像，也就是将目标语句转换成了特征图像，通过神经网络模型对该特征图像进行特征提取，进而完成实体识别模型的训练，由于特征提取中图像的方式可以保存更多的实体信息，进而提高了实体识别的精度，解决了现有的实体识别方法中将标注语料转换成...

【技术保护点】
1.一种模型生成方法，其特征在于，所述方法包括：/n根据待训练的目标语句生成特征图像信息，所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签，所述目标语句包括多个字符，每一所述字符分别对应一所述区域图块；/n采用预设的神经网络模型来提取所述特征图像的特征向量；/n根据所述特征向量及对应的类别标签计算对应的训练损失；/n根据所述训练损失对所述神经网络模型进行迭代更新，以获得训练完成的实体识别模型。/n

【技术特征摘要】
1.一种模型生成方法，其特征在于，所述方法包括：
根据待训练的目标语句生成特征图像信息，所述特征图像信息包括由多个区域图块组成的特征图像以及该目标语句的类别标签，所述目标语句包括多个字符，每一所述字符分别对应一所述区域图块；
采用预设的神经网络模型来提取所述特征图像的特征向量；
根据所述特征向量及对应的类别标签计算对应的训练损失；
根据所述训练损失对所述神经网络模型进行迭代更新，以获得训练完成的实体识别模型。

2.根据权利要求1所述方法，其特征在于，所述根据待训练的目标语句生成特征图像信息，包括：
提取所述待训练的目标语句中的每个字符；
根据提取的每个字符查找对应的区域图块，每个字符与对应的区域图块预先建立映射关系并存储在数据库中；
根据多个区域图块生成所述特征图像。

3.根据权利要求2所述方法，其特征在于，在所述根据待训练的目标语句生成特征图像信息之前，所述方法还包括：
获取实体数据库中的多个字符以及预设的多个区域图块，其中，所述多个字符中每个字符之间互不重复，预设的多个区域图块中每个区域图块之间互不重复；
建立每个字符与一个预设的区域图块的映射关系并存储在所述数据库中。

4.根据权利要求2所述方法，其特征在于，所述根据多个区域图块生成所述特征图像，包括：
将查找得到的多个区域图块按照对应的字符在所述待训练的目标语句中的位置依次组合，获得组合图像；
将所述组合图像填充在空白图像的预设区域，并将所述空白图像除所述预设区域外的其余区域设置为预设的统一字符，获得所述特征图像。

5.根据权利要求2所述方法，其特征在于，所述根据多个区域图块生成所述特征图像，包括：
将查找得到的多个区域图块按照对应的字符在所述待训练的目标语句中的位置依次组合，获得组合图像；
复制多个所述组合图像进行拼接，获得组合拼接图像；
将所述组合拼接图像填充在空白图像的预设区域，并将所述空白图像除所述预设区域外的其余区域设置为预设的统一字符，获得所述特征图像。

6.根据权利要求2所述方法，其特征在于，所述根据多个区域图...

【专利技术属性】
技术研发人员：胡仁伟，陈效友，张会杰，
申请(专利权)人：北京知道创宇信息技术股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人