【技术实现步骤摘要】
基于命名实体模型的字符串识别方法、电子设备、存储介质
本专利技术涉及字符识别
,特别是涉及一种基于命名实体模型的字符串识别方法、电子设备及计算机存储介质。
技术介绍
在汽车车机NLP(NaturalLanguageProcessing,自然语言处理)领域,命名实体识别(NamedEntityRecognition,NER)是一项很基础的任务,就是指从文本中识别出命名性指称项,为关系抽取等任务做铺垫。狭义上,是识别出人名、地名和组织机构名这三类命名实体,广义上可以识别更多命名实体,比如歌手、歌名等。由于NER模型中双向长短记忆网络层的sigmoid和tanh函数是指数函数,在计算时需要用到浮点单元或者专用硬件模块,而在汽车车机中,当前大部分车载芯片没有浮点单元或者专用硬件加速模块,并且采用通用处理器软件来模拟指数运算的性能又很低,无法达到更高效地运算效果。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于命名实体模型的字符串识别方法、电子设备及计算机存储介质。依据本专利技术一方面,提供了一种基于命名实体模型的字符串识别方法,所述命名实体模型包括输入层、字嵌入层、双向长短记忆网络层和全连接层,所述方法包括:所述输入层接收用户输入的字符串,将所述字符串转化为字索引数组并输出至字嵌入层,字索引数组的元素为所述字符串中每个字的索引号;所述字嵌入层将所述字索引数组中的每个元素分别转化为多维字向量,并将多维字向量依次输出至双向长短记忆网络层;所述双向长短记忆网络层的sigmoid激活函数单元或tanh激活函数单元 ...
【技术保护点】
1.一种基于命名实体模型的字符串识别方法,所述命名实体模型包括输入层、字嵌入层、双向长短记忆网络层和全连接层,所述方法包括:所述输入层接收用户输入的字符串,将所述字符串转化为字索引数组并输出至字嵌入层,字索引数组的元素为所述字符串中每个字的索引号;所述字嵌入层将所述字索引数组中的每个元素分别转化为多维字向量,并将多维字向量依次输出至双向长短记忆网络层;所述双向长短记忆网络层的sigmoid激活函数单元或tanh激活函数单元接收到输入数据时,生成sigmoid查表请求或tanh查表请求,并调用预置函数接口;针对所述sigmoid查表请求,利用所述预置函数接口将所述输入数据作为查表数据,利用所述查表数据在预设查找表中进行数据查找,将查找到的数据作为所述sigmoid激活函数单元的输出结果;针对所述tanh查表请求,利用所述预置函数接口将所述输入数据转换为适用sigmoid激活函数的数据且将转换后的数据作为查表数据,利用所述查表数据在所述预设查找表中进行数据查找,将查找到的数据还原为适用tanh激活函数的数据,并作为所述tanh激活函数单元的输出结果;所述双向长短记忆网络层对所述sigmoi ...
【技术特征摘要】
1.一种基于命名实体模型的字符串识别方法,所述命名实体模型包括输入层、字嵌入层、双向长短记忆网络层和全连接层,所述方法包括:所述输入层接收用户输入的字符串,将所述字符串转化为字索引数组并输出至字嵌入层,字索引数组的元素为所述字符串中每个字的索引号;所述字嵌入层将所述字索引数组中的每个元素分别转化为多维字向量,并将多维字向量依次输出至双向长短记忆网络层;所述双向长短记忆网络层的sigmoid激活函数单元或tanh激活函数单元接收到输入数据时,生成sigmoid查表请求或tanh查表请求,并调用预置函数接口;针对所述sigmoid查表请求,利用所述预置函数接口将所述输入数据作为查表数据,利用所述查表数据在预设查找表中进行数据查找,将查找到的数据作为所述sigmoid激活函数单元的输出结果;针对所述tanh查表请求,利用所述预置函数接口将所述输入数据转换为适用sigmoid激活函数的数据且将转换后的数据作为查表数据,利用所述查表数据在所述预设查找表中进行数据查找,将查找到的数据还原为适用tanh激活函数的数据,并作为所述tanh激活函数单元的输出结果;所述双向长短记忆网络层对所述sigmoid激活函数单元的输出结果和tanh激活函数单元的输出结果进行逻辑处理,将逻辑处理后得到的数据输出至所述全连接层,由所述全连接层为输出结果数据添加实体标签。2.根据权利要求1所述的方法,其中,利用所述预置函数接口将所述输入数据转换为适用sigmoid激活函数的数据且将转换后的数据作为查表数据,利用所述查表数据在所述预设查找表中进行数据查找,将查找到的数据还原为适用tanh激活函数的数据,并作为所述tanh激活函数单元的输出结果,包括:利用所述预置函数接口将所述输入数据扩大2倍得到适用sigmoid激活函数的数据,且将扩大2倍后的数据作为查表数据;利用所述查表数据在所述预设查找表中进行数据查找,将查找到的数据按照公式y=2*y’-1计算得到适用tanh激活函数的数据,并作为所述tanh激活函数单元的输出结果;其中,y’表示查找到的数据,y表示适用tanh激活函数的数据。3.根据权利要求1所述的方法,其中,在sigmoid激活函数单元或tanh激活函数单元接收到输入数据时,生成sigmoid查表请求或tanh查表请求,包括:在sigmoid激活函数单元接收到输入数据时,若判断出所述输入数据位于第一数据范围内,生成sigmoid查表请求;在tanh激活函数单元接收到输入数据时,若判断出所述输入数据位于第二数据范围内,生成tanh查表请求;其中,所述第一数据范围包含了sigmoid激活函数曲线的纵坐标饱和值之外的纵坐标数值所对应的横坐标数值,所述第二数据范围包含了tanh激活函数曲线的纵坐标饱和值之外的纵坐标数值所对应的横坐标数值。4.根据权利要求3所述的方法,其中,所述预设查找表按照如下方式进行创建:基于sigmoid激活函数曲线定义样本数据范围和对应的输出数据范围,其中,所述样本数据范围不小于所述第一数据范围,且一个样本数据对应一个输出数据;将所述样本数据范围量化为样本整数范围,将输出数据范围量化为输出整数范围;从所述样本整数范围中等数值间距H选取N个样本整数,从所述输出整数范围等数值间距H选取N个输出整数,H为整数;将所述N个样本整数...
【专利技术属性】
技术研发人员:黄海荣,李林峰,
申请(专利权)人:湖北亿咖通科技有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。