词的检测方法及装置、存储介质、电子装置制造方法及图纸

技术编号:27936748 阅读:11 留言:0更新日期:2021-04-02 14:17
本发明专利技术实施例提供了一种词的检测方法及装置、存储介质、电子装置,该方法包括:确定待处理句子中的目标词的词隐状态向量和句子的句子隐状态向量;基于词隐状态向量增强目标词与其他词之间的关系,得到增强后的词隐状态向量;拼接增强后的词隐状态向量和句子隐状态向量,得到拼接隐状态向量;利用拼接隐状态向量在句子中对目标词进行检测,以在句子中确定与目标词相关联的词。通过本发明专利技术,解决了相关技术中对词的检测准确性低的问题,达到可以准确的在句子中检测出关联词的效果。

【技术实现步骤摘要】
词的检测方法及装置、存储介质、电子装置
本专利技术实施例涉及通信领域,具体而言,涉及一种词的检测方法及装置、存储介质、电子装置。
技术介绍
随着网络文本信息容量的不断提高,快速且高效地识别出这些文本中所包含的实体信息,对各行各业都具有很重要的意义。目前大多数命名实体识别模型使用经过上下文编码器(比如:长短记忆神经网络(LongShort-termMemoryNetworks,简称为LSTM),和卷积神经网络(ConvolutionalNeuralNetwork,简称为CNN)),获得的词的上下状态表示去预测最终的实体标签。尽管这些词可以学习到当前的上下文信息,但是,这些词的句子语义信息仍然很弱。针对上述技术问题,相关技术中尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种词的检测方法及装置、存储介质、电子装置,以至少解决相关技术中对词的检测准确性低的问题。根据本专利技术的一个实施例,提供了一种词的检测方法,包括:确定待处理句子中的目标词的词隐状态向量和上述句子的句子隐状态向量;基于上述词隐状态向量增强上述目标词与其他词之间的关系,得到增强后的词隐状态向量;拼接上述增强后的词隐状态向量和上述句子隐状态向量,得到拼接隐状态向量;利用上述拼接隐状态向量在上述句子中对上述目标词进行检测,以在上述句子中确定与上述目标词相关联的词。根据本专利技术的另一个实施例,提供了一种词的检测装置,包括:第一确定模块,用于确定待处理句子中的目标词的词隐状态向量和上述句子的句子隐状态向量;第一增强模块,用于基于上述词隐状态向量增强上述目标词与其他词之间的关系,得到增强后的词隐状态向量;第一拼接模块,用于拼接上述增强后的词隐状态向量和上述句子隐状态向量,得到拼接隐状态向量;第一检测模块,用于利用上述拼接隐状态向量在上述句子中对上述目标词进行检测,以在上述句子中确定与上述目标词相关联的词。在一个示例性实施例中,上述第一确定模块包括:第一确定单元,用于将上述目标词的词向量输入第一双向时间递归神经网络(LongShort-termMemory,简称为BiLSTM)层,得到上述第一BiLSTM层输出的上述目标词的词隐状态向量;第二确定单元,用于将上述句子的句子向量输入上述第一BiLSTM层,得到上述第一BiLSTM层输出的上述句子的句子隐状态向量。在一个示例性实施例中,上述第一增强模块,包括:第一处理单元,用于将上述词隐状态向量输入自注意力机制Self-Attention层,以使上述Self-Attention层捕捉上述目标词与上述其他词之间的关系,并输出上述增强后的词隐状态向量。在一个示例性实施例中,上述第一检测模块,包括:第三确定单元,用于将上述拼接隐状态向量输入至第二BiLSTM层中,得到上述第二BiLSTM层输出的上述目标词的目标隐状态向量;第一查找单元,用于在上述句子中查找与上述目标隐状态向量的标签信息对应的目标标签信息;第四确定单元,用于将与上述目标标签信息对应的词确定为与上述目标词相关联的词。在一个示例性实施例中,上述装置还包括:第一映射模块,用于确定待处理句子中的目标词的词隐状态向量和上述句子的句子隐状态向量之前,将上述目标词映射至分布式表示空间,以利用上述分布式表示空间捕捉上述目标词的语义和句法特征;第二确定模块,用于基于上述目标词的语义和上述句法特征在预设词向量库中确定上述目标词的词向量。在一个示例性实施例中,上述装置还包括:编码模块,用于确定待处理句子中的目标词的词隐状态向量和上述句子的句子隐状态向量之前,利用蜂窝神经网络CNN模型对上述句子进行编码,得到上述句子的句子向量,其中,上述CNN模型包括N个通道,上述N是大于1的自然数。在一个示例性实施例中,上述编码模块包括:第一捕捉单元,用于利用上述N个通道中的第一通道中滤波器捕捉上述句子中的词信息,得到第一向量,其中,上述第一通道用于表示字符级向量;第二捕捉单元,用于利用上述N个通道中的第二通道中的滤波器捕捉上述句子中的词信息,得到第二向量,其中,上述第二通道用于表示词级向量;第五确定单元,用于在上述第一向量和上述第二向量中确定上述句子的句子向量。根据本专利技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。通过本专利技术,通过确定待处理句子中的目标词的词隐状态向量和句子的句子隐状态向量;基于词隐状态向量增强目标词与其他词之间的关系,得到增强后的词隐状态向量;拼接增强后的词隐状态向量和句子隐状态向量,得到拼接隐状态向量;利用拼接隐状态向量在句子中对目标词进行检测,以在句子中确定与目标词相关联的词。实现了每个词能获得丰富的语义信息,更好的进行实体标签预测的目的。因此,可以解决对词的检测准确性低的问题,达到可以准确的在句子中检测出关联词的效果。附图说明图1是本专利技术实施例的一种词的检测方法的移动终端的硬件结构框图;图2是根据本专利技术实施例的词的检测方法的流程图;图3是根据本专利技术实施例的基于多通道CNN的句子表示模型示意图图;图4是根据本专利技术实施例的基于句子语义与Self-Attention机制的NER模型示意图;图5是根据本专利技术实施例的词的检测装置的结构框图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术的实施例。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。本申请实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本专利技术实施例的一种词的检测方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本专利技术实施例中的词的检测方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102本文档来自技高网...

【技术保护点】
1.一种词的检测方法,其特征在于,包括:/n确定待处理句子中的目标词的词隐状态向量和所述句子的句子隐状态向量;/n基于所述词隐状态向量增强所述目标词与其他词之间的关系,得到增强后的词隐状态向量;/n拼接所述增强后的词隐状态向量和所述句子隐状态向量,得到拼接隐状态向量;/n利用所述拼接隐状态向量在所述句子中对所述目标词进行检测,以在所述句子中确定与所述目标词相关联的词。/n

【技术特征摘要】
1.一种词的检测方法,其特征在于,包括:
确定待处理句子中的目标词的词隐状态向量和所述句子的句子隐状态向量;
基于所述词隐状态向量增强所述目标词与其他词之间的关系,得到增强后的词隐状态向量;
拼接所述增强后的词隐状态向量和所述句子隐状态向量,得到拼接隐状态向量;
利用所述拼接隐状态向量在所述句子中对所述目标词进行检测,以在所述句子中确定与所述目标词相关联的词。


2.根据权利要求1所述的方法,其特征在于,确定待处理句子中的目标词的词隐状态向量和所述句子的句子隐状态向量,包括:
将所述目标词的词向量输入第一双向时间递归神经网络BiLSTM层,得到所述第一BiLSTM层输出的所述目标词的词隐状态向量;
将所述句子的句子向量输入所述第一BiLSTM层,得到所述第一BiLSTM层输出的所述句子的句子隐状态向量。


3.根据权利要求1所述的方法,其特征在于,基于所述词隐状态向量增强所述目标词与其他词之间的关系,得到增强后的词隐状态向量,包括:
将所述词隐状态向量输入自注意力机制Self-Attention层,以使所述Self-Attention层捕捉所述目标词与所述其他词之间的关系,并输出所述增强后的词隐状态向量。


4.根据权利要求1所述的方法,其特征在于,利用所述拼接隐状态向量在所述句子中对所述目标词进行检测,以在所述句子中确定与所述目标词相关联的词,包括:
将所述拼接隐状态向量输入至第二BiLSTM层中,得到所述第二BiLSTM层输出的所述目标词的目标隐状态向量;
在所述句子中查找与所述目标隐状态向量的标签信息对应的目标标签信息;
将与所述目标标签信息对应的词确定为与所述目标词相关联的词。


5.根据权利要求1所述的方法,其特征在于,确定待处理句子中的目标词的词隐状态向量和所述句子的句子隐状态向量之前,所述方法还包括:
将所述目标词映射至分布式表示空间...

【专利技术属性】
技术研发人员:杨聪聪朱海刚王鹏田江向小佳丁永建李璠
申请(专利权)人:光大科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1