本发明专利技术公开了一种文本处理方法、装置、可读介质及电子设备,包括:利用至少一个计算模块对待测文本信息进行计算,以从所述待测文本信息中确定与预设的关键词对应的识别结果;所述计算模块中被配置有预设的计算逻辑。通过在所述计算模块中被配置预设的计算逻辑,将NLP的计算模型运行于现场可编程逻辑门阵列上;由于计算模块只用于进行特定的部分计算,且不存在顺序关系的计算模块可并行进行计算,因此避免了计算资源调配的问题,使得计算效率显著的提高;同时避免了NLP计算对于CPU的过度占用。
A text processing method, device, readable medium and electronic equipment
【技术实现步骤摘要】
一种文本处理方法、装置、可读介质及电子设备
本专利技术涉及计算机
,尤其涉及一种文本处理方法、装置、可读介质及电子设备。
技术介绍
自然语言处理(NaturalLanguageProsessing,简称NLP)是指计算机对人类语言(包括语音和文本)进行分析,以判断其含义。目前的自然语言处理,大多是在机器学习、神经网络等人工智能技术的基础上进行针对性的训练,并建立计算模型得以实现。现有技术中,用于自然语言处理的计算模型通常在CPU上运行,并借助CPU的计算资源完成计算。众所周知的是,此类计算模型涉及的计算量非常庞大。而CPU的计算资源往往会被多方面分享,CPU本身又具有复杂的资源调配机制,所以利用CPU完成计算相对效率较低。
技术实现思路
本专利技术提供一种文本处理方法、装置、可读介质及电子设备,通过将NLP的计算模型运行于现场可编程逻辑门阵列上,从而提高了计算效率,又避免了对CPU计算资源的过度占用。第一方面,本专利技术提供了一种文本处理方法,所述方法运行于现场可编程逻辑门阵列上,包括:利用至少一个计算模块对待测文本信息进行计算,以从所述待测文本信息中确定与预设的关键词对应的识别结果;所述计算模块中被配置有预设的计算逻辑。优选地,所述计算模块包括特征分析模块和匹配模块;则所述利用至少一个计算模块对待测文本信息进行计算包括:利用所述特征分析模块确定所述待测文本信息中的语义特征信息;利用所述匹配模块确定与所述关键词匹配的语义特征信息,并根据所述与所述关键词匹配的语义特征信息,确定所述识别结果。优选地,所述利用所述特征分析模块确定所述待测文本信息中的语义特征信息包括:从所述待测文本信息中确定所述关键词的位置,并分别计算所述关键词的上文语义特征信息,和所述关键词的下文语义特征信息。优选地,所述利用所述匹配模块确定与所述关键词匹配的语义特征信息包括:确定所述语义特征信息与所述关键词的匹配概率;将所述匹配概率符合预设条件的语义特征信息,确定为与所述关键词匹配的语义特征信息。优选地,所述根据所述与所述关键词匹配的语义特征信息,确定所述识别结果包括:基于所述关键词对所述与关键词匹配的语义特征信息进行标注,将标注后的所述语义特征信息确定为所述识别结果。第二方面,本专利技术提供了一种文本处理装置,包括:至少一个计算模块;所述计算模块用于对待测文本信息进行计算,以从所述待测文本信息中确定与预设的关键词对应的识别结果;所述计算模块中被配置有预设的计算逻辑。优选地,所述计算模块包括特征分析模块;则所述特征分析模块用于从所述待测文本信息中确定所述关键词的位置,并分别计算所述关键词的上文语义特征信息,和所述关键词的下文语义特征信息。优选地,所述计算模块包括匹配模块;则所述匹配模块用于确定所述语义特征信息与所述关键词的匹配概率;将所述匹配概率符合预设条件的语义特征信息,确定为与所述关键词匹配的语义特征信息;基于所述关键词对与所述关键词匹配的语义特征信息进行标注,将标注后的所述语义特征信息确定为所述识别结果。第三方面,本专利技术提供了一种可读介质,包括执行指令,当电子设备的处理器执行所述执行指令时,所述电子设备执行如第一方面中任一所述的方法。第四方面,本专利技术提供了一种电子设备,包括处理器以及存储有执行指令的存储器,当所述处理器执行所述存储器存储的所述执行指令时,所述处理器执行如第一方面中任一所述的方法。本专利技术提供了一种文本处理方法、装置、可读介质及电子设备;通过在所述计算模块中被配置预设的计算逻辑,将NLP的计算模型运行于现场可编程逻辑门阵列上;由于计算模块只用于进行特定的部分计算,且不存在顺序关系的计算模块可并行进行计算,因此避免了计算资源调配的问题,使得计算效率显著的提高;同时避免了NLP计算对于CPU的过度占用。上述的非惯用的优选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明为了更清楚地说明本专利技术实施例或现有的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种文本处理方法的流程示意图;图2为本专利技术一实施例提供的另一种文本处理方法的流程示意图;图3为本专利技术一实施例提供的一种文本处理装置的结构示意图;图4为本专利技术一实施例提供的另一种文本处理装置的结构示意图;图5为本专利技术一实施例提供的一种电子设备的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合具体实施例及相应的附图对本专利技术的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。前述已知的是,NLP的计算模型通常在CPU上运行,并借助CPU的计算资源完成计算。但此类计算模型涉及的计算量非常庞大,会占用CPU中大量的计算资源。于此同时,CPU还必须兼顾各方面的计算和处理,其计算资源往往会被多方分享。所以在这样的平台环境下,CPU需要不断地调配计算资源进行NLP模型计算,并且CPU本身又具有复杂的资源调配机制。因此,CPU的资源调配显著的降低了NLP的计算效率。另一方面,NLP占用CPU大量的计算资源,又会影响到其他方面的计算,从而影响CPU所在设备的整体性能和计算效率。有鉴于此,本专利技术提供一种文本处理方法、装置、可读介质及电子设备,通过将NLP的计算模型运行于现场可编程逻辑门阵列上。现场可编程逻辑门阵列(FieldProgrammableGateArray,简称FPGA),从而提高了计算效率,又避免了对CPU计算资源的过度占用。参见图1所示,为本专利技术提供的文本处理方法的具体实施例。所述方法运行于FPGA上。FPGA是专用集成电路领域中的一种半定制电路。通过编程和配置,可使得FPGA专用来执行特定的计算逻辑,即可以使其完成特定的NLP模型计算。本实施例中,所述方法具体包括以下步骤:步骤101、利用至少一个计算模块对待测文本信息进行计算。所述计算模块,即FPGA上划分得到的用来执行特定计算过程的电路区域。所述计算模块中被配置有预设的计算逻辑,该计算逻辑即为NLP计算模型中包括的算法。也就是说,本实施例中通过在计算模块中被配置有预设的计算逻辑,可使NLP计算模型得以在FPGA上运行。本实施例中,NLP计算模型主要是用于命名实体识别的计算模型。常见的NLP计算模型可以是基于卷积神经网络或循环神经网络的计算模型,也可是通过隐含马尔可夫模型(HMM),支持向量机(SVM),条件随机场(CR本文档来自技高网...
【技术保护点】
1.一种文本处理方法,其特征在于,所述方法运行于现场可编程逻辑门阵列上,包括:/n利用至少一个计算模块对待测文本信息进行计算,以从所述待测文本信息中确定与预设的关键词对应的识别结果;/n所述计算模块中被配置有预设的计算逻辑。/n
【技术特征摘要】
1.一种文本处理方法,其特征在于,所述方法运行于现场可编程逻辑门阵列上,包括:
利用至少一个计算模块对待测文本信息进行计算,以从所述待测文本信息中确定与预设的关键词对应的识别结果;
所述计算模块中被配置有预设的计算逻辑。
2.根据权利要求1所述方法,其特征在于,所述计算模块包括特征分析模块和匹配模块;则所述利用至少一个计算模块对待测文本信息进行计算包括:
利用所述特征分析模块确定所述待测文本信息中的语义特征信息;
利用所述匹配模块确定与所述关键词匹配的语义特征信息,并根据所述与所述关键词匹配的语义特征信息,确定所述识别结果。
3.根据权利要求2所述方法,其特征在于,所述利用所述特征分析模块确定所述待测文本信息中的语义特征信息包括:
从所述待测文本信息中确定所述关键词的位置,并分别计算所述关键词的上文语义特征信息,和所述关键词的下文语义特征信息。
4.根据权利要求2所述方法,其特征在于,所述利用所述匹配模块确定与所述关键词匹配的语义特征信息包括:
确定所述语义特征信息与所述关键词的匹配概率;
将所述匹配概率符合预设条件的语义特征信息,确定为与所述关键词匹配的语义特征信息。
5.根据权利要求4所述方法,其特征在于,所述根据所述与所述关键词匹配的语义特征信息,确定所述识别结果包括:
基...
【专利技术属性】
技术研发人员:赵俊涛,张孟杰,张朋朋,张凯,刘兵,
申请(专利权)人:医渡云北京技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。