文本处理方法、装置、设备及存储介质制造方法及图纸

技术编号:33536801 阅读:24 留言:0更新日期:2022-05-19 02:19
本申请涉及人工智能,尤其涉及自然语言处理技术领域,提供一种文本处理方法、装置、设备及存储介质,该方法包括:将待处理的文本输入预设的上游拼接模型,其中,上游拼接模型中包括预设的文本编码模块和至少一个深度学习模型;通过至少一个深度学习模型对文本进行特征提取,获得第一文本特征向量,通过文本编码模块对文本进行特征编码,获得第二文本特征向量;将第一文本特征向量和第二文本特征向量进行向量拼接,获得文本对应的目标文本特征向量;将目标文本特征向量输入文本任务对应的下游任务模型,输出文本对应的文本处理结果,实现提高文本处理的准确可靠性。本申请还涉及区块链技术,文本和文本特征向量可以存储在区块链节点中。链节点中。链节点中。

【技术实现步骤摘要】
文本处理方法、装置、设备及存储介质


[0001]本申请涉及人工智能领域的自然语言处理
,尤其涉及一种文本处理方法、装置、设备及存储介质。

技术介绍

[0002]在自然语言处理(Natural Language Processing,NLP)中,文本训练通常是大规模的开放域语料,基于大量的开放域语料进行直接端到端的任务训练或者语言模型的预训练。通过训练好的模型可以对待处理的文本进行相应的处理,得到文本的处理结果。只是,对于一些文本,比如包含敏感词汇的文本,通过模型对文本的特征不能够充分提取,从而导致文本的处理结果可能不准确可靠。
[0003]因此,如何提高文本处理的准确可靠性成为亟需解决的问题。

技术实现思路

[0004]本申请提供了一种文本处理方法、装置、设备及存储介质,旨在实现提高文本处理的准确可靠性。
[0005]为实现上述目的,本申请提供一种文本处理方法,所述文本处理方法包括:
[0006]将待处理的文本输入预设的上游拼接模型,其中,所述上游拼接模型中包括预设的文本编码模块和至少一个深度学习模本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法,其特征在于,所述文本处理方法包括:将待处理的文本输入预设的上游拼接模型,其中,所述上游拼接模型中包括预设的文本编码模块和至少一个深度学习模型;通过所述至少一个深度学习模型对所述文本进行特征提取,获得所述文本对应的第一文本特征向量,以及通过所述文本编码模块对所述文本进行特征编码,获得所述文本对应的第二文本特征向量;将所述第一文本特征向量和所述第二文本特征向量进行向量拼接,获得所述文本对应的目标文本特征向量;将所述目标文本特征向量输入文本任务对应的下游任务模型,输出所述文本对应的文本处理结果。2.如权利要求1所述的文本处理方法,其特征在于,所述通过所述至少一个深度学习模型对所述文本进行特征提取,获得所述文本对应的第一文本特征向量,包括:当所述至少一个深度学习模型为多个时,通过每个所述深度学习模型对所述文本进行特征提取,获得每个所述深度学习模型处理得到的第三文本特征向量;将多个所述第三文本特征向量进行向量拼接,获得所述第一文本特征向量。3.如权利要求1所述的文本处理方法,其特征在于,所述将待处理的文本输入预设的上游拼接模型之前,包括:获取所述上游拼接模型的配置信息,所述配置信息包括至少一个深度学习模型名称;将所述至少一个深度学习模型名称对应的至少一个深度学习模型加载至所述上游拼接模型中;分别对每个所述深度学习模型进行模型训练,获得训练好的至少一个深度学习模型。4.如权利要求1所述的文本处理方法,其特征在于,所述文本编码模块包括正则表达式列表,所述通过所述文本编码模块对所述文本进行特征编码,获得所述文本对应的第二文本特征向量,包括:遍历所述正则表达式列表,将所述文本与所述正则表达式列表中的每个正则表达式进行匹配,获得与每个所述正则表达式进行匹配的匹配结果;基于预设的匹配结果与特征值的映射关系,确定获得的每个所述匹配结果对应的特征值;按照预设排列顺序将多个所述特征值进行组合,生成所述第二文本特征向量;其中,所述第二文本特征向量的向量维度与所述正则表达式列表中包含的正则表达式的数量一致。5.如权利要求4所述的文本处理方法,其特征在于,所述将所述文本与所述正则表达式列表中的每个正则表达式进行匹配,获得与每个所述正则表达式进行匹配的匹配结果,包括:确定所述...

【专利技术属性】
技术研发人员:魏万顺
申请(专利权)人:平安普惠企业管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1