一种文本识别方法、装置、计算机设备及介质制造方法及图纸

技术编号:41487312 阅读:21 留言:0更新日期:2024-05-30 14:34
本申请实施例公开了一种文本识别方法、装置、计算机设备及介质,该方法包括:对待识别文本进行特征提取,得到针对待识别文本的多个文本特征;获取各个文本特征的特征深度,并基于特征深度确定目标抽取规则;按照目标抽取规则从多个文本特征中确定待识别文本的文本语义特征和文本结构特征;将文本语义特征和文本结构特征进行融合处理,得到目标融合特征;根据目标融合特征计算待识别文本属于多个预设类别下每个预设类别的类别概率,并基于每个预设类别的类别概率确定待识别文本的类别识别结果。可以提高文本类别识别的准确率。本申请可应用于云技术、人工智能等场景,如上述待识别文本的类别识别可利用神经网络模型实现,以用于文本识别等场景。

【技术实现步骤摘要】

本申请涉及计算机,尤其涉及一种文本识别方法、装置、计算机设备及介质


技术介绍

1、随着互联网技术的快速发展,搜索引擎在人们的工作、学习以及生活中的应用越来越广泛。目前,搜索引擎在接收到对象输入的搜索句子后,通常会对搜索句子进行类别识别,以确定该搜索句子的类别,从而利用该类别从大量的多媒体数据中召回该搜索句子对应的搜索结果。基于此,如何较为准确地确定搜索句子的类别成为了当前研究热点。


技术实现思路

1、本申请实施例提供了一种文本识别方法、装置、计算机设备及介质,可以提高文本类别识别的准确率。

2、第一方面,本申请实施例提供了一种文本识别方法,包括:

3、获取待识别文本,并对所述待识别文本进行特征提取,得到针对所述待识别文本的多个文本特征;

4、获取所述多个文本特征中各个文本特征的特征深度,并基于所述特征深度确定所述多个文本特征的目标抽取规则;

5、按照所述目标抽取规则从所述多个文本特征中确定所述待识别文本的文本语义特征和文本结构特征;其中,所述文本语义特征用于表本文档来自技高网...

【技术保护点】

1.一种文本识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待识别文本进行特征提取,得到针对所述待识别文本的多个文本特征,包括:

3.如权利要求2所述的方法,其特征在于,所述调用文本识别模型中N个特征提取层对所述待识别文本进行特征提取,得到每个特征提取层针对所述待识别文本的文本特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述在第一个特征提取层与第N-1个特征提取层之间所包括的各个特征提取层对应的文本特征中,确定所述待识别文本的文本结构特征,包括:

5.根据权利要求1所述的方法,其特征在于...

【技术特征摘要】

1.一种文本识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述待识别文本进行特征提取,得到针对所述待识别文本的多个文本特征,包括:

3.如权利要求2所述的方法,其特征在于,所述调用文本识别模型中n个特征提取层对所述待识别文本进行特征提取,得到每个特征提取层针对所述待识别文本的文本特征,包括:

4.根据权利要求2所述的方法,其特征在于,所述在第一个特征提取层与第n-1个特征提取层之间所包括的各个特征提取层对应的文本特征中,确定所述待识别文本的文本结构特征,包括:

5.根据权利要求1所述的方法,其特征在于,所述根据所述目标融合特征计算所述待识别文本属于多个预...

【专利技术属性】
技术研发人员:黄剑辉
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1