System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文本识别方法、装置、设备及可读存储介质制造方法及图纸_技高网

一种文本识别方法、装置、设备及可读存储介质制造方法及图纸

技术编号:40699864 阅读:2 留言:0更新日期:2024-03-22 10:57
本申请实施例公开了一种文本识别方法、装置、设备及可读存储介质,其中,方法包括:获取待识别的初始文本数据;对该初始文本数据进行命名实体识别处理,得到针对该初始文本数据的识别结果,该识别结果包括该初始文本数据中命名实体词的类别标签和实体词边界,该类别标签用于指示该初始文本数据中包括的命名实体词的类别,该实体词边界用于指示该初始文本数据中包括的命名实体词;基于该类别标签、该实体词边界和该初始文本数据,确定该初始文本数据对应的目标文本数据,该目标文本数据为该初始文本数据对应的回复文本数据。采用本申请实施例,可以提升文本回复准确性,进而提升对话准确性,提升用户体验。

【技术实现步骤摘要】

本申请涉及文本识别,尤其涉及一种文本识别方法、装置、设备及可读存储介质


技术介绍

1、随着计算机设备的发展,在多种场景中都涉及到语义理解,语义理解也被广泛应用于多种领域。例如在机器对话领域中,可以将对话内容转换为文本内容,对文本内容进行语义理解,确定对话意图,从而进行回复。然而,一些情况下用户说的话可能不是固定格式,导致在进行语义理解时难以理解用户的意图,从而难以回复用户想要的信息,会降低文本回复准确性,从而降低对话准确性,进而降低用户体验。


技术实现思路

1、本申请实施例提供一种文本识别方法、装置、设备及可读存储介质,可以提升文本回复准确性,进而提升对话准确性,进而提升用户体验。

2、第一方面,本申请提供一种文本识别方法,包括:

3、获取待识别的初始文本数据;

4、对该初始文本数据进行命名实体识别处理,得到针对该初始文本数据的识别结果,该识别结果包括该初始文本数据中命名实体词的类别标签和实体词边界,该类别标签用于指示该初始文本数据中包括的命名实体词的类别,该实体词边界用于指示该初始文本数据中包括的命名实体词;

5、基于该类别标签、该实体词边界和该初始文本数据,确定该初始文本数据对应的目标文本数据,该目标文本数据为该初始文本数据对应的回复文本数据。

6、第二方面,本申请提供了一种文本识别装置,其特征在于,该装置包括:

7、文本获取单元,用于获取待识别的初始文本数据;

8、文本识别单元,用于对该初始文本数据进行命名实体识别处理,得到针对该初始文本数据的识别结果,该识别结果包括该初始文本数据中命名实体词的类别标签和实体词边界,该类别标签用于指示该初始文本数据中包括的命名实体词的类别,该实体词边界用于指示该初始文本数据中包括的命名实体词;

9、文本确定单元,用于基于该类别标签、该实体词边界和该初始文本数据,确定该初始文本数据对应的目标文本数据,该目标文本数据为该初始文本数据对应的回复文本数据。

10、第三方面,本申请提供了一种计算机设备,包括:处理器、存储器、网络接口;

11、上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序代码,上述处理器用于调用上述计算机程序代码,以使包含该处理器的计算机设备执行上述文本识别方法。

12、第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行上述文本识别方法。

13、第五方面,本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请第一方面中的各种可选方式中提供的文本识别方法。

14、本申请实施例中,通过获取待识别的初始文本数据;对初始文本数据进行命名实体识别处理,得到针对初始文本数据的识别结果,识别结果包括初始文本数据中命名实体词的类别标签和实体词边界,类别标签用于指示初始文本数据中包括的命名实体词的类别,实体词边界用于指示初始文本数据中包括的命名实体词;基于类别标签、实体词边界和初始文本数据,确定初始文本数据对应的目标文本数据,目标文本数据为该初始文本数据对应的回复文本数据。通过识别初始文本数据中的命名实体词和命名实体词的类别,可以更准确确定出初始文本数据中的关键信息,进而在确定回复文本数据时,可以结合初始文本数据中的关键信息确定回复文本数据,从而提升文本回复准确性,进而提升文本对话准确性,提升用户体验。

本文档来自技高网...

【技术保护点】

1.一种文本识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述初始文本数据进行命名实体识别处理,得到针对所述初始文本数据的识别结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述多个字符对应的字符特征进行融合处理,得到所述初始文本数据对应的文本融合特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述多个字符对应的字符特征进行融合处理,得到所述多个字符对应的第一融合特征,包括:

5.根据权利要求2-4任一项所述的方法,其特征在于,所述基于所述初始文本数据对应的文本融合特征,确定针对所述初始文本数据的识别结果,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述基于所述类别标签、所述实体词边界和所述初始文本数据,确定所述初始文本数据对应的目标文本数据,包括:

8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.一种文本识别装置,其特征在于,所述装置包括:

10.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;

11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-8任一项所述的方法。

...

【技术特征摘要】

1.一种文本识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述初始文本数据进行命名实体识别处理,得到针对所述初始文本数据的识别结果,包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述多个字符对应的字符特征进行融合处理,得到所述初始文本数据对应的文本融合特征,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述多个字符对应的字符特征进行融合处理,得到所述多个字符对应的第一融合特征,包括:

5.根据权利要求2-4任一项所述的方法,其特征在于,所述基于所述初始文本数据对应的文本融合特征,确定针对所述初始文本数据的识别结果,包括:

...

【专利技术属性】
技术研发人员:李浩
申请(专利权)人:小红书科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1