要素抽取方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:41992093 阅读:12 留言:0更新日期:2024-07-12 12:18
本公开提供了一种要素抽取方法及装置、电子设备,该方法包括:获取与当前滑动窗口相对应的实时文本片段;根据预设的要素类型特征,确定实时文本片段的类型识别结果;其中,要素类型特征包括:单要素类型特征以及多要素类型特征,且类型识别结果包括:与单要素类型特征相对应的第一类识别结果,以及与多要素类型特征相对应的第二类识别结果;根据类型识别结果,确定与实时文本片段相对应的目标文本数据;针对目标文本数据执行要素抽取处理,得到目标文本数据中包含的目标要素;其中,第一文本数据的数据量不同于第二文本数据。该方式便于根据文本片段的类型,灵活提取不同长度的目标文本数据进行要素抽取,从而提升要素抽取的效率和准确性。

【技术实现步骤摘要】

本公开涉及数据处理,特别涉及一种要素抽取方法、装置、电子设备及计算机可读存储介质


技术介绍

1、要素是指构成事物的必要因素或成分。要素是构成事物必不可少的因素,同时也是组成系统的基本单元,是系统产生、变化、发展的动因。在不同的领域,“要素”的具体含义可能有所不同。例如,在机械学中,“要素”可以指构成机械零件几何体的点、线、面等基本几何元素;在经济学中,生产要素是指进行社会生产经营活动时所需要的各种社会资源,如劳动力、土地、资本、企业家才能等。在信息处理领域,要素主要是指数据要素,具体可以是指那些以电子形式存在的、通过计算的方式参与到生产经营活动并发挥重要价值的数据资源。

2、在信息处理领域中,由于大数据的发展导致数据要素的种类和数量日益繁多,因此,如何准确而高效的抽取业务所需的数据要素成为目前亟待解决的问题。


技术实现思路

1、本公开提供一种要素抽取方法及装置、电子设备及计算机可读存储介质。

2、第一方面,本公开提供了一种要素抽取方法,包括:

3、获取与当前滑动窗口相对应本文档来自技高网...

【技术保护点】

1.一种要素抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述实时文本片段为通话转译文本片段,且每个滑动窗口对应于N个通话轮次的时间长度;其中,N为大于1的自然数;

3.根据权利要求2所述的方法,其特征在于,所述滑动窗口的滑动步长为M个通话轮次,所述M为小于N的自然数。

4.根据权利要求3所述的方法,其特征在于,所述根据所述类型识别结果,确定与所述实时文本片段相对应的目标文本数据包括:

5.根据权利要求4所述的方法,其特征在于,所述针对所述目标文本数据执行要素抽取处理,得到所述目标文本数据中包含的目标要素包括:...

【技术特征摘要】

1.一种要素抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述实时文本片段为通话转译文本片段,且每个滑动窗口对应于n个通话轮次的时间长度;其中,n为大于1的自然数;

3.根据权利要求2所述的方法,其特征在于,所述滑动窗口的滑动步长为m个通话轮次,所述m为小于n的自然数。

4.根据权利要求3所述的方法,其特征在于,所述根据所述类型识别结果,确定与所述实时文本片段相对应的目标文本数据包括:

5.根据权利要求4所述的方法,其特征在于,所述针对所述目标文本数据执行要素抽取处理,得到所述目标文本数据中包含的目标要素包括:

【专利技术属性】
技术研发人员:贾敬伍张杰于皓
申请(专利权)人:北京中关村科金技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1