System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 信息智能提取方法、装置、电子设备和存储介质制造方法及图纸_技高网

信息智能提取方法、装置、电子设备和存储介质制造方法及图纸

技术编号:39961762 阅读:6 留言:0更新日期:2024-01-09 00:06
本申请适用于信息处理技术领域,提供了一种信息智能提取方法、装置、电子设备和存储介质,所述方法包括:获取目标信息指标;确定目标文件,所述目标文件是待提取所述目标信息指标的信息文件;对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容;将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息。采用本方法可以智能化地从海量信息中提取有用信息,提高信息提取的准确性和效率。

【技术实现步骤摘要】

本申请涉及信息处理,尤其涉及一种信息智能提取方法、装置、电子设备和存储介质


技术介绍

1、随着国民经济的持续稳定发展,资本市场也快速发展。互联网的发展和普及,各种信息数据呈现了爆炸式增加。资本市场每日产生了大量的包括资本市场相关的法规、财务数据等业务信息。对于企业来说,从资本市场上获取相关信息相当重要。

2、现有技术中,企业从资本市场获取信息一般依靠人工获取,效率低下且容易出错。如何智能地从海量信息中提取有用信息,尽可能减少人工干预,提高信息提取的准确性和效率,是当前需要考虑的问题。


技术实现思路

1、本申请实施例提供了一种信息智能提取方法、装置、电子设备和存储介质,可以解决现有技术中存在的在车辆驾驶环境中缺乏对异常行为的有效监测,无法有效保障行车过程中司机和乘客安全的问题。

2、第一方面,本申请实施例提供了一种信息智能提取方法,包括:

3、获取目标信息指标;

4、确定目标文件,所述目标文件是待提取所述目标信息指标的信息文件;

5、对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容;

6、将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息。

7、在第一方面的一种可能的实现方式中,在所述确定目标文件的步骤之前,还包括:

8、监控指定的信息平台,并按预设捕获规则从所述指定的信息平台捕获信息文件;

9、将捕获的所述信息文件存储至指定数据库;

10、所述确定目标文件的步骤,包括:

11、获取用户指令;

12、基于所述用户指令,从所述指定信息库中选择信息文件确定为提取所述信息指标的目标文件。

13、在第一方面的一种可能的实现方式中,所述对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤,包括:

14、确定所述目标文件的字数和/或页数;

15、若所述字数和/或页数属于第一预设字数页数区间,则选择第一解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容;

16、若所述字数和/或页数属于第二预设字数页数区间,则选择第二解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容。

17、在第一方面的一种可能的实现方式中,所述选择第一解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤,包括:

18、基于所述目标信息指标对所述目标文件进行逐页遍历;

19、根据页遍历的结果,从所述目标文件中提取与所述目标信息指标相关的目标文本内容。

20、在第一方面的一种可能的实现方式中,所述目标文本内容包括标题及段落,所述选择第二解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤之后,包括:

21、对所述目标文件进行拆解,得到所述目标文件拆解后的标题及段落;

22、计算所述目标信息指标与所述标题的相似度;

23、基于所述相似度,确定与所述目标信息指标相关的标题及段落。

24、在第一方面的一种可能的实现方式中,在所述将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息的步骤之后,还包括:

25、获取用户配置的匹配规则;

26、将所述目标信息按所述匹配规则进行正则匹配后输出。

27、在第一方面的一种可能的实现方式中,在所述将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息的步骤之后,还包括:

28、基于所述目标文本内容与提取的所述目标信息再次训练所述目标大语言模型。

29、第二方面,本申请实施例提供了一种信息智能提取装置,包括:

30、目标指标获取单元,用于获取目标信息指标;

31、目标文件确定单元,用于确定目标文件,所述目标文件是待提取所述目标信息指标的信息文件;

32、目标内容获取单元,用于对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容;

33、目标信息提取单元,用于将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息。

34、第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的信息智能提取方法。

35、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面所述的信息智能提取方法。

36、第五方面,本申请实施例提供了一种计算机程序产品,当计算机程序产品在电子设备上运行时,使电子设备执行如上述第一方面所述的信息智能提取方法。

37、本申请实施例中,通过获取目标信息指标,确定目标文件,所述目标文件是待提取所述目标信息指标的信息文件,然后对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容,再将所述目标信息指标与所述目标文本内容输入至目标大语言模型,智能化地提取所述目标信息指标对应的目标信息,无需依靠人工从海量信息中查找有用信息,可大大提高信息提取的准确性和效率。

本文档来自技高网...

【技术保护点】

1.一种信息智能提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述确定目标文件的步骤之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤,包括:

4.根据权利要求3所述的方法,其特征在于,所述选择第一解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤,包括:

5.根据权利要求3所述的方法,其特征在于,所述目标文本内容包括标题及段落,所述选择第二解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤之后,包括:

6.根据权利要求1所述的方法,其特征在于,在所述将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息的步骤之后,还包括:

7.根据权利要求1至6任一项所述的方法,其特征在于,在所述将所述目标信息指标与所述目标文本内容输入至目标大语言模型,提取所述目标信息指标对应的目标信息的步骤之后,还包括:

8.一种信息智能提取装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的信息智能提取方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的信息智能提取方法。

...

【技术特征摘要】

1.一种信息智能提取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,在所述确定目标文件的步骤之前,还包括:

3.根据权利要求1所述的方法,其特征在于,所述对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤,包括:

4.根据权利要求3所述的方法,其特征在于,所述选择第一解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤,包括:

5.根据权利要求3所述的方法,其特征在于,所述目标文本内容包括标题及段落,所述选择第二解析方式对所述目标文件进行解析,获取与所述目标信息指标相关的目标文本内容的步骤之后,包括:

6.根据权利要求1所述的方法,其特征在于,在所述将所述目标信息指标与所述...

【专利技术属性】
技术研发人员:马英峰朱丽曹建超刘阳李泽炀
申请(专利权)人:深圳价值在线信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1