一种大数据政策查询匹配方法及其系统技术方案

技术编号:37717514 阅读:9 留言:0更新日期:2023-06-02 00:14
本发明专利技术涉及数据处理技术领域,具体涉及一种大数据政策查询匹配方法及其系统,通过对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理;对预处理后的所述沟通语音文件进行关键词提取,并基于营业范围类别进行筛选与分类存储;将筛选后构建的词库中的数据与政策数据库中的数据进行匹配,生成对应的匹配树,并进行展示,能够将与企业交谈过程中的信息与所有的政策进行查询和匹配,并将满足的所有的政策按照匹配度进行全部展示,供企业选择,保证能够将满足要求的所有的政策都匹配完成,提高企业享受政策扶持的力度。提高企业享受政策扶持的力度。提高企业享受政策扶持的力度。

【技术实现步骤摘要】
一种大数据政策查询匹配方法及其系统


[0001]本专利技术涉及数据处理
,尤其涉及一种大数据政策查询匹配方法及其系统。

技术介绍

[0002]目前,创业公司越来越多,政府对中小创新型企业的扶持力度加大,出台的各项政策也逐渐增多,企业在进行申报政府各类补贴政策时,需要提前知晓并且阅读政策全文以判断是否符合申报条件,并依此来准备文件资料。目前的企业政策查询方式比较繁琐,通常需要专门去企业政策相关部门进行人工查询,不仅需要耗费大量的时间,还没办法保证能够将满足要求的所有的政策都匹配完成,极大的降低了企业享受政策扶持的力度。

技术实现思路

[0003]本专利技术的目的在于提供一种大数据政策查询匹配方法及其系统,保证能够将满足要求的所有的政策都匹配完成,提高企业享受政策扶持的力度。
[0004]为实现上述目的,第一方面,本专利技术提供了一种大数据政策查询匹配方法,包括以下步骤:
[0005]对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理;
[0006]对预处理后的所述沟通语音文件进行关键词提取,并基于营业范围类别进行筛选与分类存储;
[0007]将筛选后构建的词库中的数据与政策数据库中的数据进行匹配,生成对应的匹配树,并进行展示。
[0008]其中,对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理,包括:
[0009]对用户的营业执照纸质版进行扫描,并对得到的营业执照图片进行命名存储;
[0010]对沟通语音文件进行实时数据获取,并传输至服务器中进行缓存以及预处理。
[0011]其中,对沟通语音文件进行实时数据获取,并传输至服务器中进行缓存以及预处理,包括:
[0012]实时采集现场沟通的语音数据,并基于数据传输协议将语音数据实时传输至服务器中进行缓存;
[0013]判断缓存的沟通语音文件中的音色信息,根据音色改变点将所述沟通语音文件进行切割和分类存储。
[0014]其中,对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理之后,所述方法还包括:
[0015]对扫描得到的营业执照图片中的经营范围中的文字进行提取,并基于分隔符将提取出来的经营范围进行分割,得到多个经营关键词。
[0016]其中,所述方法还包括:
[0017]对实时采集的语音数据进行除杂和滤波处理。
[0018]第二方面,本专利技术提供一种大数据政策查询匹配系统,适用于如第一方面所述的一种大数据政策查询匹配方法,
[0019]所述大数据政策查询匹配系统包括数据采集模块、数据提取模块和政策匹配模块,所述数据采集模块、所述数据提取模块和所述政策匹配模块依次连接;
[0020]所述数据采集模块,用于对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理;
[0021]所述数据提取模块,用于对预处理后的所述沟通语音文件进行关键词提取,并基于营业范围类别进行筛选与分类存储;
[0022]所述政策匹配模块,用于将筛选后构建的词库中的数据与政策数据库中的数据进行匹配,生成对应的匹配树,并进行展示。
[0023]本专利技术的一种大数据政策查询匹配方法及其系统,通过对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理;对预处理后的所述沟通语音文件进行关键词提取,并基于营业范围类别进行筛选与分类存储;将筛选后构建的词库中的数据与政策数据库中的数据进行匹配,生成对应的匹配树,并进行展示,能够将与企业交谈过程中的信息与所有的政策进行查询和匹配,并将满足的所有的政策按照匹配度进行全部展示,供企业选择,保证能够将满足要求的所有的政策都匹配完成,提高企业享受政策扶持的力度。
附图说明
[0024]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是本专利技术第一实施例提供的一种大数据政策查询匹配方法的流程示意图。
[0026]图2是本专利技术第二实施例提供的一种大数据政策查询匹配方法的流程示意图。
[0027]图3是本专利技术提供的一种大数据政策查询匹配相同的结构示意图。
具体实施方式
[0028]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。
[0029]请参阅图1,本专利技术第一实施例提供一种大数据政策查询匹配方法,包括以下步骤:
[0030]S101、对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理。
[0031]具体的,将企业带来的营业执照纸质版进行扫描,得到对应的营业执照图片,或者是将企业发过来的营业执照的电子版进行扫描,得到对应的营业执照图片,根据企业名称,将所述营业执照图片进行命名以及存储。
[0032]对扫描得到的营业执照图片中的经营范围中的文字进行提取,并基于分隔符将提取出来的经营范围进行分割,得到多个经营关键词。对于图片中的文字提取的功能已经属于现有技术,并且营业执照中关于经营范围也是在固定的地方以及固定的符号分隔,因此,
对于此部分的经营关键词的提取,属于很简单的提取方法,在此处不再赘述。
[0033]在获取沟通语音文件之前,会事先征求企业的同意再进行录音;在取得同意之后,实时采集现场沟通的语音数据,并基于数据传输协议将语音数据实时传输至服务器中进行缓存,当服务器接收到传输过来的数据后,首先对语音数据进行除杂和滤波处理,去除语音数据中的杂音,便于后期在进行数据提取的时候能够提取得更加准确。
[0034]当滤波完成后,判断获取到的沟通语音文件中的音色信息,不同的人说的话的音色是不同的,因此,只需要根据不同的音色信息就能够判断当前说话的人的数据是否需要进行处理,这样可以进一步的减少数据的处理量,提高对数据的处理速度。
[0035]在判断音色信息的过程中,首先,获取沟通语音数据中的静音段和语音段,判断相邻两个语音段之间的音色是否相同,若相同,则将第二段沟通语音数据进行提取缓存,然后再判断第一段语音段与第三段语音段之间的音色是否相同,若不相同,则将第三段语音段进行提取,并另外进行缓存,不与第二段语音段再同一个区域存储,直至所有的语音段数据全部对比完成,将缓存了第一段语音段的缓存区内的所有的语音段按照所处的沟通语音文件中的时间信息进行排序,得到一组语音段数据库。将另外一个语音段中的数据也按照时间顺序进行排序,这样就将不同的说话人的语音信息进行分割,这样可以选择性的对不同的说话人的数据进行处理,减少对数据的处理量。
[0036]S102、对预处理后的所述沟通语音文件进行关键词提取,并基于营业范围类别进行筛选与分类存储。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大数据政策查询匹配方法,其特征在于,包括以下步骤:对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理;对预处理后的所述沟通语音文件进行关键词提取,并基于营业范围类别进行筛选与分类存储;将筛选后构建的词库中的数据与政策数据库中的数据进行匹配,生成对应的匹配树,并进行展示。2.如权利要求1所述的大数据政策查询匹配方法,其特征在于,对获取得营业执照图片以及沟通语音文件分别进行扫描和预处理,包括:对用户的营业执照纸质版进行扫描,并对得到的营业执照图片进行命名存储;对沟通语音文件进行实时数据获取,并传输至服务器中进行缓存以及预处理。3.如权利要求2所述的大数据政策查询匹配方法,其特征在于,对沟通语音文件进行实时数据获取,并传输至服务器中进行缓存以及预处理,包括:实时采集现场沟通的语音数据,并基于数据传输协议将语音数据实时传输至服务器中进行缓存;判断缓存的沟通语音文件中的音色信息,根据音色改变点将所述沟通语音文件进行切割和分类存储。4.如权利要求1所述的大数据政策查询...

【专利技术属性】
技术研发人员:李逸航
申请(专利权)人:君士坦丁信息科技重庆有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1