System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及适用于管理、监督或预测目的数据处理,尤其涉及一种基于主动标识的科技资源标识解析方法及系统。
技术介绍
1、随着科技的发展,由此得到的资源也呈现出增加的趋势,科技资源通常以数据的形式呈现。一方面,如何通过技术的手段实现对科技资源的管理,提高科技资源的利用效率,成为亟待解决的问题。另一方面,科技资源一定程度上涉及技术秘密,对科技资源的使用难免会面临一定的泄密的风险。
2、例如,公开(公告)号:cn110097278b,专利标题:“一种科技资源智能共享融合训练系统和应用系统”(主分类号:g06q10/06),采用形成具有自我训练能力的用户资源关联语义特征,更好地完成用户资源关联分析、信息挖掘及供需对接。一方面,能够说明监督或预测目的数据处理技术在科技资源相关
大有可为;另一方面,也能够说明在该领域的技术挖掘还具有较为宽泛的扩展前景。
技术实现思路
1、本申请实施例提供了一种基于主动标识的科技资源标识解析方法及系统,以至少部分的解决上述技术问题。
2、本申请实施例采用下述技术方案:
3、第一方面,本申请实施例提供一种基于主动标识的科技资源标识解析方法,所述方法包括:
4、为待处理的科技资源,添加第一标识;
5、按照预设的维度顺序对所述科技资源对应的科技数据包含的子数据进行排序,得到入档数据,并存储;
6、为所述子数据添加第二标识;所述第二标识与所述子数据一一对应,并且,所述第二标识表示出所述子数据在所述
7、确定所述入档数据的标识序列;所述标识序列包含若干个标识符,所述标识符与所述子数据的列一一对应;所述标识符是通过哈希算法得到的,且所述标识符用于表征其对应的列的内容含量;
8、建立并存储所述第一标识、所述第二标识、以及所述标识序列与所述入档数据之间的对应关系;
9、在接收到数据查询请求时,对所述数据查询请求进行语义分析,得到分析结果,使得所述分析结果与所述维度顺序相匹配;所述分析结果配有分别对应于每个维度的权重值,所述权重值与其所属的维度的原始权重、在所述维度顺序中与其所属的维度相邻的维度在所述数据查询请求中体现出的内容含量均正相关;
10、按照所述权重值由大到小的次序,依次采用所述哈希算法对所述分析结果进行处理,得到语义结果;
11、将所述语义结果与所述对应关系相比较,将匹配度最大的指定数量个标识符所属的子数据,作为与所述数据查询请求相对应的结果。
12、在本说明书一个可选的实施例中,所述方法还包括:
13、所述指定数量与所述对应关系的清晰度负相关;所述清晰度与所述对应关系中所述标识符的分布密度正相关,且与所述标识符在所述对应关系中的离散程度正相关。
14、在本说明书一个可选的实施例中,按照所述权重值由大到小的次序,依次采用所述哈希算法对所述分析结果进行处理,包括:
15、将所述分析结果中权重值中最大的与所述对应关系相比较,将得到的子数据的数量作为备选数量;
16、若所述备选数量不小于所述指定数量,则将所述备选数量对应的分析结果,作为所述语义结果。
17、在本说明书一个可选的实施例中,所述方法还包括:
18、若所述备选数量小于所述指定数量,则将所述分析结果中权重值中第二大的与所述对应关系相比较,将再次得到的子数据的数量添加至所述备选数量,以更新所述备选数量;
19、若更新后的所述备选数量不小于所述指定数量,则将更新后的所述备选数量对应的分析结果,作为所述语义结果。
20、在本说明书一个可选的实施例中,将所述语义结果与所述对应关系相比较,包括:
21、确定子结果与所述对应关系中的标识符的匹配度,以实现所述语义结果与所述对应关系的比较;所述分析结果包含别对应于每个维度的分析字段,所述语义结果中包含的所述子结果是通过对所述分析字段采用所述哈希算法处理得到的。
22、在本说明书一个可选的实施例中,所述方法还包括:
23、若所述备选数量对应的子数据的标识符的集中度大于预设的集中度阈值,则将所述备选数量对应的子数据,作为与所述数据查询请求相对应的结果。
24、在本说明书一个可选的实施例中,所述方法还包括:
25、若所述备选数量对应的子数据的标识符的集中度不大于预设的集中度阈值,则增加所述指定数量,以更新所述指定数量;
26、基于更新后的所述指定数量,确定与所述数据查询请求相对应的结果。
27、第二方面,本申请实施例还提供一种基于主动标识的科技资源标识解析系统,所述系统包括:
28、第一标识添加模块,配置为:为待处理的科技资源,添加第一标识;
29、入档数据确定模块,配置为:按照预设的维度顺序对所述科技资源对应的科技数据包含的子数据进行排序,得到入档数据,并存储;
30、第二标识添加模块,配置为:为所述子数据添加第二标识;所述第二标识与所述子数据一一对应,并且,所述第二标识表示出所述子数据在所述入档数据中的位置;
31、标识序列确定模块,配置为:确定所述入档数据的标识序列;所述标识序列包含若干个标识符,所述标识符与所述子数据的列一一对应;所述标识符是通过哈希算法得到的,且所述标识符用于表征其对应的列的内容含量;
32、对应关系确定模块,配置为:建立并存储所述第一标识、所述第二标识、以及所述标识序列与所述入档数据之间的对应关系;
33、分析模块,配置为:在接收到数据查询请求时,对所述数据查询请求进行语义分析,得到分析结果,使得所述分析结果与所述维度顺序相匹配;所述分析结果配有分别对应于每个维度的权重值,所述权重值与其所属的维度的原始权重、在所述维度顺序中与其所属的维度相邻的维度在所述数据查询请求中体现出的内容含量均正相关;
34、语义结果确定模块,配置为:按照所述权重值由大到小的次序,依次采用所述哈希算法对所述分析结果进行处理,得到语义结果;
35、查询模块,配置为:将所述语义结果与所述对应关系相比较,将匹配度最大的指定数量个标识符所属的子数据,作为与所述数据查询请求相对应的结果。
36、第三方面,本申请实施例还提供一种电子设备,包括:
37、处理器;以及
38、被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行第一方面所述的方法步骤。
39、第四方面,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行第一方面所述的方法步骤。
40、本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:
41、科技资源的构成往往较为复杂,例如,某一科研项目的人员构成可以作为科技资源,在某本文档来自技高网...
【技术保护点】
1.一种基于主动标识的科技资源标识解析方法,其特征在于,所述方法包括:
2.如权利要求1所述方法,其特征在于,所述方法还包括:
3.如权利要求1所述方法,其特征在于,按照所述权重值由大到小的次序,依次采用所述哈希算法对所述分析结果进行处理,包括:
4.如权利要求3所述方法,其特征在于,所述方法还包括:
5.如权利要求1所述方法,其特征在于,将所述语义结果与所述对应关系相比较,包括:
6.如权利要求3所述方法,其特征在于,所述方法还包括:
7.如权利要求6所述方法,其特征在于,所述方法还包括:
8.一种基于主动标识的科技资源标识解析系统,其特征在于,所述系统包括:
9.一种电子设备,包括:
10.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行所述权利要求1~7之任一所述方法。
【技术特征摘要】
1.一种基于主动标识的科技资源标识解析方法,其特征在于,所述方法包括:
2.如权利要求1所述方法,其特征在于,所述方法还包括:
3.如权利要求1所述方法,其特征在于,按照所述权重值由大到小的次序,依次采用所述哈希算法对所述分析结果进行处理,包括:
4.如权利要求3所述方法,其特征在于,所述方法还包括:
5.如权利要求1所述方法,其特征在于,将所述语义结果与所述对应关系相比较,包括:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。