基础理论文件推送方法、系统、计算机及可读存储介质技术方案

技术编号:37144529 阅读:14 留言:0更新日期:2023-04-06 21:54
本发明专利技术提供了一种基础理论文件推送方法、系统、计算机及可读存储介质,该方法包括获取基础理论文件,并对基础理论文件进行多级聚类分析处理,以生成理论特征数据链;获取产业化请求指令,并识别出企业对应的企业信息;对经营规模信息、经营范围信息以及经营需求信息进行多级聚类分析处理,以生成实际特征数据链;根据实际特征值匹配出目标理论特征数据链,并基于实际特征值查找出目标基础理论文件;计算出目标基础理论文件与实际特征数据链之间的契合度,并判断契合度是否大于预设阈值;若是,则向企业推送目标基础理论文件。通过上述方式能够根据个人或者企业的实际需求快速、准确的向个人或者企业推送出对应的基础理论文件。向个人或者企业推送出对应的基础理论文件。向个人或者企业推送出对应的基础理论文件。

【技术实现步骤摘要】
基础理论文件推送方法、系统、计算机及可读存储介质


[0001]本专利技术涉及数据处理
,特别涉及一种基础理论文件推送方法、系统、计算机及可读存储介质。

技术介绍

[0002]理论知识是指概括性强、抽象度高的知识体系。理论知识不是分散的、零星的知识,不是个别性的、具体性的知识,而是系统的、有普通意义的知识,并且理论知识中往往包含了一般知识和专业知识。
[0003]现如今,个人或者企业通常会将其科研成果或者研发成果,即对应的理论知识,发表成论文以及期刊,同时还会申报相关的专利,以保护其科研成果或者研发成果。
[0004]然而,现有技术虽然能够向企业或者个人推送基础理论文件,但是现有技术大部分通过在整个数据库中检索各个基础理论文件的标题,并且只是将标题适配的基础理论文件推送给个人或者企业,导致个人或者企业接收到的基础理论文件的精度较差,同时检索的时间较长,降低了个人或者企业的使用体验。

技术实现思路

[0005]基于此,本专利技术的目的是提供一种基础理论文件推送方法、系统、计算机及可读存储介质,以解决现有技术虽然能够向企业或者个人推送基础理论文件,但是现有技术大部分通过在整个数据库中检索各个基础理论文件的标题,并且只是将标题适配的基础理论文件推送给个人或者企业,导致个人或者企业接收到的基础理论文件的精度较差,同时检索的时间较长,降低了个人或者企业使用体验的问题。
[0006]本专利技术实施例第一方面提出了一种基础理论文件推送方法,所述方法包括:获取多个领域的若干基础理论文件,并对若干所述基础理论文件进行多级聚类分析处理,以生成若干对应的理论特征数据链,每一所述理论特征数据链均包括对应的理论数据库,所述理论特征数据链包括若干理论特征值,所述基础理论文件包括论文、期刊以及专利;获取企业发送的产业化请求指令,并识别出当前企业对应的企业信息,所述企业信息包括经营规模信息、经营范围信息以及经营需求信息;对所述经营规模信息、所述经营范围信息以及所述经营需求信息进行多级聚类分析处理,以生成对应的实际特征数据链,所述实际特征数据链包括若干实际特征值;根据若干所述实际特征值匹配出对应的目标理论特征数据链,并基于若干所述实际特征值在所述目标理论特征数据链对应的目标理论数据库中查找出对应的目标基础理论文件;计算出所述目标基础理论文件与所述实际特征数据链之间的契合度,并判断所述契合度是否大于预设阈值;若判断到所述契合度大于所述预设阈值,则向当前所述企业推送所述目标基础理
论文件。
[0007]本专利技术的有益效果是:通过首先获取多个领域的若干基础理论文件,并对若干基础理论文件进行多级聚类分析处理,以生成若干对应的理论特征数据链;进一步的,获取企业发送的产业化请求指令,并识别出当前企业对应的企业信息,企业信息包括经营规模信息、经营范围信息以及经营需求信息;对经营规模信息、经营范围信息以及经营需求信息进行多级聚类分析处理,以生成对应的实际特征数据链,实际特征数据链包括若干实际特征值;更进一步的,根据若干实际特征值匹配出对应的目标理论特征数据链,并基于若干实际特征值在目标理论特征数据链对应的目标理论数据库中查找出对应的目标基础理论文件;在此基础之上,计算出目标基础理论文件与实际特征数据链之间的契合度,并判断契合度是否大于预设阈值;具体的,若判断到契合度大于预设阈值,则向当前企业推送目标基础理论文件。通过上述方式能够根据个人或者企业的实际需求快速、准确的向个人或者企业推送出对应的基础理论文件,从而能够使个人或者企业快速的获取到需要的基础理论文件,进而能够大幅提升个人或者企业的使用体验,适用于大范围的推广与使用。
[0008]优选的,所述对若干所述基础理论文件进行多级聚类分析处理,以生成若干对应的理论特征数据链的步骤包括:当获取到若干所述基础理论文件时,逐一识别出若干所述基础理论文件中的文件标题、
以及
技术实现思路
,并依次对所述文件标题、所述
以及所述
技术实现思路
进行多级聚类分析处理,以分别逐一生成对应的标题特征值、领域特征值以及内容特征值;依次组合所述标题特征值、所述领域特征值以及所述内容特征值,以生成若干对应的理论特征数据链。
[0009]优选的,所述依次对所述文件标题、所述
以及所述
技术实现思路
进行多级聚类分析处理,以分别逐一生成对应的标题特征值、领域特征值以及内容特征值的步骤包括:分别将相似度大于第一预设阈值的文件标题存储至第一数据集中、将相似度大于第二预设阈值的
存储至第二数据集中、将相似度大于第三预设阈值的
技术实现思路
存储至第三数据集中,并依次提取出所述第一数据集中重复率最高的第一关键词、所述第二数据集中重复率最高的第二关键词以及所述第三数据集中重复率最高的第三关键词;依次将所述第一关键词、所述第二关键词以及所述第三关键词设定为所述标题特征值、所述领域特征值以及所述内容特征值。
[0010]优选的,所述根据若干所述实际特征值匹配出对应的目标理论特征数据链的步骤包括:逐一判断若干所述理论特征数据链中是否出现所述实际特征值;若判断到存在一个所述理论特征数据链中出现所述实际特征值,则将当前所述理论特征数据链设定为所述目标理论特征数据链;若判断到存在多个理论特征数据链中出现所述实际特征值,则逐一计算出所述实际特征值与多个所述理论特征数据链之间的重合度,并将重合度最高的理论特征数据链设定为所述目标理论特征数据链。
[0011]优选的,所述逐一计算出所述实际特征值与多个所述理论特征数据链之间的重合度的步骤包括:逐一计算出若干所述实际特征值与所述理论特征数据链中的若干对应的理论特
征值之间的相似度值,并将分别计算出的若干相似度值进行相乘处理,以获取到所述实际特征值与当前所述理论特征数据链之间的重合度。
[0012]优选的,所述计算出所述目标基础理论文件与所述实际特征数据链之间的契合度的步骤包括:依次识别出所述实际特征数据链中的若干级实际特征值,并对若干级所述实际特征值分别添加对应的权重;在所述目标基础理论文件中匹配出与若干级所述实际特征值对应的关键词,并按照预设规则分别计算出每级所述实际特征值与对应的关键词之间的匹配度;根据所述权重以及所述匹配度计算出每级所述实际特征值分别对应的子契合度,并对每级所述实际特征值的子契合度进行相加处理,以获取到所述目标基础理论文件与所述实际特征数据链之间的契合度。
[0013]优选的,所述按照预设规则分别计算出每级所述实际特征值与对应的关键词之间的匹配度的步骤包括:依次识别出每级所述实际特征值对应的第一字符串和对应的关键词中的第二字符串,并判断所述第一字符串中的字符的数量和种类与所述第二字符串中的字符的数量和种类是否相同;若判断到所述第一字符串中的字符的数量和种类与所述第二字符串中的字符的数量和种类相同,则判定每级所述实际特征值与对应的关键词之间为第一匹配度,并判断所述第一字符串中的若干字符的位置与所述第二字符串中的若干字符的位置是否相同;若判断到所述第一字符串中的若干字符的位置与所述第二字符串中的若干字符的位置相同,则判定每级所述实际特征值与对应的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基础理论文件推送方法,其特征在于,所述方法包括:获取多个领域的若干基础理论文件,并对若干所述基础理论文件进行多级聚类分析处理,以生成若干对应的理论特征数据链,每一所述理论特征数据链均包括对应的理论数据库,所述理论特征数据链包括若干理论特征值,所述基础理论文件包括论文、期刊以及专利;获取企业发送的产业化请求指令,并识别出当前企业对应的企业信息,所述企业信息包括经营规模信息、经营范围信息以及经营需求信息;对所述经营规模信息、所述经营范围信息以及所述经营需求信息进行多级聚类分析处理,以生成对应的实际特征数据链,所述实际特征数据链包括若干实际特征值;根据若干所述实际特征值匹配出对应的目标理论特征数据链,并基于若干所述实际特征值在所述目标理论特征数据链对应的目标理论数据库中查找出对应的目标基础理论文件;计算出所述目标基础理论文件与所述实际特征数据链之间的契合度,并判断所述契合度是否大于预设阈值;若判断到所述契合度大于所述预设阈值,则向当前所述企业推送所述目标基础理论文件。2.根据权利要求1所述的基础理论文件推送方法,其特征在于:所述对若干所述基础理论文件进行多级聚类分析处理,以生成若干对应的理论特征数据链的步骤包括:当获取到若干所述基础理论文件时,逐一识别出若干所述基础理论文件中的文件标题、技术领域以及技术内容,并依次对所述文件标题、所述技术领域以及所述技术内容进行多级聚类分析处理,以分别逐一生成对应的标题特征值、领域特征值以及内容特征值;依次组合所述标题特征值、所述领域特征值以及所述内容特征值,以生成若干对应的理论特征数据链。3.根据权利要求2所述的基础理论文件推送方法,其特征在于:所述依次对所述文件标题、所述技术领域以及所述技术内容进行多级聚类分析处理,以分别逐一生成对应的标题特征值、领域特征值以及内容特征值的步骤包括:分别将相似度大于第一预设阈值的文件标题存储至第一数据集中、将相似度大于第二预设阈值的技术领域存储至第二数据集中、将相似度大于第三预设阈值的技术内容存储至第三数据集中,并依次提取出所述第一数据集中重复率最高的第一关键词、所述第二数据集中重复率最高的第二关键词以及所述第三数据集中重复率最高的第三关键词;依次将所述第一关键词、所述第二关键词以及所述第三关键词设定为所述标题特征值、所述领域特征值以及所述内容特征值。4.根据权利要求1所述的基础理论文件推送方法,其特征在于:所述根据若干所述实际特征值匹配出对应的目标理论特征数据链的步骤包括:逐一判断若干所述理论特征数据链中是否出现所述实际特征值;若判断到存在一个所述理论特征数据链中出现所述实际特征值,则将当前所述理论特征数据链设定为所述目标理论特征数据链;若判断到存在多个理论特征数据链中出现所述实际特征值,则逐一计算出所述实际特征值与多个所述理论特征数据链之间的重合度,并将重合度最高的理论特征数据链设定为
所述目标理论特征数据链。5.根据权利要求4所述的基础理论文件推送方法,其特征在于:所述逐一计算出所述实际特征值与多个所述理论特征数据链之间的重合度的步骤包括:逐一计算出若干所述实际特征值与所述理论特征数据链中的若干对应的理论特征...

【专利技术属性】
技术研发人员:张春艳王文芳李福瑞王志强高煜
申请(专利权)人:江西省科技事务中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1