本发明专利技术提出了一种基于神经网络的科技成果自学习方法及装置。包括:获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果;建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值;根据第一特征值与第二特征值从待选取科技成果中确定待添加科技成果,将待添加科技成果添加至待添加科技成果样本集中。本发明专利技术通过词频算法以及历史记录来确定需要抓取的关键词,然后通过神经网络模型获取特征值,最后利用特征值实现科技成果的自动更新和学习,减少了人工成本,提高了更新效率。
A self-learning method and device of scientific and technological achievements based on Neural Network
【技术实现步骤摘要】
一种基于神经网络的科技成果自学习方法及装置
本专利技术涉及科技成果自学习
,尤其涉及一种基于神经网络的科技成果自学习方法及装置。
技术介绍
神经网络又称人工神经网络,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法学习模型。是由大量简单的处理单元(神经元)相互连接而形成的复杂网络,通过内部复杂的连接,模拟出各种复杂的函数用于各类数据分析问题。目前,科技成果的运用还不是很广泛,现有的科技成果存储库存储的科技成果需要更新时往往需要工作人员手动添加科技成果进行更新,这样就会给工作人员带来很大的工作量,利用神经网络可以减少工作人员的工作量,提高科技成果进库分类的精确度,但是无法实现科技成果库的自动更新,所以还是需要一种方法来实现科技成果库的自动更新,并且提高科技成果库更新的精确度。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
有鉴于此,本专利技术提出了一种基于神经网络的科技成果自学习方法及装置,旨在解决现有技术无法精确对科技成果库进行科技成果自动更新的技术问题。本专利技术的技术方案是这样实现的:一方面,本专利技术提供了一种基于神经网络的科技成果自学习方法,所述基于神经网络的科技成果自学习方法包括以下步骤:S1,获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果;S2,建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值;S3,根据第一特征值与第二特征值从待选取科技成果中确定待添加科技成果,将待添加科技成果添加至待添加科技成果样本集中。在以上技术方案的基础上,优选的,步骤S1中,获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果,还包括以下步骤,获取用户历史搜索记录,建立词频算法,通过词频算法计算用户历史搜索记录中每个词语的词频,将词频数值最大的词语作为待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果。在以上技术方案的基础上,优选的,根据关键词抓取待选取科技成果,还包括以下步骤,设定筛选类型,所述类型包括:论文、期刊以及专利,根据关键词抓取科技成果,根据筛选类型对抓取的科技成果进行筛选,将满足筛选类型的科技成果作为待选取科技成果。在以上技术方案的基础上,优选的,还包括以下步骤,所述词频算法为:其中,P代表词语的词频,m代表历史记录的文章中词语出现的次数,n代表历史记录的文章中所有词语的数量,W代表历史记录中所有的文章的数量,w代表历史记录中出现带有这个词语的文章的数量,S代表关键词修正系数。在以上技术方案的基础上,优选的,步骤S2中,建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值,还包括以下步骤,建立神经网络模型,通过神经网络模型的卷积层提取科技成果的特征值,并将特征值绘制成特征图,通过神经网络模型的池化层提取特征图中的主要特征值,根据主要特征值通过神经网络模型的全连接层函数分别计算科技成果样本集中科技成果的最终特征值作为第一特征值以及待选取科技成果的最终特征值作为第二特征值。在以上技术方案的基础上,优选的,步骤S3中,根据第一特征值与第二特征值从待选取科技成果中确定待添加科技成果,将待添加科技成果添加至待添加科技成果样本集中,还包括以下步骤,将第一特征值对第二特征值进行匹配,当第一特征值与第二特征值不匹配时,将第二特征值对应的科技成果作为待添加科技成果添加至待添加科技成果样本集中;当第一特征值与第二特征值匹配时,获取第一特征值对应的科技成果的文件大小以及第二特征值对应的科技成果的文件大小,将第一特征值对应的科技成果的文件大小与第二特征值对应的科技成果的文件大小进行比较,根据比较结果,将第二特征值对应的科技成果删除。在以上技术方案的基础上,优选的,根据比较结果,将第二特征值对应的科技成果删除,还包括以下步骤,当第一特征值对应的科技成果的文件大小与第二特征值对应的科技成果的文件大小相同时,将第二特征值对应的科技成果删除;当第一特征值对应的科技成果的文件大小与第二特征值对应的科技成果的文件大小不相同时,将文件大的科技成果保留在待添加科技成果样本集中。更进一步优选的,所述基于神经网络的科技成果自学习装置包括:抓取模块,用于获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果;特征值计算模块,用于建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值;添加模块,用于根据第一特征值与第二特征值从待选取科技成果中确定待添加科技成果,将待添加科技成果添加至待添加科技成果样本集中。第二方面,所述基于神经网络的科技成果自学习方法还包括一种设备,所述设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的基于神经网络的科技成果自学习方法程序,所述基于神经网络的科技成果自学习方法程序配置为实现如上文所述的基于神经网络的科技成果自学习方法的步骤。第三方面,所述基于神经网络的科技成果自学习方法还包括一种介质,所述介质为计算机介质,所述计算机介质上存储有基于神经网络的科技成果自学习方法程序,所述基于神经网络的科技成果自学习方法程序被处理器执行时实现如上文所述的基于神经网络的科技成果自学习方法的步骤。本专利技术的一种基于神经网络的科技成果自学习方法相对于现有技术具有以下有益效果:(1)通过建立词频算法,利用词频算法计算用户历史搜索记录中科技成果的关键词,用户历史搜索记录是科技成果自更新的基础之一,通过用户历史搜索记录,系统可以不断获取新的关键词,然后不断更新系统中的科技成果;(2)通过神经网络模型计算本地存储的科技成果的特征值以及抓取到的科技成果的特征值,然后将特征值不同的科技成果存入本地存储空间中,这样可以实现科技成果更新的精确性,提高科技成果自动更新的效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例方案涉及的硬件运行环境的设备的结构示意图;图2为本专利技术基于神经网络的科技成果自学习方法第一实施例的流程示意图;图3为本专利技术基于神经网络的科技成果自学习方法第一实施例的功能模块示意图。具体实施方式下面将结合本专利技术实施方式,对本专利技术实施方式中的技术方案进行清楚本文档来自技高网...
【技术保护点】
1.一种基于神经网络的科技成果自学习方法,其特征在于:包括以下步骤;/nS1,获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果;/nS2,建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值;/nS3,根据第一特征值与第二特征值从待选取科技成果中确定待添加科技成果,将待添加科技成果添加至待添加科技成果样本集中。/n
【技术特征摘要】
1.一种基于神经网络的科技成果自学习方法,其特征在于:包括以下步骤;
S1,获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果;
S2,建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值;
S3,根据第一特征值与第二特征值从待选取科技成果中确定待添加科技成果,将待添加科技成果添加至待添加科技成果样本集中。
2.如权利要求1所述的基于神经网络的科技成果自学习方法,其特征在于:步骤S1中,获取用户历史搜索记录,建立词频算法,通过词频算法对历史搜索记录进行计算,根据计算结果确定待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果,还包括以下步骤,获取用户历史搜索记录,建立词频算法,通过词频算法计算用户历史搜索记录中每个词语的词频,将词频数值最大的词语作为待添加科技成果样本集的关键词,根据关键词抓取待选取科技成果。
3.如权利要求2所述的基于神经网络的科技成果自学习方法,其特征在于:根据关键词抓取待选取科技成果,还包括以下步骤,设定筛选类型,所述类型包括:论文、期刊以及专利,根据关键词抓取科技成果,根据筛选类型对抓取的科技成果进行筛选,将满足筛选类型的科技成果作为待选取科技成果。
4.如权利要求2所述的基于神经网络的科技成果自学习方法,其特征在于:还包括以下步骤,所述词频算法为:
其中,P代表词语的词频,m代表历史记录的文章中词语出现的次数,n代表历史记录的文章中所有词语的数量,W代表历史记录中所有的文章的数量,w代表历史记录中出现带有这个词语的文章的数量,S代表关键词修正系数。
5.如权利要求2所述的基于神经网络的科技成果自学习方法,其特征在于:步骤S2中,建立神经网络模型,通过神经网络模型计算待添加科技成果样本集中科技成果的第一特征值以及待选取科技成果的第二特征值,还包括以下步骤,建立神经网络模型,通过神经网络模型的卷积层提取科技成果的特征值,并将特征值绘制成特征图,通过神经网络模型的池化层提取特征图中的主要特征值,根据主要特征值通过神经网络模型的全连接层函数分别计算科技成果样本集中科技成果的最终特征值作为第一特征值以及待选取科技成果的最终特征值作为第二特征值。
<...
【专利技术属性】
技术研发人员:邹腊年,马银波,郭玲琼,徐飞飞,
申请(专利权)人:绍兴市上虞区理工高等研究院,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。