一种科技成果的分类方法、装置、设备及介质制造方法及图纸

技术编号:24206579 阅读:70 留言:0更新日期:2020-05-20 14:55
本发明专利技术提出了一种科技成果的分类方法、装置、设备及介质。包括:获取科技成果信息以及客户信息;根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,根据比较结果对待计算信息对应的科技成果信息进行分类。本发明专利技术通过客户信息先对科技成果进行初步分类,然后通过词频算法计算出关键词作为最终类别,最后进行分类,节省运算资源,提高了分类效率以及分类准确性。

A classification method, device, equipment and medium of scientific and technological achievements

【技术实现步骤摘要】
一种科技成果的分类方法、装置、设备及介质
本专利技术涉及科技成果分类
,尤其涉及一种科技成果的分类方法、装置、设备及介质。
技术介绍
国家实施创新驱动发展战略,科技成果是衡量企业和科研院所创新能力的重要标准之一,但是目前突出存在着企业技术吸纳能力较低、产业技术创新基础薄弱,而来自高校、科研院所的大量科研成果往往无法转化、不能与产业发展的实际需求充分对接等问题,在技术转移对接时出现了科研人员的“技术”并不等于就是企业需要的“成果”、企业没将科研院所当作自己的研发中心、技术转移对接程度不高,高校、科研院所的科技成果无法迅速转化,企业的技术需求无法满足等情况,这种情况带来了重复科研现象,造成了严重的资源浪费。因为不同的客户对于科技成果的要求也可能不同,要实现科技成果的精准推送就需要能够准确对科技成果进行识别和分类,但是现有的分类方法大都比较复杂,在提高分类精度的同时,要占用系统大量资源以及时间;而简单的分类方法,又无法提高精度,所以,亟需一种分类规则来提高分类精度的同时,降低分类的时间。上述内容仅用于辅助理解本专利技术的技术方案本文档来自技高网...

【技术保护点】
1.一种科技成果的分类方法,其特征在于:包括以下步骤;/nS1,获取科技成果信息以及客户信息;/nS2,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;/nS3,建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。/n

【技术特征摘要】
1.一种科技成果的分类方法,其特征在于:包括以下步骤;
S1,获取科技成果信息以及客户信息;
S2,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词;
S3,建立语义相似度算法,设定相似度阈值,从分类规则中提取分类关键词,根据语义相似度算法计算待计算信息的关键词以及分类关键词的相似度,将该相似度与相似度阈值进行比较,根据比较结果对待计算信息对应的科技成果信息进行分类。


2.如权利要求1所述的科技成果的分类方法,其特征在于:步骤S1,获取科技成果信息,还包括以下步骤,所述科技成果信息包括:科技成果的类型以及科技成果的文本内容,所述科技成果的类型包括:专利、论文、期刊以及实物,客户信息包括:客户历史浏览文本内容信息以及历史浏览文本类型信息,所述文本类型信息包括:专利、论文、期刊以及实物。


3.如权利要求2所述的科技成果的分类方法,其特征在于:步骤S2中,根据客户信息建立分类规则,建立词频算法,根据该分类规则对该科技成果信息进行分类,获取分类后的科技成果信息作为待计算信息,根据词频算法计算待计算信息的关键词,还包括以下步骤,根据客户历史浏览文本类型信息建立不同分类类别,根据科技成果的类型将各科技成果存入不同类别中,将各类别中的科技成果作为待计算信息,建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,并根据词频算法计算待计算信息的关键词。


4.如权利要求3所述的科技成果的分类方法,其特征在于:建立词频算法,通过该词频算法对客户历史浏览文本内容信息中的词语进行计算,根据计算结果确定分类关键词,还包括以下步骤,将各词语的词频两两进行比较,筛选出词频最大的词语,将该词语作为分类关键词。


5.如权利要求4所述的科技成果的分类方法,其特征在于:还包括以下步骤,所述词频算法为:



其中,W代表词频,m代表当前文本的总词语...

【专利技术属性】
技术研发人员:马银波邹腊年郭玲琼徐飞飞
申请(专利权)人:绍兴市上虞区理工高等研究院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1