System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种材料与化工行业科技情报分析方法技术_技高网

一种材料与化工行业科技情报分析方法技术

技术编号:40824258 阅读:2 留言:0更新日期:2024-04-01 14:44
一种材料与化工行业科技情报分析方法,属于科技情报分析处理领域。为解决考虑关键词的动态演化规律进行材料与化工行业科技情报精确分析,本发明专利技术采集材料与化工行业科技情报,构建文献矩阵,构建实词向量矩阵计算实词长度,利用实词长度对撰写错误的实词进行判断,然后对实词向量矩阵中撰写错误的实词进行修正得到修正的实词向量矩阵的每个实词进行编码,基于设定的实词数量阈值进行判断,对修正的实词的编码矩阵、修正的实词的位置矩阵进行不平衡数据处理,得到数据平衡后的实词向量矩阵,然后利用一种考虑上下文信息的方法解算关键词对应的特征矩阵构建相似评价函数,进行关键词识别,构建关键词数量演化函数,进行材料与化工行业科技情报分析。

【技术实现步骤摘要】

本专利技术属于科技情报分析处理领域,具体涉及一种材料与化工行业科技情报分析方法


技术介绍

1、材料与化工行业是一个高科技含量、知识密集型的行业,科技创新是其发展的重要驱动力。科技情报分析可以通过收集、整理和分析行业内的技术、市场、政策等信息,为企业提供科学依据和参考,支持其科技创新和战略决策。科技情报分析可以帮助企业了解行业内的技术发展状况、研究热点和前沿方向,优化产品结构,提高产品质量和市场竞争力,降低研发成本,制定相应的市场营销策略,提升企业的市场竞争力。同时,科技情报分析可以为企业的战略制定提供科学依据和参考,减少决策的风险和不确定性,提高企业的可持续发展能力。

2、申请号为202210275509.1、专利技术名称为“一种基于多句压缩的无监督科技情报摘要自动生成方法”的专利技术专利,基于lda主题相似度词库扩展方法的主题爬虫来获取源数据。通过文本信息的权威性、时效性、内容相关性三个指标的文本信息价值评估模型,对所有文本段落进行排序。选取得分较高段落的作为生成最终科技情报的原始文本。最后,采用基于谱聚类和多句压缩的无监督多文档摘要方法,自动生成科技情报摘要。

3、申请号为201811273982.6、专利技术名称为“一种针对科技情报的个性化推荐方法”的专利技术专利,利用采集器等工具对系统中使用者、科技情报相关的数据进行采集,然后对采集的数据进行特征处理、特征计算、降维及聚类,并计算数据与使用者间的相似性,作为个性化推荐依据。

4、然而,上述专利技术对目标分析局限于目标实体的简单分析,没有考虑分析科技情报关键词的动态演化规律,导致不同时间的科技情报差异不明确。


技术实现思路

1、本专利技术要解决的问题是考虑关键词的动态演化规律进行材料与化工行业科技情报精确分析,提出一种材料与化工行业科技情报分析方法。

2、为实现上述目的,本专利技术通过以下技术方案实现:

3、一种材料与化工行业科技情报分析方法,包括如下步骤:

4、s1、采集材料与化工行业科技情报,构建文献矩阵,其中,为文献总数量,然后构建关键词矩阵,其中,为关键词总数量;为第 i个关键词;

5、s2、基于步骤s1中的第 i个文献中的科技情报信息数据,提取材料与化工行业科技情报信息数据中的实词向量gs,构建实词向量矩阵,,其中,b为实词总数量;

6、s3、基于步骤s2构建的实词向量矩阵,计算实词向量矩阵gs中实词长度,构建实词长度矩阵;

7、s4、利用实词长度对撰写错误的实词进行判断,然后对实词向量矩阵中撰写错误的实词进行修正,得到修正的实词向量矩阵;

8、s5、对步骤s4得到的修正的实词向量矩阵中的每个实词进行编码,设定关键词编码为1,非关键词编码为0,构建修正的实词的编码矩阵,其中为修正的实词的编码矩阵中的第b个元素,修正的实词的位置矩阵,其中为修正的实词的位置矩阵中的第b个元素,设定实词数量阈值,对修正的实词的编码矩阵进行实词数量判断,当修正的实词的编码矩阵中实词数量大于实词数量阈值时,进入步骤s6,当修正的实词的编码矩阵中实词数量小于等于实词数量阈值时,修正的实词向量矩阵与数据平衡后的全部实词向量 sl相等,然后进入步骤s7;

9、s6、对步骤s4得到的修正的实词向量矩阵,基于步骤s4构建的修正的实词的编码矩阵、修正的实词的位置矩阵进行不平衡数据处理,得到数据平衡后的实词向量矩阵;

10、s7、基于步骤s5和s6得到的数据平衡后的全部实词向量矩阵,利用一种考虑上下文信息的方法解算关键词对应的特征矩阵;

11、s8、基于步骤s7得到的关键词对应的特征矩阵,构建相似评价函数,进行关键词识别;

12、s9、基于步骤s1构建的文献矩阵,重复步骤s2-s8,对文献矩阵中的每一篇文献进行关键词识别,构建关键词数量演化函数,进行材料与化工行业科技情报分析。

13、进一步的,步骤s1的具体实现方法包括如下步骤:

14、s1.1、采集材料与化工行业科技情报,包括学术期刊、会议论文、技术报告、专利数据、商业数据库、行业报告、企业年报、企业内部研究报告、社交媒体数据、新闻报道;

15、s1.2、考虑文献差异对关键词的影响建立文献差异矩阵,,其中,为第 i个文献对关键词的影响权重;

16、s1.3、考虑不同年份对关键词出现频率的影响,将文献按年份进行划分。

17、进一步的,步骤s4的具体实现方法包括如下步骤:

18、s4.1、设定第1个关键词的长度为p,设定弹性区间长度为p,且p<p,遍历实词长度矩阵中的实词长度,提取实词长度在区间的实词,并构建基于实词长度弹性区间的实词向量矩阵,,其中,为基于实词长度弹性区间的实词向量矩阵中的第b个元素;

19、s4.2、针对第1个关键词,遍历基于实词长度弹性区间的实词向量矩阵中所有实词向量,计算基于实词长度弹性区间的实词向量矩阵的实词重复率,计算表达式为:

20、;

21、其中,为基于实词长度弹性区间的实词向量矩阵中的第i个实词向量,为交集;

22、s4.3、设定实词重复率阈值,计算表达式为:

23、;

24、s4.4、当基于实词长度弹性区间的实词向量矩阵中,时,表明目标实词gk与为同一实词,进行下一步;时,表明目标实词gk与不是同一实词,继续比较gk与实词向量矩阵中的第i+1个实词向量,直至满足,然后进行下一步;

25、s4.5、针对第1个关键词,遍历实词向量矩阵gs中所有实词向量,计算实词向量矩阵gs的实词重复率,计算表达式为:

26、;

27、其中,为实词向量矩阵gs中的第i个实词向量;

28、然后判断的值是否为100%,判断为是不执行任何操作,判断为否则用替换实词向量矩阵gs中的,完成对错误文本数据的修正,得到修正的实词向量矩阵,其中修正的实词向量矩阵中实词向量的个数为b。

29、进一步的,步骤s5中设定实词数量阈值为,比较中实词总数量b与br的大小,当时,判断为不存在数据不平衡问题;当时,判断为存在数据不平衡问题。

30、进一步的,步骤s6的具体实现方法包括如下步骤:

31、s6.1、基于步骤s5得到的修正的实词的编码矩阵,提取第1个0元素对应的距离最近的1元素,从修正的实词的位置矩阵中,分别提取和对应的元素和,并计算第1个0元素到最近的1元素的距离,计算表达式为:

32、;

33、其中,为第1个0元素对应的距离最近的1元素对应的位置矩阵中的元素,为第1个0元素对应的位置矩阵中的元素;

34、s6.2、遍历全部中的元素,提取中的本文档来自技高网...

【技术保护点】

1.一种材料与化工行业科技情报分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S1的具体实现方法包括如下步骤:

3.根据权利要求1或2所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S4的具体实现方法包括如下步骤:

4.根据权利要求3所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S5中设定实词数量阈值为,比较中实词总数量B与Br的大小,当时,判断为不存在数据不平衡问题;当时,判断为存在数据不平衡问题。

5.根据权利要求4所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S6的具体实现方法包括如下步骤:

6.根据权利要求5所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S7的具体实现方法包括如下步骤:

7.根据权利要求6所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S8的具体实现方法包括如下步骤:

8.根据权利要求7所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤S9的具体实现方法包括如下步骤:

...

【技术特征摘要】

1.一种材料与化工行业科技情报分析方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤s1的具体实现方法包括如下步骤:

3.根据权利要求1或2所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤s4的具体实现方法包括如下步骤:

4.根据权利要求3所述的一种材料与化工行业科技情报分析方法,其特征在于,步骤s5中设定实词数量阈值为,比较中实词总数量b与br的大小,当时,判断为不存在数据不平衡问题;当时,判断为...

【专利技术属性】
技术研发人员:龙云凤孟鸿任志宽陈孟
申请(专利权)人:北京大学深圳研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1