电力物联网不同领域创新技术的关联程度分析判断方法技术

技术编号:27686520 阅读:21 留言:0更新日期:2021-03-17 04:00
本发明专利技术涉及一种电力物联网不同领域创新技术的关联程度分析判断方法,属于用于管理的数据处理方法技术领域。该方法通过将电力物联网划分8个子领域,经检索获取文献并对文献提取标题、摘要、关键词和发表年份作为文献数据;提取摘要中包含关键词的句子作为Spacy工具的输入并训练得到实体识别模型,再遍历摘要中每个句子进行实体识别得到电力物联网的关键技术术语;使用词嵌入模型将中英文文献数据映射至中英文双语词嵌入矩阵,构建关键技术术语与子领域的共现矩阵,计算任意两个所述子领域的二维互信息,最后根据二维互信息量判断任意两个子领域的创新技术之间的关联强度。该方法可为不同领域电力物联网创新技术之间的关联程度判断提供可靠数据来源。

【技术实现步骤摘要】
电力物联网不同领域创新技术的关联程度分析判断方法
本专利技术涉及一种对电力物联网不同子领域的创新技术之间相互的协同关系进行分析并判断的方法,属于适用于管理的数据处理方法

技术介绍
电力物联网是一种信息物理融合系统,其建设过程也是物联网相关技术在电力系统中的创新应用过程。研究物联网相关技术与电力系统这二者的技术耦合作用点和协同创新关系,有利于寻找电力物联网关键技术突破点并开展高效的创新路径。目前针对电力系统与物联网创新技术耦合协同研究侧重于物联网自身技术发展态势,但是由于电力物联网是物理信息融合系统,其技术创新包含了电力系统和物联网建设两个方面,因此目前所知的针对电力系统与物联网创新技术耦合协同研究方法不能为判断电力物联网创新技术的发展方向提供有效可靠的分析依据。
技术实现思路
本专利技术要解决的技术问题是:为判断电力物联网创新技术的发展方向提供有效可靠的数据依据。本专利技术为解决上述技术问题提出的技术方案是:一种电力物联网不同领域创新技术的关联程度分析判断方法,包括以下步骤:步骤1电力物联网领域划分与文献数据收集,具体如下:将电力物联网划分为电力源端、网端、荷端、储端以及物联网感知层、网络层、计算层、应用层共8个子领域;根据所述子领域的定义构建与所述子领域相关的中英文文献检索式,每个检索式包含了若干检索词;从知网和WebofScience核心数据库根据所述检索式对所述技术子领域进行检索并分别获取中文文献和英文文献,分别对所述中文文献和英文文献提取标题、摘要、关键词和发表年份作为中文文献数据和英文文献数据,二者共同构成了中英文文献数据;步骤2获得电力物联网的关键技术术语,具体如下:步骤2.1将每一篇所述文献的所述摘要中的句子包含对应该篇文献的所述关键词的句子提取出来,将提取出来的句子作为Spacy工具的输入并训练得到实体识别模型;步骤2.2利用所述实体识别模型遍历所述中英文文献数据中所有摘要中每个句子进行实体识别,如果识别出的实体与所述文献的所述关键词在同一个句子中,则将该实体作为所述电力物联网的关键技术术语,并统计所有电力物联网关键技术术语在所述中英文文献数据中出现次数;步骤3电力物联网中英文文献数据统一向量化处理,使用词嵌入模型将中英文文献数据映射至中英文双语词嵌入矩阵中,具体如下:步骤3.1自定义中英文翻译锚点文件,所述中英文翻译锚点文件定义了常见单词的中英文翻译一一对应关系,通过调用百度翻译中文检索式中的检索词和步骤2.2得到的所述关键技术术语中的中文翻译为英文得到额外的中英文对应关系,再把所述额外的中英文对应关系添加到所述中英文翻译锚点文件中去;步骤3.2分别使用中文和英文分词工具对所述中英文文献数据进行分词处理,分别得到所述中文文献数据的中文单词序列和英文文献数据的英文单词序列,使用word2vec分别训练所述文献数据的中文单词序列和英文单词序列得到每个单词的词向量,所述词向量分别构成了中文文献词嵌入矩阵和英文文献词嵌入矩阵,每个所述矩阵的维度是对应中文文献或英文文献数据中单词数目乘以相同的单词词向量维数d;步骤3.3构建中文到英文的双语词向量映射模型,如公式(1)所示。其中,d表示词向量维数,Md(R)表示定义在实数域R上d×d的实矩阵,S和T分别表示中文嵌入矩阵和英文文献词嵌入矩阵,W是权重矩阵,argmin表示最小化中文文献词嵌入矩阵S到英文文献词嵌入矩阵T的距离||WS-T||F,||||F表示Frobenius范数,计算结果得到最优的权重矩阵W*,通过所述双语词向量映射模型得到中英文双语词嵌入矩阵。步骤4构建所述关键技术术语与所述子领域的共现矩阵,具体如下:步骤4.1将所述检索词按照8个所述子领域分为8类,根据步骤3中所得中英文文献双语词嵌入矩阵取出与所述检索词对应的词向量作为所述检索词的词向量v;步骤4.2从步骤3中所得中英文文献双语词嵌入矩阵中选取与所述关键技术术语对应的词向量作为所述关键技术术语的词向量u,根据余弦相似度计算所述关键技术术语的词向量u和所述检索词的词向量v的相似度D(u,v),设相似度阈值为0.3,则当D(u,v)>0.3时,所述关键技术术语属于所述检索词的词向量v所对应的所述子领域;步骤4.3根据步骤4.2得到所述关键技术术语和所述子领域间的从属关系,将所述子领域对应的所有关键技术术语在所述文献数据中出现的次数之和作为所述关键技术术语与所述子领域共现次数,按照所述文献的发表年份划分,构建所述关键技术术语和所述子领域的共现矩阵;步骤5计算任意两个所述子领域的互信息,具体如下:步骤5.1对于任意两个子领域x1和x2,根据式(2)分别计算两个子领域的一维信息熵H(x1)和H(x2)。其中,x是子领域,ci第i(i=1,2,...,8)个子领域的关键技术术语共现次数;步骤5.1根据式(3)分别计算两个子领域x1和x2的二维信息熵H(x1,x2),其中,c1和c2分别是任意两个子领域x1和x2的关键技术术语共现次数,则这两个子领域x1和x2的二维互信息量通过式(4)计算得到,H(x1)+H(x2)-H(x1,x2)(4),根据所述二维互信息量判断任意两个子领域x1和x2的创新技术之间的关联程度。本专利技术的有益效果是:由于电力物联网包含电力和物联网两方面的子领域,现有基于科学文献的电力物联网创新技术研究大多基于文献统计计量方法,因此缺乏对科学文献内容中所涉及电力物联网关键技术以及关键技术与相关子领域关系的数据分析;本专利技术从电力物联网文献文本数据分析的角度出发,通过挖掘蕴含在电力物联网子领域文献文本中的关键技术术语,建立技术术语和子领域之间从属关系,统计电力物联网关键技术术语与电力物联网子领域共现次数,为不同领域的电力物联网创新技术之间的协同关联程度判断提供更为可靠的数据来源。附图说明下面结合附图对本专利技术的电力物联网不同领域创新技术的关联程度分析判断方法作进一步说明。图1是中文文献词嵌入矩阵在二维平面的分布图。图2是英文文献词嵌入矩阵在二维平面的分布图。图3是中英文双语词嵌入矩阵在二维平面的分布图。图4是源-荷、源-储、网-储三对子领域间互信息量的关系图。具体实施方式实施例本实施例的电力物联网不同领域创新技术的关联程度分析判断方法,包括以下步骤:步骤1电力物联网领域划分与文献数据收集,具体如下:将电力物联网划分为电力源端、网端、荷端、储端以及物联网感知层、网络层、计算层、应用层共8个子领域;根据所述子领域的定义构建与所述子领域相关的中英文文献检索式,每个检索式包含了若干检索词;从知网和WebofScience核心数据库根据所述检索式对所述技术子领域进行检索并分别获取中文文献和英文文献,对这些文献(包括中文文献和英文文献)提取标题、摘要、关键词和发表年份作为文献数据(包括中文文献数据本文档来自技高网...

【技术保护点】
1.一种电力物联网不同领域创新技术的关联程度分析判断方法,其特征在于包括以下步骤:/n步骤1电力物联网领域划分与文献数据收集,具体如下:/n将电力物联网划分为电力源端、网端、荷端、储端以及物联网感知层、网络层、计算层、应用层共8个子领域;根据所述子领域的定义构建与所述子领域相关的中英文文献检索式,每个检索式包含了若干检索词;从知网和Web of Science核心数据库根据所述检索式对所述技术子领域进行检索并分别获取中文文献和英文文献,分别对所述中文文献和英文文献提取标题、摘要、关键词和发表年份作为中文文献数据和英文文献数据,二者共同构成了中英文文献数据;/n步骤2获得电力物联网的关键技术术语,具体如下:/n步骤2.1将每一篇所述文献的所述摘要中的句子包含对应该篇文献的所述关键词的句子提取出来,将提取出来的句子作为Spacy工具的输入并训练得到实体识别模型;/n步骤2.2利用所述实体识别模型遍历所述中英文文献数据中所有摘要中每个句子进行实体识别,如果识别出的实体与所述文献的所述关键词在同一个句子中,则将该实体作为所述电力物联网的关键技术术语;/n步骤3电力物联网中英文文献数据统一向量化处理,使用词嵌入模型将中英文文献数据映射至中英文双语词嵌入矩阵中,具体如下:/n步骤3.1自定义中英文翻译锚点文件,所述中英文翻译锚点文件定义了常见单词的中英文翻译一一对应关系,通过调用百度翻译中文检索式中的检索词和步骤2.2得到的所述关键技术术语中的中文翻译为英文得到额外的中英文对应关系,再把所述额外的中英文对应关系添加到所述中英文翻译锚点文件中去;/n步骤3.2分别使用中文和英文分词工具对所述中英文文献数据进行分词处理,分别得到所述中文文献数据的中文单词序列和英文文献数据的英文单词序列,使用word2vec分别训练所述文献数据的中文单词序列和英文单词序列得到每个单词的词向量,所述词向量分别构成了中文文献词嵌入矩阵和英文文献词嵌入矩阵,每个所述矩阵的维度是对应中文文献或英文文献数据中单词数目乘以相同的单词词向量维数d;/n步骤3.3构建中文到英文的双语词向量映射模型,如公式(1)所示。/n...

【技术特征摘要】
1.一种电力物联网不同领域创新技术的关联程度分析判断方法,其特征在于包括以下步骤:
步骤1电力物联网领域划分与文献数据收集,具体如下:
将电力物联网划分为电力源端、网端、荷端、储端以及物联网感知层、网络层、计算层、应用层共8个子领域;根据所述子领域的定义构建与所述子领域相关的中英文文献检索式,每个检索式包含了若干检索词;从知网和WebofScience核心数据库根据所述检索式对所述技术子领域进行检索并分别获取中文文献和英文文献,分别对所述中文文献和英文文献提取标题、摘要、关键词和发表年份作为中文文献数据和英文文献数据,二者共同构成了中英文文献数据;
步骤2获得电力物联网的关键技术术语,具体如下:
步骤2.1将每一篇所述文献的所述摘要中的句子包含对应该篇文献的所述关键词的句子提取出来,将提取出来的句子作为Spacy工具的输入并训练得到实体识别模型;
步骤2.2利用所述实体识别模型遍历所述中英文文献数据中所有摘要中每个句子进行实体识别,如果识别出的实体与所述文献的所述关键词在同一个句子中,则将该实体作为所述电力物联网的关键技术术语;
步骤3电力物联网中英文文献数据统一向量化处理,使用词嵌入模型将中英文文献数据映射至中英文双语词嵌入矩阵中,具体如下:
步骤3.1自定义中英文翻译锚点文件,所述中英文翻译锚点文件定义了常见单词的中英文翻译一一对应关系,通过调用百度翻译中文检索式中的检索词和步骤2.2得到的所述关键技术术语中的中文翻译为英文得到额外的中英文对应关系,再把所述额外的中英文对应关系添加到所述中英文翻译锚点文件中去;
步骤3.2分别使用中文和英文分词工具对所述中英文文献数据进行分词处理,分别得到所述中文文献数据的中文单词序列和英文文献数据的英文单词序列,使用word2vec分别训练所述文献数据的中文单词序列和英文单词序列得到每个单词的词向量,所述词向量分别构成了中文文献词嵌入矩阵和英文文献词嵌入矩阵,每个所述矩阵的维度是对应中文文献或英文文献数据中单词数目乘以相同的单词词向量维数d;
步骤3.3构建中文到英文的双语词向量映射模型,如公式(1)所示。

【专利技术属性】
技术研发人员:高昇宇皮一晨朱红周冬旭张玮亚刘少君胡年超李存斌王其清
申请(专利权)人:国网江苏省电力有限公司南京供电分公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1