System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于知识图谱的芯片查找方法、系统及存储介质技术方案_技高网

基于知识图谱的芯片查找方法、系统及存储介质技术方案

技术编号:40207077 阅读:8 留言:0更新日期:2024-02-02 22:18
本发明专利技术公开了一种基于知识图谱的芯片查找方法、系统及存储介质,方法包括:爬取芯片型号、芯片原厂以及应用领域3种实体信息,获得数据源;将数据源中的非结构化信息进行结构化处理,将结构化信息插入知识图谱;构建芯片知识图谱数据库;根据用户的查询需求,进行需求整合、解析、转译;芯片知识图谱数据库向用户返回查询结果。系统包括:爬虫模块,数据处理模块,芯片知识图谱,需求采集模块,查找模块以及输出模块。本发明专利技术基于知识图谱技术,将芯片、厂家、应用领域等信息集合到图谱中,用户可从多种维度查找所需要的芯片,尤其可在产品信息不全的情况下,进行针对性的查找,查找效率高、查找结果准确;有利于半导体芯片的推广应用。

【技术实现步骤摘要】

本专利技术涉及大数据搜索和挖掘领域,具体涉及一种基于知识图谱的芯片查找方法、系统及存储介质


技术介绍

1、集成电路是电子信息产品的“心脏”,集成电路广泛应用于消费类电子、计算机、网络通信、汽车电子、物联网、云计算、节能环保、高端装备、医疗电子等领域。随着行业分工的不断细化,集成电路产业可分为集成电路设计业、集成电路制造业、集成电路封装测试业、集成电路设备制造业、集成电路材料业等子行业。

2、我国是存储芯片的消耗大国,消耗了全球接近50%的存储器产能。面对宏大的芯片供应,市面上同类型的元器件型号、厂商越来越多,虽然查找芯片的网站和渠道变多了,但对于芯片的选型和使用也变得越来越困难。

3、现有的芯片查找手段主要是依靠有经验的工程师在知名国内外代理网站上进行芯片选型,存在3个问题:(1)产品由于入库参数不完全对等或者未入库而不能被选到;(2)芯片原厂和知名代理网站未达成合作而使其产品不能被选到;(3)只能通过芯片参数进行芯片查找。由于中国的半导体相关企业越来越多,对应生产出来的产品也日益增加,想要选到合适的芯片产品更加不容易,因此有很多工程师通过网站无法找到合适的芯片型号,需要通过需求自己找芯片原厂公司再经由原厂的网站去查看芯片信息,效率低,成本高,有效性差。


技术实现思路

1、专利技术目的:针对因海量芯片原厂多、产品多、代理网站汇总不全等问题导致的芯片数据分类和查找困难的现状,本专利技术构建了一个多维度的芯片知识图谱,基于该芯片知识图谱提出了一套新的芯片查找方法;同时,本专利技术提出一种用于执行该芯片查找方法的系统及存储介质。

2、第一方面,本专利技术提出一种基于知识图谱的芯片查找方法,包括如下步骤:

3、(1)爬取芯片型号、芯片原厂以及应用领域3种实体信息,获得数据源;

4、(2)将数据源中的非结构化信息进行结构化处理,将结构化信息插入知识图谱;

5、(3)根据芯片型号、应用领域、芯片原厂3种实体之间的关系和/或该3种实体内部的属性关系构建芯片知识图谱;

6、(4)根据用户的查询需求,进行需求整合、解析、转译;

7、(5)芯片知识图谱数据库向用户返回查询结果。

8、在其中一个实施例中,采用自然语言方法处理所述非结构化信息。

9、在其中一个实施例中,还包括采用自动和/或手动的方式进行知识图谱数据库维护和更新的步骤。

10、在其中一个实施例中,若芯片型号和pintopin相似芯片型号未知,用户输入具体应用需求和少量芯片需求,所述少量芯片需求是指芯片需求为2个以下;首先基于应用类别识别算法识别应用类别,根据应用类别和芯片需求,在芯片知识图谱数据库中查找相应应用领域和芯片实体属性的最短距离,并按照价格排序查找输出芯片型号列表;

11、在其中一个实施例中,若芯片型号和pintopin相似芯片型号未知,用户输入若干具体芯片需求,在芯片知识图谱数据库中查找芯片实体属性,并按照如下方式进行相似度计算:

12、设所述具体芯片需求有n个芯片属性:r1,r2,r3,……,rn;

13、针对每一个参数为数值的芯片属性,在芯片知识图谱数据库中查找参数数值大于等于该数值的芯片,具体的

14、若找到完全相等的,则相似度记为si=100%;

15、若找到大于该数值的,则相似度记为si=90%,偏差值devi=ri-ri,ri为查找得到的参数数值,ri为用户输入的参数数值;

16、若未找到对应属性,相似度si=0%;

17、遍历n个芯片属性的参数数值,计算芯片的相似度均值s和总偏差值dev,根据相似度从大到小进行排序;针对相似度相同的,再根据偏差值从小到大排序,输出芯片列表;

18、所述相似度均值s和总偏差值dev计算公式如下:

19、

20、

21、进一步的,若芯片型号和pin to pin相似芯片型号未知,用户输入具体芯片需求和具体应用需求,首先基于应用类别识别算法识别应用类别,在芯片知识图谱数据库中查找相应的应用领域,并进行相似度计算,排序后输出芯片列表。

22、更进一步的,若未能找到适合的芯片,基于应用类别识别算法识别应用领域,然后在芯片知识图谱数据库中查找相应应用领域对应的所有芯片原厂实体,并计算每一个芯片原厂vi的中心性,依据中心性从大到小排序输出每一个芯片原厂的详细信息,所述中心性的计算公式如下:

23、

24、其中aj代表子网中与芯片原厂vj连接的其它节点数量,n表示芯片原厂vj所属网络中所有节点数量,此中心性越大说明该芯片原厂在国产芯片知识图谱中越重要。

25、第二方面,本专利技术提出一种用于执行所述芯片查找方法的芯片查找系统,包括:

26、爬虫模块,用于爬取芯片型号、芯片原厂以及应用领域3种实体信息,获得数据源;

27、数据处理模块,和爬虫模块连接,用于处理所述数据源;

28、芯片知识图谱,和数据处理模块连接,基于所述数据源,构建芯片型号、应用领域、芯片原厂3种实体之间的关系和/或该3种实体内部的属性关系;

29、需求采集模块,用于采集用户的芯片查找需求;

30、查找模块,用于解析用户的查询需求,并将解析出来的查询需求转译为查询命令进行图谱查询;所述用户的查询需求为应用领域、芯片属性、芯片型号、相似芯片、芯片原厂中的一种或多种,所述应用领域信息通过查找模块内置的应用类别识别算法识别;

31、输出模块,用于向用户返回图谱查询结果。

32、优选的,所述应用类别识别算法基于bert模型搭建:

33、首先基于爬虫文本数据,利用分词工具结合词频统计将具体应用和文本进行分词,并进行词频统计,得到一个或多个应用类别,针对每一个应用类别,判断该应用类别的词组合在文本中出现的次数,若次数大于阈值μ,即认为此段文本属于该应用类别,以此进行数据初筛;再由人工精筛后构建训练数据,然后将训练数据构造成bert模型的输入格式,输入训练即可得到正确率符合预期的分类模型。

34、第三方面,本专利技术提出一种计算机可读存储介质,所述存储介质中存储有至少一个可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行所述芯片查找方法。

35、与现有方法相比,本专利技术具有以下有益效果:

36、(1)将芯片的原厂信息、产品信息集合到知识图谱中,构建了多层的芯片知识图谱结构,满足了通过多种查询维度(芯片属性、芯片型号、相似芯片、应用领域、芯片原厂等等)单独或联合查找芯片的方式;

37、(2)能够在芯片参数不全或未上传的情况下,根据具体应用需求罗列出所有原厂信息的列表,进而直接到相关官网中查找所需要的芯片,实现针对性的查找,省掉了工程师一一查找对应领域芯片生产厂商的时间和困难;

38、(3)将针对传统关系表进行的联表查询,变成针对点、本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的芯片查找方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的芯片查找方法,其特征在于,步骤(2)中,采用自然语言方法处理所述非结构化信息。

3.根据权利要求1所述的芯片查找方法,其特征在于,还包括采用自动和/或手动的方式进行知识图谱数据库维护和更新的步骤。

4.根据权利要求1所述的芯片查找方法,其特征在于,步骤(4)中,若芯片型号和pintopin相似芯片型号未知,用户输入具体应用需求和少量芯片需求,所述少量芯片需求是指芯片需求为2个以下;首先基于应用类别识别算法识别应用类别,根据应用类别和芯片需求,在芯片知识图谱数据库中查找相应应用领域和芯片实体属性的最短距离,并按照价格排序查找输出芯片型号列表。

5.根据权利要求1所述的芯片查找方法,其特征在于,步骤(4)中,若芯片型号和pintopin相似芯片型号未知,用户输入若干具体芯片需求,在芯片知识图谱数据库中查找芯片实体属性,并按照如下方式进行相似度计算:

6.根据权利要求5所述的芯片查找方法,其特征在于,步骤(4)中,若芯片型号和pintopin相似芯片型号未知,用户输入具体芯片需求和具体应用需求,首先基于应用类别识别算法识别应用类别,在芯片知识图谱数据库中查找相应的应用领域,并进行相似度计算,排序后输出芯片列表。

7.根据权利要求6所述的芯片查找方法,其特征在于,步骤(4)中,若未能找到适合的芯片,基于应用类别识别算法识别应用领域,然后在芯片知识图谱数据库中查找相应应用领域对应的所有芯片原厂实体,并计算每一个芯片原厂Vi的中心性,依据中心性从大到小排序输出每一个芯片原厂的详细信息,所述中心性的计算公式如下:

8.一种用于执行所述芯片查找方法的芯片查找系统,其特征在于,包括:

9.根据权利要求8所述的芯片查找系统,其特征在于,所述应用类别识别算法基于Bert模型搭建:

10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一个可执行指令,所述可执行指令在电子设备上运行时,使得电子设备执行如权利要求1-7任一所述的芯片查找方法。

...

【技术特征摘要】

1.一种基于知识图谱的芯片查找方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的芯片查找方法,其特征在于,步骤(2)中,采用自然语言方法处理所述非结构化信息。

3.根据权利要求1所述的芯片查找方法,其特征在于,还包括采用自动和/或手动的方式进行知识图谱数据库维护和更新的步骤。

4.根据权利要求1所述的芯片查找方法,其特征在于,步骤(4)中,若芯片型号和pintopin相似芯片型号未知,用户输入具体应用需求和少量芯片需求,所述少量芯片需求是指芯片需求为2个以下;首先基于应用类别识别算法识别应用类别,根据应用类别和芯片需求,在芯片知识图谱数据库中查找相应应用领域和芯片实体属性的最短距离,并按照价格排序查找输出芯片型号列表。

5.根据权利要求1所述的芯片查找方法,其特征在于,步骤(4)中,若芯片型号和pintopin相似芯片型号未知,用户输入若干具体芯片需求,在芯片知识图谱数据库中查找芯片实体属性,并按照如下方式进行相似度计算:

6.根据权利要求5所述...

【专利技术属性】
技术研发人员:孙伟芳曹笈胡义东
申请(专利权)人:江苏集萃集成电路应用技术管理有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1