【技术实现步骤摘要】
一种基于语义的企业研发资源信息建模方法
本专利技术属于基于语义和大数据的信息建模领域,涉及一种企业研发设计资源统一建模的构建方法,具体涉及一种基于语义的企业研发资源信息建模方法。
技术介绍
伴随社会经济与相关资料相关技术的全面发展,搜索活动已被整合到社会经济的各个角落。相关资料搜索产业作为国内外蓬勃发展的产业,已成为社会经济体系的重要组成部分。丰富的知识元素与智力是隐藏在巨大而多样化的相关资料背后的,但却没有及时发现与有效利用,这严重影响了相关资料搜索活动的效率。现有的研发资源主要是根据各自专用的专家信息系统来是实现,但在企业不同的部门之间实际共享研发资源困难[1],基于关键词检索信息效率不高的问题,提出了基于语义的企业研发资源信息构建方法。此外传统的企业信息建模只局限于某一特定研发系统的信息模型构建,如产品关联的信息建模[2][3],而缺乏整体性、动态性的资源管理方法[4]。本专利技术针对企业级所属企业/工厂之间,研发设计资源缺乏统一的组织体系和共享机制的问题,围绕产品设计、制造、服务全生命周期对设计资源共享和集成管理的需 ...
【技术保护点】
1.一种基于语义的企业研发资源信息建模方法,包括如下步骤:/n(1)构建企业研发资源信息文本语料库T;/n(2)对企业研发资源信息文本语料库T进行基于语义的文本分词;/n(3)基于语义分析的企业研发资源信息实体识别,采用基于隐马尔科夫模型(HMM)模型和viterbi算法相结合的方式对企业研发资源信息实体是被模型进行识别,方法如下:/n第一步:使用企业研发资源信息文本语料库T训练模型,结合基于语义分析的企业研发资源信息文本分词中生成的状态序列结果对待输入企业研发资源信息文本语料库T文本进行处理;/n第二步:结合基于语义分析的企业研发资源信息文本分词中生成的状态序列结果对待输 ...
【技术特征摘要】
1.一种基于语义的企业研发资源信息建模方法,包括如下步骤:
(1)构建企业研发资源信息文本语料库T;
(2)对企业研发资源信息文本语料库T进行基于语义的文本分词;
(3)基于语义分析的企业研发资源信息实体识别,采用基于隐马尔科夫模型(HMM)模型和viterbi算法相结合的方式对企业研发资源信息实体是被模型进行识别,方法如下:
第一步:使用企业研发资源信息文本语料库T训练模型,结合基于语义分析的企业研发资源信息文本分词中生成的状态序列结果对待输入企业研发资源信息文本语料库T文本进行处理;
第二步:结合基于语义分析的企业研发资源信息文本分词中生成的状态序列结果对待输入企业研发资源信息文本语料库T文本进行处理,根据已经求出的状态序列,标识出企业研发资源信息实体;
(4)基于语义分析的企业研发资源信息实体识别关系提取,采用半监督学习的snowball算法,提取与企业研发信息资源相关的实体关系,步骤如下:
第一步:输入待处理文本,标注待处理文本中企业研发资源信息实体中识别到的资源信息实体;
第二步:定义资源信息实体前后取词长度;
第三步:生成规则:根据资源信息实体前后取词结果,形成待处理文本,结构转化为:词向量+实体类别+词向量+实体类别+词向量,表示为规则(L,T,M,T,R);
第四步:计算规则相似度:对于规则1(L1,T1,M1,T1,R1)、规则2(L2,T2,M2,T2,R2),如果T1不等于T2,则规则1和规则2无相似度;反之,则规则1和规则2相似度S=W1L1L2+W2M1M2+W3R1R2,其中W1,W2和W3为相应词向量的权重,中间词向量的权重较大;
(5)企业研发资源动态分析,利用关键词提取技术分析企业内部资源使用情况,方法如下:
第一步:建立停用词语料库,对已经得到的分词文本去除停用词,停用词语料库内容包括标点符号、常用词、以及名词、动词、形容词、副词之外...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。