一种面向众包平台的产品需求图谱动态更新方法技术

技术编号:34471569 阅读:27 留言:0更新日期:2022-08-10 08:45
本发明专利技术提出一种面向众包平台的产品需求图谱动态更新方法,通过需求抽取和需求表征技术,以众包需求作为数据来源,使用基于k

【技术实现步骤摘要】
一种面向众包平台的产品需求图谱动态更新方法


[0001]本专利技术涉及一种面向众包平台的产品需求图谱动态更新方法,属于人工智能领域大数据知识工程的研究内容。

技术介绍

[0002]在众包设计等设计新模式下的语境下,用户需求在大规模定制化生态中呈现动态与个性化的特性,且数量方面随着互联网的发展呈现海量爆发的态势。众包设计中的需求来源不再局限于传统设计中的用户表达需求,更多的需求隐藏于众包设计生态演进过程中的各个时间角落以及空间角落,导致众包设计生态动态演进与多主体特性引发的多动力驱动的需求动态演化更新难。因此,通过基于需求抽取与需求表征等技术,并结合图谱动态更新来实现众包平台的需求动态演化更新。

技术实现思路

[0003]本专利技术提出一种面向众包平台的产品需求图谱动态更新方法,通过需求抽取和需求表征技术,以众包需求作为数据来源,使用基于k

近邻和ε

半径组合方法实现产品需求图谱更新,步骤如下:
[0004]步骤一:众包需求抽取并行化。
[0005]步骤二:基于语义的需求节点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向众包平台的产品需求图谱动态更新方法,其特征在于,步骤如下:步骤一:众包需求抽取并行化;步骤二:基于语义的需求节点相似度计算;步骤三:基于k

近邻和ε

半径组合的产品需求图谱更新。2.根据权利要求1所述的一种面向众包平台的产品需求图谱动态更新方法,其特征在于:在步骤一中,具体为:针对海量需求大数据全网分布式多策略抓取采集、存储、检索、分析以及可视化的需求,提出需求抽取并行化策略,整个策略共有如下几个过程:

构建需要抓取的种子URL列表,根据提供的URL列表和相应的优先级,建立待抓取URL队列;

根据待抓取URL队列的排序进行网页抓取;

将获取的网页内容和信息下载到本地的网页库,并建立已抓取URL列表;

将已抓取的网页放入到待抓取的URL队列中,进行循环抓取操作。3.根据权利要求1所述的一种面向众包平台的产品需求图谱动态更新方法,其特征在于:在步骤二中,具体为:需求语句是一段设计者用自然语言描述的短文,要对其进行分析首先需要通过分词技术从中提取出关键词;需要构建一个基于设计领域的中文分词器;构建领域术语词典、通用术语词典和屏蔽术语词典;领域术语词典中的术语就是设计领域对象中已经规范好的概念、术语,从设计词典、说明书、行业标准、设计手册中提取;通用术语词典则由日常生活自然语言中的常见词汇构成;构建屏蔽术语词典是为了屏蔽明显无意义的词元,消除无意义词元对关键词提取的影响;分词完成后,然后通过基于名词空间和动词空间的需求文本相似度计算完成需求节点相似度计算。4.根据权利要求3所述的一种面向众包平台的产品需求图谱动态更新方法,其特征在于:在步骤二中,采用结合正向最大匹配法与逆向最大匹配法的双向匹配最大词长分词法;先利用领域术语词典从需求描述中提取领域术语,再对剩下的文本使用通用术语词典提取通用术语,保证需求描述中产品设计领域术语的提取。5.根据权利要求3或4所述的一种面向众包平台的产品需求图谱动态更新方法,其特征在于:在步骤二中,首先输入待分词的需求描述,应用正向最大词长匹配和逆向最大词长匹配切分字符串,输出分词结果;然后,合并两种分词法输出的分词结果,消除其中的重复词元,得到一个没有重复元素的词集;由于分词结果中可能存在一个词元是另一个词元的子词元,所以需要消除被包含的词元,保留具有最大词长的词元;最后依据词性输出名词词集和动词词集。6.根据权利要求5所述的一种面向众包平台的产品需求图谱动态更新方法,其特征在于:在步骤二中,在车载焊接六轴机器人底座的设计中,其分词过程如下:步骤一:正向最大词长匹配;分词结果为“车载焊接六轴机器人”、“底座”、“设计”;步骤二:逆向最大词长匹配;分词结果为“车载焊接六轴”、“机器”、“机翼”、“设计”;其中“车载焊接六轴机器人”和“底座”是领域术语词典中的词,“设计”既是领域术语词典中的词也是通用术语词典中的词,“机器”则是通用术语词典中的词,“的”为屏蔽词典中的词;步骤三:消除重复词元;分词结果为“车载焊接六轴机器人”、“车载焊接六轴”、“机器”、

底座”、“设计”;消除重复的“设计”;步骤四:消除被包含词元;分词结果为“车载焊接六轴机器人”、“底座”、“设计”;“车载焊接六轴机器人”包含了“车载焊接六轴”、“机器”,故删除“车载焊接六轴”和“机器”;步骤五:输出名词词集合动词词集;名词词集为“车载焊接六轴机器人”、“底座”,动词词集为“设计”。7.根据权利要求5所述的一种面向众包平台的产品需求图谱动态更新方法,其特征在于:在步骤二中,通过分词算法从两个疑似相同节点的需求描述中提取名词集和动词集;节点A的名词集为N
A
={w
A,1
,w
A,2
,w
A,3


,w
A,n
}包含n个词元,动词集为V
A
={h
A,1
,h
A,2
,h
A,3


,h
A,m
}包含m个词元;节点B的名词集为N
B
={w
B,1
,w
B,2
,w
B,3


,w
B,q
}包含q个词元,动词集为V
B
={h
B,1
,h
B,2
,h
B,3


,h
B,f
}包含f个词元;依据节点A和节点B的名词集和动词集分别构建名词向量空间和动词向量空间的基向量集N

【专利技术属性】
技术研发人员:刘继红王瑞文
申请(专利权)人:北京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1