本发明专利技术提供一种物料创建的实时智能推荐方法,用于解决现有技术无法避免重复创建物料的问题,其步骤包括:S1记录用户数据;S2物料名称或其它描述性语言分词;S3计算TF‑IDF值;S4根据TF‑IDF值从大到小排列分词;S5计算物料库中已有的物料与该物料名称或其它描述性语言的相似度;S6将物料库中已有物料与该物料属性值进行相似度计算;S7将物料库中其它物料与该物料名称或其它描述性语言的相似度、属性值的相似度进行加权相似度计算;S8选择相似度高的物料,从高到低排序,推荐给用户。
【技术实现步骤摘要】
一种物料创建的实时智能推荐方法
本专利技术涉及信息技术应用领域和数据处理领域,具体涉及一种物料创建的实时智能推荐方法。
技术介绍
物料作为制造业研发设计的基本数据单元,极大影响企业的创新、成本和效率。目前,制造业在研发阶段的物料创建、搜索和使用,大都已经基于某种信息化系统,实现了物料在线化和数字化管理。然而,在用户进行新物料创建时,面对庞大的物料数据,如何让设计工程师尽可能使用已有的类似物料,避免重复创建物料而导致新物料的引入给企业带来巨大的成本,这个问题一直是制造业企业尝试去解决的问题。随着CAD/PDM应用技术的快速普及,PLM与ERP集成环境下的产品开发模式已成为众多制造业企业的选择,Top-Down的研发模式已被广泛接受,要防止重复物料现象,需从产品的研发环节着力,对物料信息的创建和查重环节进行有效管控。很多企业的物料编码管理仍存在问题,如编码规则混乱、编码重复严重、名称规格描述不统一等,编码管理的混乱造成大量的库存积压和重复采购,给企业带来巨大的成本压力和损失。ERP系统中虽然有编码管理模块,但编码规则相对比较简单,不能满足企业的实际需求。创建物料时,由于编码管理的不足导致工程师重复创建已有物料,容易产生人为错误。如果为同一物料创建两个编码,当作两种物料使用,在现有的PLM或者ERP系统,均无法准确判断这两个不同编码的物料信息是否完全一致;在创建物料的时候,企业不同部门的员工也无法实时判断物料库中是否已存在其他员工创建的同一物料,这种情况将导致一物多码或一码多物的现象,无法实现物料编码的唯一性。因此,有必要专利技术一种在用户创建物料时填写值即可实时智能推荐相似物料的方法,及时提醒用户物料库中已有的相似物料,让设计工程师尽可能使用已有的相似物料,降低重复创建已有物料的概率,对物料信息的创建有效查重和管控。
技术实现思路
本专利技术是为了解决用户在创建物料时重复创建已有物料的问题,而提出一种物料创建的实时智能推荐方法。为实现上述目的,本专利技术提出的一种物料创建的实时智能推荐方法,所述物料创建在物料库中,物料创建时具有一个物料名称值、多个物料属性值和其它描述性语言,通过以下步骤实现:S1用户进行物料A创建时,记录下用户填写的名称值、属性值和其它描述性语言;S2将物料A名称值或其它描述性语言进行NLP智能分词,得到物料A的分词集,分词集包含m个分词;其中,NLP智能分词采用结巴分词原理,结合工业领域的不同细分行业,采集或添加属于该行业的分词得到分词库;S3计算物料A分词集中分词的TF-IDF值;其中,TF=TermFrequency词频,IDF=InverseDocumentFrequency逆文档频率,具体步骤为:S3.1计算物料A分词集中m个分词的词频,具体公式为:分词的词频(TF)=分词在物料名称或其它描述性语言中的出现次数/物料名称或其它描述性语言中的总分词数;S3.2计算物料A分词集中m个分词的逆文档频率,具体公式为:分词的逆文档频率(IDF)=log(物料库的物料名称或其它描述性语言总数/包含分词的物料名称或其它描述性语言总数+1),其中,IDF值的大小与分词在物料库中的常见度成反比;S3.3计算物料A分词集中m个分词的TF-IDF值,具体公式为:TF-IDF值=TF值*IDF值,其中,TF-IDF值的大小与分词在该物料名称或其它描述性语言中的出现次数成正比,与分词在物料库中的出现次数成反比;S4根据物料A分词集中分词的TF-IDF值,从大到小排列出物料A的分词;S5根据物料A的分词排序,计算物料库中已有物料与物料A名称或其它描述性语言的相似度D1,具体步骤为:S5.1计算物料库中物料B与物料A名称或其它描述性语言的相似度,从物料A和B的分词集中各取p个分词,合并成一个物料关键词合集;S5.2计算物料A和B关于这个关键词合集的词频,例如,物料A:{关键词1,词频x1},{关键词2,词频y1};物料B:{关键词1,词频x2},{关键词2,词频y2};S5.3生成物料A和B各自物料名称或其它描述性语言的词频向量,例如,物料A的词频向量[x1,y1];物料B的词频向量[x2,y2];S5.4计算物料A和B名称或其它描述性语言的词频向量的余弦相似度D1,值越大表示相似度越高,具体公式为:;S6根据步骤S1中用户填写的物料A属性,计算物料库中已有物料与物料A属性值的相似度,具体步骤为:S6.1将物料库中的q个属性值作为相互关联的随机变量,组成列向量;S6.2利用马氏距离公式计算物料属性值数据集的协方差距离,即物料属性值的相似度D2,具体公式为:;S7将物料库中其它物料与物料A名称或其它描述性语言的相似度、属性值的相似度进行加权相似度计算,具体步骤为:S7.1设置名称或其它描述性语言相似度的加权因子为k,属性值相似度的加权因子为1-k,其中k的取值范围是(0,1];S7.2根据所述步骤S5.4得到的名称或其它描述性语言相似度D1和所述步骤S6.2得到的属性值相似度D2,计算物料B与物料A的相似度,具体公式为:物料B与物料A的相似度D=k*D1+(1-k)*D2;S8选择相似度高的物料,从高到低排序,实时推荐给用户。进一步地,所述方法在用户输入名称、属性值或其它描述性语言时即实时推荐相似物料。进一步地,所述方法可用于进行物料搜索时,对物料搜索结果进行相似物料的智能推荐。进一步地,所述方法也可适用于三维的相似度计算和推荐,在创建和搜索三维物料时,可记录下三维物料的名称、描述性语言和三维特征值,并进行三维物料的相似度计算,选择相似度高的物料,从高到低排序,实时推荐给用户。进一步地,所述方法可用于制造业企业物料管理研发设计阶段。进一步地,所述方法中提到的距离公式并不是唯一的距离公式,根据实际情况运算时可选择其它距离公式计算。进一步地,创建物料信息时,所述方法在表单填写界面有相似物料列出供用户重用已有物料,避免创建重复物料,该相似物料在相似度大于一定阈值之后出现,并且随着用户填写的物料属性越详细,推荐的准确度会越高。有益效果本专利技术对比已有技术具有以下创新点:1.本专利技术在创建物料阶段,用户输入值时即可根据填写的值实时计算并推荐相似或相同物料。2.本专利技术运用物料名称或其它描述性语言的相似度,和属性值的相似度结合,进行加权相似度计算从而得到相似度排序,推荐的相似物料更准确,实用性更强。本专利技术对比已有技术具有以下显著优点:1.本专利技术在创建物料时即实时推荐相似或相同物料,在源头即可避免重复创建物料,大大降低重复物料的引入而带来的企业成本。2.本专利技术运用名称或其它描述性语言的相似度,和属性值相似度结合的加权相似度计算,可实现相似度从高到低排序的高精准度推荐,显著提高了相似度的判断。...
【技术保护点】
1.一种物料创建的实时智能推荐方法,其中,所述物料创建在物料库中,物料创建时具有一个物料名称值、多个物料属性值和其它描述性语言,其特征在于,包括以下步骤:/nS1用户进行物料A创建时,记录下用户填写的名称值、属性值和其它描述性语言;/nS2将物料A名称值或其它描述性语言进行NLP智能分词,得到物料A的分词集,分词集包含m个分词,其中,NLP智能分词采用结巴分词原理,结合工业领域的不同细分行业,采集或添加属于该行业的分词得到分词库;/nS3计算物料A分词集中分词的TF-IDF值,其中,TF=Term Frequency词频,IDF=InverseDocument Frequency逆文档频率,具体步骤为:/nS3.1计算物料A分词集中m个分词的词频,具体公式为:/n分词的词频(TF)=分词在物料名称或其它描述性语言中的出现次数 / 物料名称或其它描述性语言中的总分词数;/nS3.2计算物料A分词集中m个分词的逆文档频率,具体公式为:/n分词的逆文档频率(IDF)=log(物料库的物料名称或其它描述性语言总数 / 包含分词的物料名称或其它描述性语言总数+1),其中,IDF值的大小与分词在物料库中的常见度成反比;/nS3.3计算物料A分词集中m个分词的TF-IDF值,具体公式为:/nTF-IDF值=TF值*IDF值,其中,TF-IDF值的大小与分词在该物料名称或其它描述性语言中的出现次数成正比,与分词在物料库中的出现次数成反比;/nS4根据物料A分词集中分词的TF-IDF值,从大到小排列出物料A的分词;/nS5根据物料A的分词排序,计算物料库中已有物料与物料A名称或其它描述性语言的相似度D1,具体步骤为:/nS5.1计算物料库中物料B与物料A名称或其它描述性语言的相似度,从物料A和B的分词集中各取p个分词,合并成一个物料关键词合集;/nS5.2计算物料A和B关于这个关键词合集的词频,例如,/n物料A:{关键词1,词频x1},{关键词2,词频y1};/n物料B:{关键词1,词频x2},{关键词2,词频y2};/nS5.3生成物料A和B各自物料名称或其它描述性语言的词频向量,例如,/n物料A的词频向量[x1,y1];/n物料B的词频向量[x2,y2];/nS5.4计算物料A和B名称或其它描述性语言的词频向量的余弦相似度D1,值越大表示相似度越高,具体公式为:/n...
【技术特征摘要】
1.一种物料创建的实时智能推荐方法,其中,所述物料创建在物料库中,物料创建时具有一个物料名称值、多个物料属性值和其它描述性语言,其特征在于,包括以下步骤:
S1用户进行物料A创建时,记录下用户填写的名称值、属性值和其它描述性语言;
S2将物料A名称值或其它描述性语言进行NLP智能分词,得到物料A的分词集,分词集包含m个分词,其中,NLP智能分词采用结巴分词原理,结合工业领域的不同细分行业,采集或添加属于该行业的分词得到分词库;
S3计算物料A分词集中分词的TF-IDF值,其中,TF=TermFrequency词频,IDF=InverseDocumentFrequency逆文档频率,具体步骤为:
S3.1计算物料A分词集中m个分词的词频,具体公式为:
分词的词频(TF)=分词在物料名称或其它描述性语言中的出现次数/物料名称或其它描述性语言中的总分词数;
S3.2计算物料A分词集中m个分词的逆文档频率,具体公式为:
分词的逆文档频率(IDF)=log(物料库的物料名称或其它描述性语言总数/包含分词的物料名称或其它描述性语言总数+1),其中,IDF值的大小与分词在物料库中的常见度成反比;
S3.3计算物料A分词集中m个分词的TF-IDF值,具体公式为:
TF-IDF值=TF值*IDF值,其中,TF-IDF值的大小与分词在该物料名称或其它描述性语言中的出现次数成正比,与分词在物料库中的出现次数成反比;
S4根据物料A分词集中分词的TF-IDF值,从大到小排列出物料A的分词;
S5根据物料A的分词排序,计算物料库中已有物料与物料A名称或其它描述性语言的相似度D1,具体步骤为:
S5.1计算物料库中物料B与物料A名称或其它描述性语言的相似度,从物料A和B的分词集中各取p个分词,合并成一个物料关键词合集;
S5.2计算物料A和B关于这个关键词合集的词频,例如,
物料A:{关键词1,词频x1},{关键词2,词频y1};
物料B:{关键词1,词频x2},{关键词2,词频y2};
S5.3生成物料A和B各自物料名称或其它描述性语言的词频向量,例如,
物料A的词频向量[x1,y1];
物料B的词频向量[x2,y2];
S5.4计...
【专利技术属性】
技术研发人员:刘圣质,田伟,赵一帆,
申请(专利权)人:广州易行信息技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。