System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及饮料类产品设计,具体地说,涉及基于知识图谱的饮料类产品设计方法及系统。
技术介绍
1、在饮料类的产品设计中,设计团队依赖传统的市场调研报告、消费者调查、内部销售数据等,这些信息往往是孤立的,缺乏结构化的关联,难以快速综合分析,设计决策更多基于直觉、经验和有限的市场数据,难以全面考量消费者偏好、竞争对手动态、供应链条件等因素,权重极端值而导致的预测波动,知识图谱整合了广泛的市场数据、消费者行为、供应链信息、法规标准等,通过实体和关系的链接,提供了深入的市场趋势和消费者需求分析,基于知识图谱的分析工具能够提供数据驱动的决策支持,包括市场细分、产品定位、定价策略等,使得设计决策更加科学和精准,因此,提供基于知识图谱的饮料类产品设计方法及系统。
技术实现思路
1、本专利技术的目的在于提供基于知识图谱的饮料类产品设计方法及系统,以解决上述
技术介绍
中提出的在产品设计中的信息分散、设计决策依据有限、权重极端值导致预测波动的问题。
2、为实现上述目的,本专利技术目的在于提供了基于知识图谱的饮料类产品设计方法,包括以下步骤:
3、s1、收集饮料的原材料信息、生产工艺、营养成分的文本数据;
4、s2、通过idf算法对饮料数据信息进行实体识别,采用随机森林模型对数据进行关系抽取,将数据转换成知识图谱中的节点和边,添加文本特征的权重并引入饱和函数;
5、添加文本权重后并引入饱和函数优化后的idf算法为:
6、
7、其中,
8、s4、利用协同过滤算法根据用户历史偏好从知识图谱中筛选出受用户欢迎的饮料配方和口味。
9、作为本技术方案的进一步改进,所述s2中,通过实体识别技术识别出图谱中的节点,包括以下步骤:
10、a2.1、构建包含饮料产品描述、配料表、营养信息、用户评论的文本数据集,并对数据进行预处理;
11、a2.2、采用idf算法从文本中提取特征,特征包括词性标注、上下文词汇、位置信息,并引入饱和函数对idf算法进行优化;
12、a2.3、使用隐马尔可夫模型hmm识别文本中的实体;
13、a2.4、识别出实体后,将其按照相同类别进行分类,类别构成知识图谱中的节点。
14、作为本技术方案的进一步改进,所述a2.2中,优化前的idf算法具体为:
15、
16、其中,w表示词,d表示文本数据,id(w,d)为加权后的文本特征,tf(w,d)表示词w在文本数据d中的词频,n表示文本数据总数,dfw表示文本数据频率。
17、作为本技术方案的进一步改进,所述a2.3中,使用隐马尔可夫模型hmm从文本中识别并分类实体,包括以下步骤:
18、a2.31、构建带有实体标签的数据集,数据集中的每个单词都会被标记为一个标签;
19、a2.32、使用最大似然估计算法估计状态转移概率和观测发射概率;
20、a2.33、训练hmm的两个参数:状态转移概率和观测发射概率;
21、a2.34、通过输入文本数据,使用viterbi算法找到实体标签序列,并通过平常优势规则对于viterbi算法输出的标签序列进行后处理。
22、作为本技术方案的进一步改进,所述a2.33中,状态转移概率和观测发射概率具体为:
23、a2.331、状态转移概率:
24、
25、其中,i和j表示实体类别,aij表示实体类别转移概率,nij表示在实体类别i后紧接着出现实体类别j的次数;ni表示实体类别i出现的总次数;
26、a2.332、观测发射概率:
27、
28、其中,bjk表示在实体类别j下观测到文本中词k的概率,nj,k表示在实体类别j前提下,观测到文本中词k的次数;nj表示实体类别j出现的总次数。
29、作为本技术方案的进一步改进,所述s2中,通过关系抽取技术识别并提取出实体间的关联,包括以下步骤:
30、b2.1、收集一组经过实体识别的文本数据并为文本中每一对实体抽取特征,特征包括实体对的位置信息、上下文词语、词性标注;
31、b2.2、选择随机森林模型进行训练,用于关系抽取;
32、b2.3、应用训练好的随机森林模型到未标记的实体对上,模型会输出预测的关系类型;
33、b2.4、将识别出的关系类型作为边,连接知识图谱中的相关实体节点。
34、作为本技术方案的进一步改进,所述b2.2中,通过随机森林模型构建决策树识别文本中实体间的关系,包括以下步骤:
35、b2.21、对文本数据进行预处理生成标注数据并将数据分为训练数据和测试数据;
36、b2.22、提取文本中的语义特征作为随机森林模型的输入;
37、b2.23、使用训练数据训练随机森林模型;
38、b2.24、使用训练好的模型对文本进行实体关系抽取。
39、作为本技术方案的进一步改进,所述s3中,利用知识融合技术将来自不同来源、不同格式和不同语义层次的数据信息进行整合,构建完整的知识图谱,包括以下步骤:
40、s3.1、将通过关系抽取技术识别的特征的属性值关联到实体上,形成实体的属性列表;
41、s3.2、统一不同数据源的模式和定义,将来自不同源的数据整合在一起;
42、s3.3、使用图处理工具neo4j根据实体、属性和关系构建知识图谱。
43、作为本技术方案的进一步改进,所述s4中,利用协同过滤算法根据知识图谱筛选用户喜好,包括以下步骤:
44、s4.1、从知识图谱中获取用户的行为数据,其包括消费的饮料,行为类型,时间戳;
45、s4.2、创建一个矩阵;
46、其中行代表用户,列代表饮料,单元格值代表购买次数;
47、s4.3、使用余弦相似度计算饮料之间的相似度并使用逻辑回归预测用户对未尝试过饮料的潜在评分;
48、s4.4、根据预测评分对饮料进行排序,并根据知识图谱中的关系筛选出受用户欢迎的饮料配方和口味。
49、另一方面,本专利技术提供了基于知识图谱的饮料类产品设计系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行计算机程序实现上述任意一项所述的基于知识图谱的饮料类产品设计方法。
50、与现有技术相比,本专利技术的有益效果:
51、1、该基于知识图谱的饮料类产品设计方法及系统中,通过知识图谱能够整合大量的市场数据,通本文档来自技高网...
【技术保护点】
1.基于知识图谱的饮料类产品设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述S2中,通过实体识别技术识别出图谱中的节点,包括以下步骤:
3.根据权利要求2所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述A2.2中,优化前的IDF算法具体为:
4.根据权利要求3所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述A2.3中,使用隐马尔可夫模型HMM从文本中识别并分类实体,包括以下步骤:
5.根据权利要求4所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述A2.33中,状态转移概率和观测发射概率具体为:
6.根据权利要求5所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述S2中,通过关系抽取技术识别并提取出实体间的关联,包括以下步骤:
7.根据权利要求6所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述B2.2中,通过随机森林模型构建决策树识别文本中实体间的关系,包括以下步骤:
8.根据权利要求7所述的基于知
9.根据权利要求8所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述S4中,利用协同过滤算法根据知识图谱筛选用户喜好,包括以下步骤:
10.基于知识图谱的饮料类产品设计系统,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于:所述处理器执行计算机程序实现如权利要求1-9中任意一项所述的基于知识图谱的饮料类产品设计方法。
...【技术特征摘要】
1.基于知识图谱的饮料类产品设计方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述s2中,通过实体识别技术识别出图谱中的节点,包括以下步骤:
3.根据权利要求2所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述a2.2中,优化前的idf算法具体为:
4.根据权利要求3所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述a2.3中,使用隐马尔可夫模型hmm从文本中识别并分类实体,包括以下步骤:
5.根据权利要求4所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述a2.33中,状态转移概率和观测发射概率具体为:
6.根据权利要求5所述的基于知识图谱的饮料类产品设计方法,其特征在于:所述s2中,通过关系抽取技术识别并提取出实体间的关联,...
【专利技术属性】
技术研发人员:全文俊,许秀春,张爽,
申请(专利权)人:北京淘幂科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。