产品感性意象词汇提取方法及系统技术方案

技术编号:24889423 阅读:170 留言:0更新日期:2020-07-14 18:16
本发明专利技术公开一种产品感性意象词汇提取方法及系统,其中方法包括以下步骤:收集目标产品的评论文本数据,并对所述评论文本数据进行分词,获得评价词汇;提取评价词汇中用于评价外观的高频词汇作为中心词汇,提取评价词汇中的形容词,获得形容词词汇;将所述评价词汇转化为词向量,基于词向量计算各形容词词汇与所述中心词汇的相似度,根据所述相似度提取相对应的形容词词汇作为初始感性意象词汇;对所述初始感性意象词汇进行聚类,根据聚类结果提取相对应的初始感性意象词作为感性意象词汇。本发明专利技术能够基于评论文本数据客观准确的提取出目标产品的感性意象词汇,同时能够减低人工成本、提高提取效率。

【技术实现步骤摘要】
产品感性意象词汇提取方法及系统
本专利技术涉及计算机辅助设计领域,尤其涉及一种产品感性意象词汇提取方法及系统。
技术介绍
鉴于现如今消费者对于产品的情感需求越来越强烈,设计师在对产品外观的设计过程中需要准确获取用户需求,以设计满足用户情感需求的产品。面对一个产品,用户通常会用自己的感性意象模型来匹配和评估,此时会用到某些感性意象词汇,例如“美丽的”“奢华的”等等。传统提取感性意象词汇方法通常是,邀请具有语义学习背景和该产品领域背景的专家若干名,再通过卡片分类法对所搜集的相关感性意象词汇进行初步筛选后进行分类提取,此方法人工成本高,过于依赖专家,主观成分大,干扰因素过多,且不利于大量词汇的处理,无法针对大量用户的感性意向样本进行意象词的提取,与大数据时代下的技术产生脱节。综上,需要对现有技术做进一步改进。
技术实现思路
本专利技术针对现有技术中的缺点,提供了一种产品感性意象词汇提取方法及系统。为了解决上述技术问题,本专利技术通过下述技术方案得以解决:一种产品感性意象词汇提取方法,包括以下步骤:<本文档来自技高网...

【技术保护点】
1.一种产品感性意象词汇提取方法,其特征在于包括以下步骤:/n收集目标产品的评论文本数据,并对所述评论文本数据进行分词,获得评价词汇;/n提取评价词汇中用于评价外观的高频词汇作为中心词汇,提取评价词汇中的形容词,获得形容词词汇;将所述评价词汇转化为词向量,基于词向量计算各形容词词汇与所述中心词汇的相似度,根据所述相似度提取相对应的形容词词汇作为初始感性意象词汇;/n对所述初始感性意象词汇进行聚类,根据聚类结果提取相对应的初始感性意象词作为感性意象词汇。/n

【技术特征摘要】
1.一种产品感性意象词汇提取方法,其特征在于包括以下步骤:
收集目标产品的评论文本数据,并对所述评论文本数据进行分词,获得评价词汇;
提取评价词汇中用于评价外观的高频词汇作为中心词汇,提取评价词汇中的形容词,获得形容词词汇;将所述评价词汇转化为词向量,基于词向量计算各形容词词汇与所述中心词汇的相似度,根据所述相似度提取相对应的形容词词汇作为初始感性意象词汇;
对所述初始感性意象词汇进行聚类,根据聚类结果提取相对应的初始感性意象词作为感性意象词汇。


2.根据权利要求1所述的产品感性意象词汇提取方法,其特征在于,基于词向量计算各形容词词汇与所述中心词汇的相似度,根据所述相似度提取相对应的形容词词汇作为初始感性意象词汇的具体步骤为:
计算中心词汇对应的词向量和各形容词词汇对应的词向量之间的余弦相似度,将计算结果作为所述中心词汇和所述形容词词汇的相似度,提取相似度超出预设的相似度阈值的形容词词汇作为相关词汇,获取各相关词汇在评价词汇中出现的词频;
将各中心词汇所对应的相关词汇进行合并,提取出词频超出预设的词频阈值的相关词汇,获得初始感性意象词汇。


3.根据权利要求1所述的产品感性意象词汇提取方法,其特征在于,对所述初始感性意象词汇进行聚类,根据聚类结果提取相对应的初始感性意象词作为感性意象词汇的具体步骤为:
基于初始感性意象词汇的词向量计算聚类数;
根据初始感性意象词汇的词向量对所述初始感性意象词汇进行聚类,获得对应数量的聚类簇,并获得每个聚类簇的聚类中心,提取每个聚类簇中与其聚类中心距离最近的初始感性意象词汇,生成并输出感性意象词汇。


4.根据权利要求1所述的产品感性意象词汇提取方法,其特征在于,提取评价词汇中用于评价外观的高频词汇作为中心词汇,提取评价词汇中的形容词,获得形容词词汇的具体步骤为:
按照词性对所述评价词汇进行分类,提取词性为形容词的评价词汇,获得形容词词汇,同时提取词性为名词和动词的评价词汇,并对提取获得的名词词汇和动词词汇中指代目标产品的词汇进行剔除,获得基础词汇;
统计所述评价词汇中各基础词汇的词频,根据所述词频提取相对应的基础词汇,获得高频词汇,从所述高频词汇筛选出用于评价外观的词汇作为中心词汇。


5.根据权利要求1所述的产品感性意象词汇提取方法,其特征在于,基于word2vec模型将所述评价词汇转化为词向量。


6.根据权利要求1所述的产品感性意象词汇提取方法,...

【专利技术属性】
技术研发人员:刘征陈志萱王雨桢王昀胡惠君
申请(专利权)人:中国美术学院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1