一种基于自然语言处理技术的卡车用户隐性需求挖掘方法技术

技术编号:39802904 阅读:50 留言:0更新日期:2023-12-22 02:34
本发明专利技术公开一种基于自然语言处理技术的卡车用户隐性需求挖掘方法,该方法主要包括

【技术实现步骤摘要】
一种基于自然语言处理技术的卡车用户隐性需求挖掘方法


[0001]本专利技术涉及用户需求挖掘
,具体地讲,涉及一种基于自然语言处理技术的卡车用户隐性需求挖掘方法


技术介绍

[0002]在产品改进设计的过程中,及时获得用户需求至关重要

传统的方法主要是采用问卷调查

用户访谈

眼动实验等方法,存在延时性

周期长,成本高的劣势

得益于电商行业与社交网络的迅猛发展,在线评论成为了表达用户需求的载体和产品缺陷获取的有效途经,可以通过从海量的在线评论中利用数据挖掘工具获取用户关注的产品特征,利用自然语言处理技术对文本进行挖掘和分析,来获取潜在客户观点

文本倾向及情感状态

在线评论已成为用户选择并使用产品的重要依据,并且评论中隐含了用户对产品的潜在需求,然而大多数基于在线评论的用户潜在需求分析的研究尚在起步阶段,如何更加全面

准确地获取用户显性需求和隐性需求,仍是当前需要深入研究的重要本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于自然语言处理技术的卡车用户隐性需求挖掘方法,其特征在于,包括以下步骤:步骤一:基于
Windows1064
位操作系统和
Ubuntu18.0.4
操作系统,由
PyCharm

Python3.6
共同搭建实验平台,建立文件夹

卡车资料
》、《
情感词典
》、《
在线评论
》、《
有效评论文本

;步骤二:数据收集:收集卡车的文献和资料

情感词典及评论文本,存储到相应的文件夹下;步骤三:对评论文本有效性进行分析:分离出无效评论,将有效评论保存至

有效评论文本

文件夹下;步骤四:语料预处理:利用
NLPIR

ICICLAS
汉语词法分析系统对

卡车资料



有效评论文本

两个文件夹中的数据进行语料预处理;步骤五:词库构建:分为属性词汇库和情感词汇库
。《
卡车资料

文件夹中的内容经过
NLPIR

ICICLAS
汉语词法分析系统分词后得到的名词或名词词组作为初始属性词汇库;

情感词典

文件夹中的内容作为初始情感词汇库;

有效评论文本

文件夹中的内容经过
NLPIR

ICICLAS
汉语词法分析系统分词后得到的名词或名词词组作为候选属性词汇库,形容词或形容词词组作为候选情感词汇库;最后进行筛选去重,整理得到最终属性词汇库和最终情感词汇库;步骤六:对有效评论进行文本分类,人工标注后利用文本分类模型进行分类;步骤七:属性词汇

情感词汇提取:规定显性句式和隐性句式的判别标准,若该条评论文本中同时包含属性词汇和情感词汇,则判定为显性句式;若该条评论文本中只包含属性词汇,则判定为隐性句式;步骤八:情感量化;利用
SO

PMI
算法和
HOWNET
情感极性量化标准对上述结果进行情感极性分析与量化,整理得到
<
属性词汇,情感均值
>
集合;步骤九:需求排序:结合
KANO
模型和
DEMATEL
分析法构建卡车需求排序模型,利用
KANO
模型找到需求和用户满意度间的关系,进行需求属性分类;根据
DEMATEL
分析法量化需求间的影响关系,最终给出清晰的排序策略;步骤十:利用问卷调查法网络调研部分卡车用户对卡车产品各个设计要素的满意度,与上述需求排序的结果做对比分析
。2.
根据权利要求1所述的基于自然语言处理技术的卡车用户隐性需求挖掘方法,其特征在于:所述步骤二的数据收集具体如下:利用
NLPIR

ICICLAS
汉语分词系统和八爪鱼网络爬虫工具获取关于卡车的文献和资料,例如卡车市场报告

卡车新闻

卡车广告等,保存至

卡车资料

文件夹下;利用文献检索法获取
HOWNET
情感词典

大连理工大学情感词汇本体

清华大学李军中文褒贬义词典和台湾大学简体中文情感词典,保存至

情感词典

文件夹下;利用人工检索法和八爪鱼网络爬虫工具获取关于卡车的社交媒体评论文本,保存至

在线评论

文件夹下
。3.
根据权利要求2所述的基于自然语言处理技术的卡车用户隐性需求挖掘方法,其特征在于:所述步骤三中:对有效评论进行定义:
(1)
有效评论必须与实际产品信息相关联,不包括无关的嘈杂信息;此外,评论还应具备用户的使用体会等信息,不只是简单的产品介绍类信息;
(2)
有效评论应包含较多的产品特征维度,内容较详细;
(3)
此外,有效评论在句式结构和内容上具有普遍性,不是一些偏僻字词和特殊结构的句子;对无效评论进行定义:
(1)
无效评论具有与卡车产品关联度不高的特点,并且内容中也不涉及卡车产品具体设计要素的细致描述,比如仅针对电商平台做出的评价;
(2)
部分评论内容与实际产品特征明显不符,也定义为无效评论;对无效评论进行清理,以减少噪音数据对实验结果的干扰:
(1)
垃圾评论删除,评论仅包含几个字

一串字符或者全部是标点符号,这类评论没有任何信息价值,需要删除;
(2)
重复评论删除,重复评论会增加工作量,并对情感分析和用户关注度的结果造成影响,需要删除;
(3)
特殊符号处理,包含表情符号

特殊符号或者乱码,需要删除
。4.
根据权利要求3所述的基于自然语言处理技术的卡车用户隐性需求挖掘方法,其特征在于:所述步骤四的具体流程为:步骤四一:数据清洗:在语料中找到感兴趣的内容,把不感兴趣的

视为噪音的内容清洗删除;步骤四二:分词:将全部文本数据处理成最小单位粒度
——
词或词语;步骤四三:词性标注:给每个词或词语打词类标签,如形容词

动词

名词等;步骤四四:去停用词,停用词一般指对文本特征没有任何贡献作用的字词,比如标点符号

语气

人称等一些词
。5.
根据权利要求4所述的基于自然语言处理技术的卡车用户隐性需求挖掘方法,其特征在于:所述步骤六的具体流程为:步骤六一:为防止进行文本分类时产生数据过拟合的现象,首先进行卡车产品设计要素分类工作,即根据

卡车...

【专利技术属性】
技术研发人员:郑枫尹红雨
申请(专利权)人:齐鲁工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1