【技术实现步骤摘要】
基于语义特征的评价对象识别方法
本专利技术涉及一种基于语义特征(Semanticfeatures)的评价对象识别方法,属于文本挖掘领域。
技术介绍
近年来,随着互联网的普及以及电子商务的快速发展,越来越多的消费者喜欢在网上购买自己喜欢的商品,为了表达自己对于商品的态度,消费者会在电商平台上发表评论,这也导致网络评论急剧增加,形成了具有商业价值的大数据集。利用自然语言处理技术挖掘这些网络评论数据集中包含的情感,进行情感分析,对于商家与消费者都有一定的指导意义。伴随着情感分析的研究不断深入,细粒度的情感分析也被越来越多的学者所关注。细粒度情感分析就是以评价单元为基础的情感倾向性分析,所谓评价单元就是由评价对象与具有情感色彩的词语或短语构成的特征观点对。因此评价对象的识别是细粒度情感分析的基础。评价对象一般为一个句子所讨论的主题,在评论文本中主要表现为评价词的修饰对象。评价对象识别最早是由LiuBing提出,将有着较高频率的名词或者名词性短语视为评价对象。评价对象识别的研究,在初期一般是基于规则/模板的方法,制定的规则包括词序列规则、词性规则、句法规则等形式。Kim等借 ...
【技术保护点】
1.基于语义特征的评价对象识别方法,其特征在于:先对评论语料进行预处理;自定义特征模板,根据模板在评论语料中提取相应的特征;利用条件随机场模型进行评价对象识别。
【技术特征摘要】
1.基于语义特征的评价对象识别方法,其特征在于:先对评论语料进行预处理;自定义特征模板,根据模板在评论语料中提取相应的特征;利用条件随机场模型进行评价对象识别。2.根据权利要求1所述基于语义特征的评价对象识别方法,其特征在于:所述评价对象识别方法包括下述步骤:(1)文本语料预获取以及评论语料预处理;即通过网络爬虫在电商网站的在线评论中获得文本语料,对评论语料进行分词、词性标注、情感词标注以及语义角色分析,并从评论语料中获取词特征、词性特征、情感词特征、语义角色特征;(2)训练模型;即从评论语料中抽取五分之四的评论语料作为训练集,从训练集中提取的特征来训练自定义的特征模板,根据训练结果,得到每个特征的权重;(3)评价对象识别;即将剩余...
【专利技术属性】
技术研发人员:谢珺,谷兴龙,梁凤梅,杨云云,侯文丽,续欣莹,
申请(专利权)人:太原理工大学,
类型:发明
国别省市:山西,14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。