【技术实现步骤摘要】
属性观点抽取方法、装置、电子设备和存储介质
[0001]本专利技术涉及观点抽取
,尤其涉及一种属性观点抽取方法、装置、电子设备和存储介质。
技术介绍
[0002]属性观点抽取的主要任务是从用户评价中抽取细粒度四元组<属性词,属性类别,观点词,观点情感>。例如,给定评价“层层修护吸收快,但快递较慢”,可以抽取两个四元组:<修护吸收,功效,快,正面>和<快递,物流,较慢,负面>。
[0003]然而,在用户评价中,经常没有出现属性词或者观点词,但存在属性类别或者观点情感。例如,评价“太贵了”,虽然没有属性词“价格”,但是很容易推断用户评价的属性类别为“费用”,因此可以得到四元组<None,费用,太贵了,负面>。评价“开机速度只要1秒”,虽然没有任何观点词,但是可以推断用户的观点情感为“正面”,因此可以得到四元组<开机速度,性能,None,正面>。评价“这东西像画一样”,既没有属性 ...
【技术保护点】
【技术特征摘要】
1.一种属性观点抽取方法,其特征在于,所述方法包括:在给定的评价文本内容中,补入隐性属性词和隐性观点词;对补入后的评价文本内容,提取显性属性词、隐性属性词、显性观点词和隐性观点词;预测所述显性属性词、所述隐性属性词、所述显性观点词和所述隐性观点词的类别;基于所述显性属性词、所述隐性属性词、所述显性观点词和所述隐性观点词的类别,进行配对分析,输出细粒度四元组。2.根据权利要求1所述的方法,其特征在于,所述在给定的评价文本内容中,补入隐性属性词和隐性观点词包括:为隐性属性词构建对应的隐性属性词专用字符串,为隐性观点词构建对应的隐性观点词专用字符串;基于给定的评价文本内容,获取对应的文本字符串;在所述文本字符串末尾,添加所述隐性属性词专用字符串和所述隐性观点词专用字符串。3.根据权利要求1所述的方法,其特征在于,所述对补入后的评价文本内容,提取显性属性词、隐性属性词、显性观点词和隐性观点词,包括:对补入后的评价文本内容进行切词处理,获得切词列表;对所述切词列表中的各个词语,利用学习模型,获取各个词语对应的词嵌入向量;基于所述各个词语对应的词嵌入向量,利用序列标注模型,提取显性属性词、隐性属性词、显性观点词和隐性观点词。4.根据权利要求1所述的方法,其特征在于,预测所述显性属性词、所述隐性属性词的类别,包括:对于所述显性属性词、所述隐性属性词,获取各个词语对应的词嵌入向量;将所述词嵌入向量输入预设分类模型的全连接层,获得对应的输出值;获取属性类别嵌入矩阵,根据所述属性类别嵌入矩阵和所述词嵌入向量计算点积;利用所述输出值和所述点积,确定所述显性属性词和所述隐性属性词所对应的类别。5.根据权利要求1所述的方法,其特征在于,预测所述显性观点词、所述隐性观点词的类别,包括:对于所述显性观点词、所述隐性观点词,获取各个词语对应的词...
【专利技术属性】
技术研发人员:许先才,张家栋,肖荣昌,熊磊,
申请(专利权)人:深圳市云积分科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。