The invention relates to a personal emotion knowledge map establishing method and apparatus, computer apparatus and computer-readable storage medium, this method firstly from the individual text dialogue and / or individuals do the survey questionnaire in emotional object vocabulary and emotion words, then the default benchmark emotional vocabulary based on Extraction of emotional vocabulary classify, determine the emotion tendency, structure of three yuan finally build personal and emotional words and emotional tendencies of the object, and the three tuple structure as the individual personality emotion knowledge map. Thus, we can build a more complete and accurate emotional knowledge map based on the large number of corpus, and provide more valuable reference for application scenarios of various emotional knowledge maps.
【技术实现步骤摘要】
个性情感知识图谱建立方法及装置
本专利技术涉及软件
,具体涉及一种个性情感知识图谱建立方法及装置。
技术介绍
知识图谱是实体和实体之间关系的一个图知识库,它的本质是一种解释实体知识之间的语义网络图。知识图谱的建立主要分为:文本分析,构造分析,链接集成。目前越来越多的研究人员开展了对于知识图谱的研究,尤其是对于个人的个性情感知识图谱的研究,从而可以根据个人的个性情感知识图谱了解该人物的不同喜好,并根据不同的喜好进行有针对性的措施,例如可以在互联网上平台进行有针对性的消息推送等等。然而,在实施本专利技术实施例的过程中专利技术人发现,现有的一些知识图谱的建立方法仅能够根据单独的句子来进行构建,缺少上下文环境特征,对于大段的文本分析并不出色,构建出来的知识图谱模型无法准确全面地反映个人的情感。
技术实现思路
本专利技术实施例的目的在于提供一种个性情感知识图谱建立方法及装置。第一方面,本专利技术实施例提供了一种个性情感知识图谱建立方法,获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。可选地,所述在所述用户数据中抽取情感对象词汇以及情感词汇, ...
【技术保护点】
一种个性情感知识图谱建立方法,其特征在于,包括:获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。
【技术特征摘要】
1.一种个性情感知识图谱建立方法,其特征在于,包括:获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。2.根据权利要求1所述的方法,其特征在于,所述在所述用户数据中抽取情感对象词汇以及情感词汇,包括:基于预设的层叠CRFs模型在所述用户数据中抽取情感对象词汇以及情感词汇,具体包括:使用层叠CRFs模型对用户数据中的各个词汇进行词性的标注,包括:对给出的中文句子X=(x1,x2,x3…xn),通过维特比算法找到其词性标注结果序列Y=(y1,y2,y3….yn),并使得条件概率P=(y|x)最大,条件概率P=(y|x)如下式所示:其中:其中,tk和sl是特征函数,λk和μl是对应的权值,Z(x)是规范化因子;根据预设的分词的词性规则将文本语料中的情感词和情感对象按照每句话进行统计集合。3.根据权利要求1所述的方法,其特征在于,所述基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,包括:对从语料中收录的基准情感词汇进行向量化,并利用K-means进行聚类,得到每个词类在预设的坐标轴上的中心坐标;确定抽取的情感词汇在预设的坐标轴上的坐标;计算抽取的情感词汇的坐标与各个中心坐标之间的欧氏距离;若所述抽取的情感词汇的坐标与第一中心坐标距离最近,则所述抽取的情感词汇与第一中心坐标所对应的基准情感词汇属于同类词。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对抽取的多个情感对象词汇以及多个情感词汇进行同义词归类处理。5.一种个性情感知识图谱建立装置,其特征在于,包括:获取单元,用于获取待建立知识图谱的个人的用户数据,所述用户数据包括与...
【专利技术属性】
技术研发人员:孙晓,裴正蒙,丁帅,杨善林,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。