个性情感知识图谱建立方法及装置制造方法及图纸

技术编号:17667648 阅读:85 留言:0更新日期:2018-04-11 05:58
本发明专利技术涉及一种个性情感知识图谱建立方法及装置、计算机设备以及计算机可读存储介质,该方法中首先从该个人的文本对话和/或个人所做的本文调查问卷中抽取情感对象词汇以及情感词汇,再基于预设的基准情感词汇,将抽取的情感词汇进行归类,确定其情感倾向,最后构建个人、情感对象词汇以及情感倾向的三元组结构,并将该三元组结构作为该个人的个性情感知识图谱。从而能够根据该个人大量的语料构建更为完整跟为准确的情感知识图谱,为各个情感知识图谱的应用场景提供更为有价值的参考。

The method and device for establishing the knowledge map of personality and emotion

The invention relates to a personal emotion knowledge map establishing method and apparatus, computer apparatus and computer-readable storage medium, this method firstly from the individual text dialogue and / or individuals do the survey questionnaire in emotional object vocabulary and emotion words, then the default benchmark emotional vocabulary based on Extraction of emotional vocabulary classify, determine the emotion tendency, structure of three yuan finally build personal and emotional words and emotional tendencies of the object, and the three tuple structure as the individual personality emotion knowledge map. Thus, we can build a more complete and accurate emotional knowledge map based on the large number of corpus, and provide more valuable reference for application scenarios of various emotional knowledge maps.

【技术实现步骤摘要】
个性情感知识图谱建立方法及装置
本专利技术涉及软件
,具体涉及一种个性情感知识图谱建立方法及装置。
技术介绍
知识图谱是实体和实体之间关系的一个图知识库,它的本质是一种解释实体知识之间的语义网络图。知识图谱的建立主要分为:文本分析,构造分析,链接集成。目前越来越多的研究人员开展了对于知识图谱的研究,尤其是对于个人的个性情感知识图谱的研究,从而可以根据个人的个性情感知识图谱了解该人物的不同喜好,并根据不同的喜好进行有针对性的措施,例如可以在互联网上平台进行有针对性的消息推送等等。然而,在实施本专利技术实施例的过程中专利技术人发现,现有的一些知识图谱的建立方法仅能够根据单独的句子来进行构建,缺少上下文环境特征,对于大段的文本分析并不出色,构建出来的知识图谱模型无法准确全面地反映个人的情感。
技术实现思路
本专利技术实施例的目的在于提供一种个性情感知识图谱建立方法及装置。第一方面,本专利技术实施例提供了一种个性情感知识图谱建立方法,获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。可选地,所述在所述用户数据中抽取情感对象词汇以及情感词汇,包括:基于预设的层叠CRFs模型在所述用户数据中抽取情感对象词汇以及情感词汇,具体包括:使用层叠CRFs模型对用户数据中的各个词汇进行词性的标注,包括:对给出的中文句子X=(x1,x2,x3…xn),通过维特比算法找到其词性标注结果序列Y=(y1,y2,y3….yn),并使得条件概率P=(y|x)最大,条件概率P=(y|x)如下式所示:其中:其中,tk和sl是特征函数,λk和μl是对应的权值,Z(x)是规范化因子;根据预设的分词的词性规则将文本语料中的情感词和情感对象按照每句话进行统计集合。可选地,所述基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,包括:对从语料中收录的基准情感词汇进行向量化,并利用K-means进行聚类,得到每个词类在预设的坐标轴上的中心坐标;确定抽取的情感词汇在预设的坐标轴上的坐标;计算抽取的情感词汇的坐标与各个中心坐标之间的欧氏距离;若所述抽取的情感词汇的坐标与第一中心坐标距离最近,则所述抽取的情感词汇与第一中心坐标所对应的基准情感词汇属于同类词。可选地,所述方法还包括:对抽取的多个情感对象词汇以及多个情感词汇进行同义词归类处理。第二方面,本专利技术实施例又提供了一种个性情感知识图谱建立装置,包括:获取单元,用于获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;抽取单元,用于在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;归类单元,用于基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;图谱生成单元,用于构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。可选地,所述抽取单元,进一步用于:基于预设的层叠CRFs模型在所述用户数据中抽取情感对象词汇以及情感词汇,具体包括:使用层叠CRFs模型对用户数据中的各个词汇进行词性的标注,包括:对给出的中文句子X=(x1,x2,x3…xn),通过维特比算法找到其词性标注结果序列Y=(y1,y2,y3….yn),并使得条件概率P=(y|x)最大,条件概率P=(y|x)如下式所示:其中:其中,tk和sl是特征函数,λk和μl是对应的权值,Z(x)是规范化因子;根据预设的分词的词性规则将文本语料中的情感词和情感对象按照每句话进行统计集合。可选地,所述归类单元,进一步用于:对从语料中收录的基准情感词汇进行向量化,并利用K-means进行聚类,得到每个词类在预设的坐标轴上的中心坐标;确定抽取的情感词汇在预设的坐标轴上的坐标;计算抽取的情感词汇的坐标与各个中心坐标之间的欧氏距离;若所述抽取的情感词汇的坐标与第一中心坐标距离最近,则所述抽取的情感词汇与第一中心坐标所对应的基准情感词汇属于同类词。可选地,所述归类单元,还用于:对抽取的多个情感对象词汇以及多个情感词汇进行同义词归类处理。第三方面,本专利技术的又一实施例提供了一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如第一方面所述方法的步骤。第四方面,本专利技术的又一实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如第一方面所述方法的步骤。本专利技术实施例提供了一种个性情感知识图谱建立方法及装置、计算机设备以及计算机可读存储介质,该方法中首先从该个人的文本对话和/或个人所做的本文调查问卷中抽取情感对象词汇以及情感词汇,再基于预设的基准情感词汇,将抽取的情感词汇进行归类,确定其情感倾向,最后构建个人、情感对象词汇以及情感倾向的三元组结构,并将该三元组结构作为该个人的个性情感知识图谱。从而能够根据该个人大量的语料构建更为完整跟为准确的情感知识图谱,为各个情感知识图谱的应用场景提供更为有价值的参考。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术提供的一种个性情感知识图谱建立方法实施例流程图;图2是本专利技术提供的一种个性情感知识图谱建立装置实施例结构示意图;图3是本专利技术提供的一种计算机设备实施例结构框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。第一方面,本专利技术实施例提供了一种个性情感知识图谱建立方法,如图1所示,包括:S101、获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;S102、在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;S103、基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;S104、构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱本文档来自技高网...
个性情感知识图谱建立方法及装置

【技术保护点】
一种个性情感知识图谱建立方法,其特征在于,包括:获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。

【技术特征摘要】
1.一种个性情感知识图谱建立方法,其特征在于,包括:获取待建立知识图谱的个人的用户数据,所述用户数据包括与所述个人的文本对话和/或所述个人所做的本文调查问卷;在所述用户数据中抽取情感对象词汇以及情感词汇,所述情感对象词汇为所述情感词汇所限定的对象;基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,并将所属类别词汇的情感倾向作为所述抽取的情感词汇的情感倾向;构建所述个人、所述情感对象词汇以及所述抽取的情感词汇的情感倾向的三元组结构,将所述三元组结构作为所述个人的个性情感知识图谱。2.根据权利要求1所述的方法,其特征在于,所述在所述用户数据中抽取情感对象词汇以及情感词汇,包括:基于预设的层叠CRFs模型在所述用户数据中抽取情感对象词汇以及情感词汇,具体包括:使用层叠CRFs模型对用户数据中的各个词汇进行词性的标注,包括:对给出的中文句子X=(x1,x2,x3…xn),通过维特比算法找到其词性标注结果序列Y=(y1,y2,y3….yn),并使得条件概率P=(y|x)最大,条件概率P=(y|x)如下式所示:其中:其中,tk和sl是特征函数,λk和μl是对应的权值,Z(x)是规范化因子;根据预设的分词的词性规则将文本语料中的情感词和情感对象按照每句话进行统计集合。3.根据权利要求1所述的方法,其特征在于,所述基于预设的基准情感词汇,根据抽取的情感词汇与所述基准情感词汇的相似度,对所述抽取的情感词汇进行归类,包括:对从语料中收录的基准情感词汇进行向量化,并利用K-means进行聚类,得到每个词类在预设的坐标轴上的中心坐标;确定抽取的情感词汇在预设的坐标轴上的坐标;计算抽取的情感词汇的坐标与各个中心坐标之间的欧氏距离;若所述抽取的情感词汇的坐标与第一中心坐标距离最近,则所述抽取的情感词汇与第一中心坐标所对应的基准情感词汇属于同类词。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对抽取的多个情感对象词汇以及多个情感词汇进行同义词归类处理。5.一种个性情感知识图谱建立装置,其特征在于,包括:获取单元,用于获取待建立知识图谱的个人的用户数据,所述用户数据包括与...

【专利技术属性】
技术研发人员:孙晓裴正蒙丁帅杨善林
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1