情绪认知的自动分类制造技术

技术编号:39283959 阅读:8 留言:0更新日期:2023-11-07 10:56
一种用于利用基于规则的引擎检测自然语言内容中的心理情感的系统和方法,包括接收作为文本输入的自然语言内容;搜索给定情绪认知的语言规则与所述自然语言内容的组成部分之间的匹配,其中所述语言规则的实例具有人类维度;激活匹配的语言规则,并评估所匹配的规则的人类维度;对每个人类维度进行评分,以获得给定情绪认知的维度分数的简档;聚合所获得的维度分数的简档中的维度,以获得给定情绪认知的强度指示;以及以使匹配的语言规则与给定情绪认知和给定情绪认知的相应强度指示相关联的方式显示自然语言内容。的方式显示自然语言内容。的方式显示自然语言内容。

【技术实现步骤摘要】
【国外来华专利技术】情绪认知的自动分类
[0001]相关申请的交叉引用
[0002]本申请要求2022年1月31日提交的非临时申请No.17/589,512的优先权,要求2021年3月19日提交的临时申请No.63/163,618的优先权,要求2021年3月19日提交的临时申请No.63/163,621的优先权,要求2021年3月18日提交的临时申请No.63/162,987的优先权,并要求2021年1月29日提交的临时申请No.63/143,730的优先权,这些申请的全部内容通过引用并入本文中。


[0003]本公开一般涉及监测情感,特别是对自然语言内容中的情绪认知的强度进行分类和跟踪。

技术介绍

[0004]情感计算(affective computing)是对能够识别、解释、处理和模拟人类情感的系统和设备的研究和开发。情感计算是一个集语言学、统计学、人因学和计算机科学于一体的多学科领域。情感计算的一个方面是使机器人和其他计算机应用能够智能地响应人类的自然情绪反馈。在文本的情况下,情感计算包括从文本中检测情绪。更常见的是,一种被称为情感分析(sentiment analysis)的情绪检测形式被用于将文本分为积极、消极或中性。几乎所有开发计算机软件和硬件的大公司,以及大学研究和几家初创公司都有包括某种形式的情感分析用工具的开发项目。情感分析的流行源于需要更好地理解对新闻媒体的反应以及社交媒体上广泛存在的各种客户评论、客户产品评论和与聊天机器人的交互中的情感。
[0005]在实践中,情感分析是利用自然语言处理、文本分析、计算语言学和生物识别技术来系统地识别、提取、量化和研究情感情绪认知状态和主观信息。部分归因于从诸如各种社交媒体平台、录音的对话和其他文本表达渠道之类的来源获得的人类对话的大量数据集的可用性,情感分析已经得到加速。然而,情感分析必须应对自然语言不断变化的性质。例如,情感分析必须应对单词之间,甚至整个短语之间含义的细微差别或变化。一些短语可能看似表示相同的想法,但可能表示情感上的差异。情绪分析必须应对根据上下文可能具有不同含义的单词或短语。
[0006]尽管用于自然语言处理的技术最近取得了重大进展,但是情感分析仍然受制于训练集,训练集通常是手动分类的,从而是主观的。特别地,文本的大型训练数据集的注释是手动进行的。源于手动分类方法的训练集往往速度慢、性能差且昂贵。另外,在财务上具有竞争力的获得评级者(rater)的方法,主要是Mechanical Turk,会受到以物质激励从而急于完成分类任务的非母语人士的影响,结果产生低质量、相互冲突的结果,而防止这些影响的尝试仅限于繁琐的ID扫描和不可靠的IP地址过滤。微妙的情绪检测很困难并且容易出错。
[0007]此外,用于机器学习的训练集无法提供语言方面的创造力。人类具有通过言语和书写产生以前从未写过或说过的新颖句子的明显无限的能力。事实上,语言的一个必要属
性正是对这种创造力的允许,而当前的现有系统无法有效地适应这种创造力。
[0008]用于自然语言处理的现有技术机器学习模型(BERT(来自变换器的双向编码器表示)、GPT2(生成式预训练变换器2)、GPT3),这些看似可以在存储器中保存大量内容并有效地进行双向查看的鲁棒工具无法与不断变化的自然语言相媲美。统计模型依赖于强大的统计成分,通常是概率成分。有监督的机器学习模型预测他们以前见过的事情或他们见到的关系再次出现。未来有无数的短语和句子无法用以前的句子来概括,包括混合词、俚语、行话、隐喻或新创单词等元素。
[0009]另外,情感分析还存在语义缺陷;这部分归因于缺乏测量情绪的强度的有效方法,以及使用挑选的和不具代表性的数据集进行训练。另外,过度依赖以词汇为中心或基于词元的解决方案阻碍了此类解决方案最终获得持久力,因为语言学家和工程师要应对语言的动态性质,包括语义转变、过时和随时间推移的各种其他语言变化。
[0010]因此,情感分析存在几个主要问题;即,缺乏具有用于训练的客观评级或标记数据的黄金标准数据集,基于n元语法(n

gram)的解决方案的局限性,缺乏确定真实强度的能力,难以解析话题标签,以及缺乏对结果的严格验证。另外,虽然主观上应用了类似量表的情感评级,但在行业或学术界并不存在验证分类结果的可靠手段。
[0011]虽然社会语言学文献中偶尔会出现量化语用因素的尝试(主要经由头脑风暴式枚举,偶尔使用具有高词元:类型比率的n元语法选择),但是社会语言学的研究主要集中在fMRI研究、社会或现实世界的实验、直观分析以及对直观、务实例子的仔细检查和比较。具体但有限的句法驱动理论存在于该领域中,主要存在于个别构式中,比如Andrews构式(带有构式“X knows”的形容词和状语短语,比如“God[only]knows”、“Who knows”),或者更全面地,侧重于宾语关系的特定语法构式(称为论元结构),本质上处理动词的论元(宾语)的语义丰富、复杂但以动词为中心的构式语法的开创性分析。
[0012]可取地,要成为一种构式,一段语言必须是可置换的和模块化的。从本质上讲,这不仅关注语法规则,而且关注常见用法。社会语言学关注于语用学,即现实世界中用法的科学,以放大的视角分析特定单词用法。然而,构式的分析一直集中在论元结构,以及以动词为中心的形义配对的分析。需要更有效、更稳健和更准确地检测认知、情绪和情绪认知,这结合了认知科学、社会语言学和语义学。
[0013]上述“
技术介绍
”描述是为了概括介绍本公开的上下文。专利技术人的工作,就在本
技术介绍
部分中所描述的而言,以及描述中的在提交时可能不属于现有技术的各个方面,既不明确也不隐含地被承认为本专利技术的现有技术。

技术实现思路

[0014]按照本公开的实施例,一个方面是一种用于通过处理电路利用情绪认知自动增强自然语言内容的方法,所述方法可以包括经由输入设备接收作为文本输入的自然语言内容;通过所述处理电路搜索用于给定情绪认知的多个语言规则与所述文本输入的组成部分之间的匹配,其中所述语言规则的实例具有至少一个人类维度;通过所述处理电路激活匹配的语言规则,并评估所激活的匹配的语言规则的至少一个人类维度;通过所述处理电路对每个人类维度进行评分,以获得给定情绪认知的维度分数的原型简档;通过所述处理电路聚合所获得的维度分数的简档中的维度,以获得给定情绪认知的强度指示;以及通过显
示器以使匹配的语言规则与给定情绪认知相关联并用信号通知给定情绪认知的相应强度指示的方式显示增强的自然语言内容。
[0015]此外,按照本公开的实施例,另一方面是一种电子阅读器,所述电子阅读器可以包括触摸屏显示器;处理电路;和存储器,其中所述触摸屏显示器被配置为显示电子书的文本;所述处理电路被配置为扫描文本并使用规则标注所述文本,所述规则在被触发时检测情绪认知状态,并确定情绪认知状态发生的强度;所述处理电路被配置为生成并显示一个或多个侧边栏,用于基于检测到的所显示文本的组成部分列出动力学和情绪认知强度信息;当在显示器中的某个位置被触摸本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于通过处理电路利用情绪认知自动增强自然语言内容的方法,所述方法包括:经由输入设备接收作为文本输入的自然语言内容;通过所述处理电路搜索用于给定情绪认知的多个语言规则与所述文本输入的组成部分之间的匹配,其中所述语言规则的实例具有至少一个人类维度;通过所述处理电路激活匹配的语言规则,并评估所激活的匹配的语言规则的至少一个人类维度;通过所述处理电路对每个人类维度进行评分,以获得给定情绪认知的维度分数的原型简档;通过所述处理电路聚合所获得的维度分数的简档中的维度,以获得给定情绪认知的强度指示;以及通过显示器以使匹配的语言规则与给定情绪认知相关联并用信号通知给定情绪认知的相应强度指示的方式显示增强的自然语言内容。2.按照权利要求1所述的方法,其中人类维度包括以下情绪情感中的一个或多个:情感、情绪、情绪认知态度、价值观、社会习俗、心态、看法、方面、响应、特质、信仰、观点、视角、动机、偏见、状态、方式、方法、动力学、人格特质、情绪方法、情绪选择、反应、倾向、临时状态、状态变化、认知方面、行为方面、内部条件、外部条件、感觉、情绪、命题、态度、命题态度、定向态度、非定向态度、自我定向态度、有意识情绪认知、无意识情绪认识、愤怒、预期、厌恶、恐惧、喜悦、悲伤、惊讶、信任、自我、责备、顺从、神圣、善良、尊敬、时间、青睐、认可、真诚、脆弱、判断、分离、目的、形式、最小化、特异性、力量、行动、代理、好奇心、清晰度、意图、强调、能量、确定性、兴趣、参与、震惊或惊讶、紧张、速度、细微差别、逻辑、偏执、距离、认同、尊重、物化、依恋、同理心和耐心,其中每个维度具有为表示积极力量的+1、表示消极力量的

1、表示中性力量的0和表示不存在或不适用的中的一个的值,并且其中通过所述处理电路对每个人类维度评分包括针对所有匹配规则对人类维度进行评分。3.按照权利要求1所述的方法,其中使用多个语言规则进行搜索的步骤还包括:基于语言规则检测构式;以及评估每个检测到的构式的人类维度。4.按照权利要求1所述的方法,其中评分步骤包括:将强度指示与给定情绪认知的阈值进行比较,以获得情绪强度水平。5.按照权利要求3所述的方法,其中检测构式的步骤还包括:检测自然语言内容中具有与给定情绪认知相关的组成部分的构式的存在或不存在。6.按照权利要求1所述的方法,还包括通过所述处理电路,通过与由其他语言规则检测的其他情绪认知级联来确定包括给定情绪认知的情绪认知模式,并将所述情绪认知模式识别为动态情绪认知;以及在自然语言内容上按时间序列跟踪给定情绪认知和其他情绪认知以及关联组成部分。7.按照权利要求3所述的方法,其中检测构式的步骤还包括确定以下中的一个或多个的数值
词性标注或句法规则,精确的、不精确的、带掩码的或带通配符的字符串匹配规则,词元邻近规则,标点符号规则,词形还原规则,词干提取规则,词汇规则,以及基于单词查找或词典的规则。8.按照权利要求7所述的方法,其中确定词元邻近规则的数值的步骤包括访问与自然语言内容中的指定点的距离小于n个词元的所有词元,其中n是正整数。9.按照权利要求1所述的方法,还包括通过进行有监督学习和无监督学习中的至少一个的机器学习引擎生成新的语言规则。10.按照权利要求9所述的方法,还包括:从储存库接收多个自然语言数据项;使用预处理对所接收的多个自然语言数据项进行规范化和词语切分,以生成多个预处理后的自然语言数据项;用所表达的情绪认知和所表达的情绪认知的强度来标记多个预处理后的自然语言数据项;将多个预处理后的自然语言数据项并行地提供给无监督学习引擎和有监督学习引擎;在多个训练回合中并行地训练无监督学习引擎和有监督学习引擎,以在自然语言数据中识别特定情绪认知,并确定所述特定情绪认知的强度,其中无监督学习引擎的每个训练回合向基于规则的引擎的后续训练回合提供规则建议,并且每个训练回合,基于规则的引擎向无监管学习引擎和有监督学习引擎的后续回合提供制表和评分数据;以及提供表示经过训练的无监督学习引擎和经过训练的有监督学习引擎中的至少一个的输出。11.按照权利要求1所述的方法,还包括通过所述处理电路生成新的语言规则,所述处理电路通过将人类维度与现有维度数组相匹配,具有通配符或模式跳过,来进行对存在于自然语言内容内的人类维度的匹配,以便为基于规则的引擎识别新规则。12.按照权利要求1所述的方法,其中所述接收步骤还包括连续读取流式直播视频或动画视频源以及协调的文本转录,并且所述方法还包括基于单词同现、话语元素和主题元素来确定上下文线索;用三元维度分数标记单个字符串或n元语法;检测视觉数据中明显的进一步信息或听觉数据中明显的音调元素,并将其输入到视频的单独的但时间协调的源中;以及根据上下文线索和进一步的信息进行并置,以创建视频中的每个场景的上下文分数。13.按照权利要求12所述的方法,其中所述显示步骤包括以将给定情绪认知和相应的强度指示括起来并且邻近所述组成部分内联插入的方式来显示文本转录。14.按照权利要求1所述的方法,还包括由规则发现引擎生成新的语言规则...

【专利技术属性】
技术研发人员:J
申请(专利权)人:精化股份有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1