多面向语言行为识别方法及系统技术方案

技术编号:15392133 阅读:47 留言:0更新日期:2017-05-19 05:08
本发明专利技术属于人工智能对话技术领域,提供了一种多面向语言行为识别方法及系统,该方法包括获取用户输入的当前信息、用户画像信息和外部信息,对当前信息进行信息提取,获取特征信息,根据特征信息、用户画像信息和外部信息,进行语言行为识别,获取用户的语言行为。本发明专利技术多面向语言行为识别方法及系统,能够精准、有效地识别用户的语言行为,降低用户语言行为误判率。

Multi faceted speech act recognition method and system

The invention belongs to the technical field of artificial intelligence dialogue provides a multifaceted language and system behavior recognition method, the method includes obtaining user input information, the current user picture information and external information on the current information for information extraction, extracting feature information, according to the characteristics of information, user profiling information and external information language behavior recognition, access to the user's language behavior. The invention discloses a method and a system for identifying language behavior in a multi-faceted manner, which can accurately and effectively recognize the language behavior of users, and reduce the false positive rate of user language behavior.

【技术实现步骤摘要】
多面向语言行为识别方法及系统
本专利技术涉及人工智能对话
,具体涉及一种多面向语言行为识别方法及系统。
技术介绍
现有的人工智能对话系统,通常采用断词分句的方式,将语句拆分成词组,进行分析,取得额外的信息,如话题、情绪与关键词等。但是,语句拆分之后就会失去语意上的语言行为,致使人工智能对话系统无法提供恰当的回复。并且,用户语言行为识别多是基于用户输入的文字信息、声音信息来预测用户的语言行为。由于缺乏用户所在的环境信息,以及用户画像信息,如用户过去的历史信息,导致预测的结果的失真。如何精准、有效地识别用户的语言行为,降低用户语言行为误判率,是本领域技术人员亟需解决的问题。
技术实现思路
针对现有技术中的缺陷,本专利技术提供一种多面向语言行为识别方法及系统,能够精准、有效地识别用户的语言行为,降低用户语言行为误判率。第一方面,本专利技术提供一种多面向语言行为识别方法,该方法包括:获取用户输入的当前信息、用户画像信息和外部信息;对当前信息进行信息提取,获取特征信息;根据特征信息、用户画像信息和外部信息,进行语言行为识别,获取用户的语言行为。进一步地,对当前信息进行信息提取,获取特征信息,具体包括:对文本信息进行语意信息提取,获取文本特征信息;对声音信息进行声音特征提取,获取声音特征信息;对影像信息进行影像特征提取,获取影像特征信息,当前信息包括文本信息、声音信息和影像信息,特征信息包括文本特征信息、声音特征信息和影像特征信息;根据特征信息、用户画像信息和外部信息,进行语言行为识别,获取用户的语言行为,具体包括:根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息,进行语言行为识别,并记录语言行为识别次数,若语言行为识别成功,则生成该用户的语言行为,若语言行为识别失败,则再次进行语言行为识别,直至语言行为识别成功,或语言行为识别次数达到预设值。进一步地,在获取文本特征信息之后,进行语言行为识别之前,该方法还包括:根据文本信息和文本特征信息,修正文本信息。基于上述任意多面向语言行为识别方法实施例,进一步地,在进行语言行为识别之前,该方法还包括:获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息;根据样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息,进行语言行为识别,获取样本识别语言行为;根据预获取的样本真实语言行为和样本识别语言行为的相似度,设置预设值。第二方面,本专利技术提供一种多面向语言行为识别系统,该系统包括信息获取子系统、信息提取子系统和语言行为识别子系统,信息获取子系统用于获取用户输入的当前信息、用户画像信息和外部信息;信息提取子系统用于对当前信息进行信息提取,获取特征信息;语言行为识别子系统用于根据特征信息、用户画像信息和外部信息,进行语言行为识别,获取用户的语言行为。进一步地,信息提取子系统具体用于:对文本信息进行语意信息提取,获取文本特征信息;对声音信息进行声音特征提取,获取声音特征信息;对影像信息进行影像特征提取,获取影像特征信息,当前信息包括文本信息、声音信息和影像信息,特征信息包括文本特征信息、声音特征信息和影像特征信息;语言行为识别子系统具体用于:根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息,进行语言行为识别,并记录语言行为识别次数,若语言行为识别成功,则生成该用户的语言行为,若语言行为识别失败,则再次进行语言行为识别,直至语言行为识别成功,或语言行为识别次数达到预设值。进一步地,本实施例多面向语言行为识别系统还包括文本信息修正子系统,用于根据文本信息和文本特征信息,修正文本信息。基于上述任意多面向语言行为识别系统实施例,进一步地,该系统还包括预设值确定子系统,用于获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息;根据样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息,进行语言行为识别,获取样本识别语言行为;根据预获取的样本真实语言行为和样本识别语言行为的相似度,设置预设值。由上述技术方案可知,本实施例多面向语言行为识别方法及系统,能够根据用户输入多面向语言行为的当前信息,进行特征信息提取,避免进行语句拆分,以有利于根据当前信息进行对话回复。同时,该方法结合用户画像信息和外部信息,进行语言行为识别,能够减少语言行为识别错误情况,降低语言行为误判率。因此,本实施例多面向语言行为识别方法及系统,能够精准、有效地识别用户的语言行为,降低用户语言行为误判率,有助于提高沟通效率。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。图1示出了本专利技术实施例所提供的一种多面向语言行为识别方法流程图;图2示出了本专利技术实施例所提供的一种多面向语言行为识别系统的结构示意图;图3示出了本专利技术实施例所提供的另一种多面向语言行为识别系统的结构示意图。具体实施方式下面将结合附图对本专利技术技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本专利技术的技术方案,因此只是作为示例,而不能以此来限制本专利技术的保护范围。需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本专利技术所属领域技术人员所理解的通常意义。第一方面,本专利技术实施例提供一种多面向语言行为识别方法,结合图1,该方法包括:步骤S1,获取用户输入的当前信息、用户画像信息和外部信息,当前信息是多面向语言行为的信息,在此,当前信息可以为文本信息、声音信息和影像信息,用户画像信息为用户的习惯、偏好、操作记录等信息,外部信息为使用地点、使用时间和新闻等外部日常信息。步骤S2,对当前信息进行信息提取,获取特征信息。步骤S3,根据特征信息、用户画像信息和外部信息,进行语言行为识别,获取用户的语言行为。由上述技术方案可知,本实施例多面向语言行为识别方法,能够根据用户输入多面向语言行为的当前信息,进行特征信息提取,避免进行语句拆分,以有利于根据当前信息进行对话回复。同时,该方法结合用户画像信息和外部信息,进行语言行为识别,能够减少语言行为识别错误情况,降低语言行为误判率。因此,本实施例多面向语言行为识别方法,能够精准、有效地识别用户的语言行为,降低用户语言行为误判率,有助于提高沟通效率。具体地,本实施例多面向语言行为识别方法能够对当前信息进行处理,其实现过程如下:对文本信息进行语意信息提取,获取文本特征信息;在此,采用语意信息提取方法,提取语意,获取文本特征信息。对声音信息进行声音特征提取,获取声音特征信息;在此,采用声音特征抽取机制,获取声音特征信息。对影像信息进行影像特征提取,如采用影像特征抽取机制,获取影像特征信息,当前信息包括文本信息、声音信息和影像信息,特征信息包括文本特征信息、声音特征信息和影像特征信息;根据特征信息、用户画像信息和外部信息,进行语言行为识别,获取用户的语言行为时,实现过程如下:根据文本特征信息、声音特征信息、影像特征信息、用户画像信息和外部信息,进行语言行为识别,并记录语言行为识别次数,若语言行为识别本文档来自技高网...
多面向语言行为识别方法及系统

【技术保护点】
一种多面向语言行为识别方法,其特征在于,包括:获取用户输入的当前信息、用户画像信息和外部信息;对所述当前信息进行信息提取,获取特征信息;根据所述特征信息、所述用户画像信息和所述外部信息,进行语言行为识别,获取用户的语言行为。

【技术特征摘要】
1.一种多面向语言行为识别方法,其特征在于,包括:获取用户输入的当前信息、用户画像信息和外部信息;对所述当前信息进行信息提取,获取特征信息;根据所述特征信息、所述用户画像信息和所述外部信息,进行语言行为识别,获取用户的语言行为。2.根据权利要求1所述多面向语言行为识别方法,其特征在于,对所述当前信息进行信息提取,获取特征信息,具体包括:对文本信息进行语意信息提取,获取文本特征信息;对声音信息进行声音特征提取,获取声音特征信息;对影像信息进行影像特征提取,获取影像特征信息,所述当前信息包括所述文本信息、所述声音信息和所述影像信息,所述特征信息包括所述文本特征信息、所述声音特征信息和所述影像特征信息;根据所述特征信息、所述用户画像信息和所述外部信息,进行语言行为识别,获取用户的语言行为,具体包括:根据所述文本特征信息、所述声音特征信息、所述影像特征信息、所述用户画像信息和所述外部信息,进行语言行为识别,并记录语言行为识别次数,若语言行为识别成功,则生成该用户的语言行为,若语言行为识别失败,则再次进行语言行为识别,直至语言行为识别成功,或所述语言行为识别次数达到预设值。3.根据权利要求2所述多面向语言行为识别方法,其特征在于,在获取文本特征信息之后,进行语言行为识别之前,该方法还包括:根据所述文本信息和所述文本特征信息,修正所述文本信息。4.根据权利要求2所述多面向语言行为识别方法,其特征在于,在进行语言行为识别之前,该方法还包括:获取样本文本特征信息、样本声音特征信息、样本影像特征信息、用户画像信息和外部信息;根据所述样本文本特征信息、所述样本声音特征信息、所述样本影像特征信息、所述用户画像信息和所述外部信息,进行语言行为识别,获取样本识别语言行为;根据预获取的样本真实语言行为和所述样本识别语言行...

【专利技术属性】
技术研发人员:简仁贤许储羽
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1