一种会话意图智能识别模型的构建方法、装置及设备制造方法及图纸

技术编号:26846150 阅读:18 留言:0更新日期:2020-12-25 13:08
本发明专利技术适用大数据人工智能技术领域,提供会话意图智能识别模型的构建方法、装置及设备,包括:获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;根据已标注语料数据以及预设的语义分析算法,对未标注语料数据进行处理,生成有标签信息的意图语料数据;根据意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型。本发明专利技术利用大量无标注语料数据,基于预设的语义分析算法,实现训练语料半自动标注,仅需少量纠正即可完成大规模语料标注过程,降低语料标注成本;另外,将语料标注、模型优化问题作为一个统一任务进行迭代,实现意图识别模型生成过程中人工干预最小化、解决数据标注耗时、模型训练困难的问题。

【技术实现步骤摘要】
一种会话意图智能识别模型的构建方法、装置及设备
本专利技术属于大数据人工智能
,尤其涉及一种会话意图智能识别模型的构建方法、装置及设备。
技术介绍
随着社会信息化、智能化不断发展,基于自然语言理解的智能客服、智能助手、聊天机器人等智能会话应用开始广泛使用。意图识别模型在人机交互会话中,分析用户输入信息、确认用户交互意图,是此类应用的核心组件,意图识别模型的优劣对应用智能化程度和用户体验水平具有决定性影响。目前意图识别模型,主要为有监督方式训练,需要标注大量语料,而此类应用一般面向海量互联网用户,用户意图复杂繁多且容易随着时间而变化。现有意图识别模型构建过程主要包括语料标注和模型训练两个过程,其中,语料标注、意图修改需要花费大量人力和时间,如何快速、高效、低成本地构建意图识别模型一直是此类应用建设中的关键点。现有意图识别模型构建方法主要有:采用人工标注方式对领域文本数据集进行标注,之后进行模型训练;或者通过聚类方法进行意图发现及意图语料收集,但大规模的业务数据从不同角度理解能够得到不同的主题类别,聚类发现的主题往往并非业务所需要的,该方法远远无法满足实际业务需求;或者通过模型预测结果作为指导,利用大量用户选择数据生成训练样本,但该方法使用标准样本训练初始预测模型,而标准样本依赖人工标注获取,该方法没有解决标准样本的标注问题,在无法获取用户反馈时无法利用。由此可见,现有的意图识别模型构建方法存在需要大量人工干预、数据标注耗时多以及模型训练困难的问题。
技术实现思路
本专利技术实施例的目的在于提供一种会话意图智能识别模型的构建方法,旨在解决现有的意图识别模型构建方法存在需要人工大量干预、数据标注耗时多以及模型训练困难的问题。本专利技术实施例是这样实现的,一种会话意图智能识别模型的构建方法,包括:获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据;根据所述意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型;所述初始意图识别模型是通过所述已标注语料数据经神经网络训练生成;判断所述迭代训练是否满足预设的迭代结束条件;若否,则返回所述获取语料数据的步骤;若是,则迭代训练结束。本专利技术实施例的另一目的在于一种会话意图智能识别模型的构建装置,包括:语料数据获取单元,用于获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;意图语料数据生成单元,用于根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据;迭代训练单元,用于根据所述意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型;所述初始意图识别模型是通过所述已标注语料数据经神经网络训练生成;以及判断单元,用于判断所述迭代训练是否满足预设的迭代结束条件;若否,则返回所述获取语料数据的步骤;若是,则迭代训练结束。本专利技术实施例的另一目的在于一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行所述会话意图智能识别模型的构建方法的步骤。本专利技术实施例的另一目的在于一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行所述会话意图智能识别模型的构建方法的步骤。本专利技术实施例提供的会话意图智能识别模型的构建方法,利用大量无标注语料数据,基于预设的语义分析算法,实现训练语料半自动标注,仅需少量纠正即可完成大规模语料标注过程,降低语料标注成本;另外,将语料标注、模型优化问题作为一个统一任务进行迭代,实现意图识别模型生成过程中人工干预最小化、解决数据标注耗时、模型训练困难的问题。附图说明图1为本专利技术实施例提供的一种会话意图智能识别模型的构建方法的实现流程图;图2为本专利技术实施例提供的另一种会话意图智能识别模型的构建方法的实现流程图;图3为本专利技术实施例提供的又一种会话意图智能识别模型的构建方法的实现流程图;图4为本专利技术实施例提供的再一种会话意图智能识别模型的构建方法的实现流程图;图5为本专利技术实施例提供的还一种会话意图智能识别模型的构建方法的实现流程图;图6为本专利技术实施例提供的一种优化的会话意图智能识别模型的构建方法的实现流程图;图7为本专利技术实施例提供的另一种优化的会话意图智能识别模型的构建方法的实现流程图;图8为本专利技术实施例提供的一种会话意图智能识别模型的构建装置的结构框图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。在本专利技术实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本专利技术。在本专利技术实施例和所附权利要求书中所使用的单数形式的“一种”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。应当理解,尽管在本专利技术实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。如图1所示,在一个实施例中,提出了一种会话意图智能识别模型的构建方法,具体可以包括以下步骤:步骤S101,获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据。在本专利技术实施例中,语料数据为基于现有大数据分析获得,包括对应业务领域的语料数据以及其他领域或通用领域文本语料数据,其中,已标注语料数据可以是现有技术中存在的经人为标注过的语料数据或者为机器学习标注的标准语料数据;未标注语料数据包括现有业务系统积累的无标注文本语料数据、大量无标注其他领域或通用领域文本语料数据。步骤S102,根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据。在本专利技术实施例中,已标注语料数据均为携带有对应标签信息,所述标签信息包括意图类别以及语料核心词;意图类别根据具体业务确定,语料核心词是指能够表征语料样本关键主题信息的词汇等;所述预设的语义分析算法可以是一种或多种文本分析算法的组合,能够自动分析大规模语料数据,为自动标注以及推荐语料数据提供支撑,包括但不限于关键词完全匹配、文档词汇权重向量相似度计算、文档语义模型向量相似度计算等,具体地,包括语料核心词提取算法、语义压缩算法、语义匹配算法以及主题自动分析算法。其中,所述语料核心词提取算法包括TF-IDF算法、TextRank算法、LDA算法、基于机器学习分类模型等。所述语义压缩算法是指输入词汇或短语,输出语义向量的语义模型;语义模型的构建可以基于无标注语料训本文档来自技高网...

【技术保护点】
1.一种会话意图智能识别模型的构建方法,其特征在于,包括:/n获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;/n根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据;/n根据所述意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型;所述初始意图识别模型是通过所述已标注语料数据经神经网络训练生成;/n判断所述迭代训练是否满足预设的迭代结束条件;若否,则返回至所述获取语料数据的步骤;若是,则迭代训练结束。/n

【技术特征摘要】
1.一种会话意图智能识别模型的构建方法,其特征在于,包括:
获取语料数据,所述语料数据包括已标注语料数据以及未标注语料数据;
根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据;
根据所述意图语料数据,对预设的初始意图识别模型进行迭代训练,构建目标意图识别模型;所述初始意图识别模型是通过所述已标注语料数据经神经网络训练生成;
判断所述迭代训练是否满足预设的迭代结束条件;若否,则返回至所述获取语料数据的步骤;若是,则迭代训练结束。


2.根据权利要求1所述的会话意图智能识别模型的构建方法,其特征在于,所述预设的语义分析算法包括核心词提取算法以及语义匹配算法;
所述根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据的步骤,包括:
根据所述语料数据以及预设的核心词提取算法,分别提取所述已标注语料数据以及未标注语料数据的语料核心词;
根据所述预设的语义匹配算法,计算所述已标注语料数据以及未标注语料数据的语料核心词的相似度;
根据相似度小于预设距离阈值的已标注语料数据以及未标注语料数据,生成有标签信息的意图语料数据。


3.根据权利要求2所述的会话意图智能识别模型的构建方法,其特征在于,所述预设的语义分析算法还包括语义压缩算法;
所述根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据的步骤,还包括:
响应于第一已标注语料数据和/或第一意图语料数据的标签信息的删除操作,根据所述语义压缩算法,计算所述第一已标注语料数据和/或第一意图语料数据的向量表示;
获取与所述第一已标注语料数据和/或第一意图语料数据的向量表示的相似度符合预设相似阈值的第二已标注语料数据和/或第二意图语料数据,并对所述第二已标注语料数据和/或第二意图语料数据的标签信息进行删除。


4.根据权利要求1所述的会话意图智能识别模型的构建方法,其特征在于,所述根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据的步骤,包括:
获取所述已标注语料数据的意图中心表示;
获取所述未标注语料数据的矩阵表示;
根据所述预设的语义分析算法,计算所述未标注语料数据的矩阵表示与所述意图中心表示的距离值,并将符合预设距离阈值的未标注语料数据按照所述意图中心表示进行处理,生成有标签信息的意图语料数据。


5.根据权利要求1所述的会话意图智能识别模型的构建方法,其特征在于,所述根据所述已标注语料数据以及预设的语义分析算法,对所述未标注语料数据进行处理,生成有标签信息的意图语料数据的步骤,包括:
根据所述语义分析算法,计算所述未标注语料数据的向量表示以及所述已标注语料数据的意图中心表示;

【专利技术属性】
技术研发人员:周鹏飞马亮
申请(专利权)人:北京慧辰资道资讯股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1