对话标注模型的训练方法、对话标注方法及装置制造方法及图纸

技术编号：35530919 阅读：10 留言：0更新日期：2022-11-09 14:54

本发明专利技术提供了一种对话标注模型的训练方法、对话标注方法及装置，应用于人工智能领域，所述训练方法将训练样本输入对话标注模型中，得到所述对话标注模型的多个子模型的精度和标签概率，再获取所述训练样本中对话数据的特征向量，根据所述特征向量、所述精度和所述标签概率训练所述对话标注模型，其中，所述标签概率为所述子模型用于标注所述训练样本的标签的概率。本发明专利技术训练得到的对话标注模型包括多个基于NLP（自然语言处理）的子模型，标注时可以根据待标注对话数据的特征向量选取使用所述对话标注模型中的子模型，通过调整子模型的使用可以提高对话标注的准确率。的使用可以提高对话标注的准确率。的使用可以提高对话标注的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
对话标注模型的训练方法、对话标注方法及装置

[0001]本专利技术涉及人工智能领域，尤其涉及一种对话标注模型的训练方法、对话标注方法及装置。

技术介绍

[0002]伴随着人工智能的浪潮，问答系统、智能助手、聊天机器人等成为了研究的热门，人们希望机器能够像人一样思考，与人类对话，这就要求机器要能够理解、处理人的对话内容，因此对话分析就显得尤为重要。
[0003]目前，对话分析大多是对书面语言进行分析，现有的对话标注系统大多是对有规范格式的书面语言进行标注，而口语对话中存在很多的名词的省略和指代不清楚的情况；在对口语对话分析时还需要考虑上下文的关系和对话之间的应答关系等，因此使用传统的对话标注系统对口语对话进行标注的效果很差。

技术实现思路

[0004]本专利技术提供了一种对话标注模型的训练方法、对话标注方法、装置、电子设备及存储介质；本专利技术训练得到的对话标注模型包括多个基于NLP(自然语言处理)的子模型，标注时可以根据待标注对话数据的特征向量确定子模型的使用，通过调整子模型的使用可以提高对话标注的准确率。
[0005]第一方面，本专利技术的实施例提供了一种对话标注模型的训练方法，包括：
[0006]将训练样本输入对话标注模型中，得到对话标注模型的多个子模型的精度和标签概率，所述标签概率为子模型用于标注训练样本的标签的概率；
[0007]获取训练样本中对话数据的特征向量；
[0008]根据特征向量、精度和标签概率训练对话标注模型。
[0009]可选地，训...

【技术保护点】

【技术特征摘要】
1.一种对话标注模型的训练方法，其特征在于，包括：将训练样本输入对话标注模型中，得到所述对话标注模型的多个子模型的精度和标签概率，所述标签概率为所述子模型用于标注所述训练样本的标签的概率；获取所述训练样本中对话数据的特征向量；根据所述特征向量、所述精度和所述标签概率训练所述对话标注模型。2.根据权利要求1所述的训练方法，其特征在于，还包括设置标签，所述标签包括如下一项或多项：实体标签、文本含义标签、或上下文联系标签。3.一种对话标注方法，其特征在于，包括：获取待标注对话数据的特征向量；根据所述特征向量选取对话标注模型的子模型；使用所述子模型标注所述待标注对话数据。4.根据权利要求3所述的对话标注方法，其特征在于，所述使用所述子模型标注所述待标注对话数据，包括：根据所述子模型的权重和输出概率标注所述待标注对话数据。5.根据权利要求3所述的对话标注方法，其特征在于，还包括：使用规则模型对所述待标注对话数据进行标注，所述规则模型用于根据规则表达式匹配或过滤所述待标注对话数据中的信息，所述规则表达式包括如下一项或多项：模糊匹配...

【专利技术属性】
技术研发人员：肖齐梁，曲道俊，
申请(专利权)人：北京合力亿捷科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人