一种语义模型的调优方法及系统技术方案

技术编号：22330141 阅读：34 留言：0更新日期：2019-10-19 12:17

本发明专利技术提供了一种语义模型的调优方法及系统，该方法包括：获取用户输入的文本信息；将所述文本信息输入到预先训练好的语义模型中进行识别，以得到所述文本信息对应的目标语义标签；其中，所述目标语义标签中包括多个目标标注数据；获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数；根据所述目标语义标签及所述影响系数对所述语义模型进行调优。本发明专利技术实施例能够在待识别文本信息与语义识别结果出现匹配误差时，快速了解到是哪些数据导致了该匹配误差，从而对语义模型进行针对性的调优。

An optimization method and system of semantic model

全部详细技术资料下载

【技术实现步骤摘要】
一种语义模型的调优方法及系统
本专利技术涉及语义识别
，尤其涉及一种语义模型的调优方法及系统。
技术介绍
如今，随着信息技术的深入发展，文本数据呈爆炸式增长态势，为了对这些文本数据进行充分的利用，许多场景都会应用到语义识别或语义匹配技术，例如：即时信息、微信公众号、机器人客服等等。现有的语义识别通常依赖于语义模型实现，该语义模型通过采用深度学习技术对用于训练的文本数据进行深度学习训练得到。在服务器获取到待识别文本信息时，将待识别文本信息输入到该语义模型中，最终输出与该待识别文本信息匹配度最高的语义识别结果。然而，由于深度学习技术复杂度较高，存在感知上的黑盒效应，即使主观上知道待识别文本信息与语义识别结果出现了明显的匹配误差，也无法快速了解到是哪些数据导致了该匹配误差，从而无法对语义模型进行针对性的调优。
技术实现思路
本专利技术提供了一种语义模型的调优方法及系统，以解决待识别文本信息与语义识别结果出现匹配误差时，无法快速了解到是哪些数据导致了该匹配误差，从而无法对语义模型进行针对性的调优的问题。为实现上述目的，本专利技术实施例第一方面提供了一种语义模型的调优方法，该方法包括：获取用户输入的文本信息；将所述文本信息输入到预先训练好的语义模型中进行识别，以得到所述文本信息对应的目标语义标签；其中，所述目标语义标签中包括多个目标标注数据；获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数；根据所述目标语义标签及所述影响系数对所述语义模型进行调优。在一种可能的实施例中，在所述将所述文本信息输入到预先训练好的语义模型中进行识别之前，所...

【技术保护点】
1.一种语义模型的调优方法，其特征在于，所述方法包括：获取用户输入的文本信息；将所述文本信息输入到预先训练好的语义模型中进行识别，以得到所述文本信息对应的目标语义标签；其中，所述目标语义标签中包括多个目标标注数据；获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数；根据所述目标语义标签及所述影响系数对所述语义模型进行调优。

【技术特征摘要】
1.一种语义模型的调优方法，其特征在于，所述方法包括：获取用户输入的文本信息；将所述文本信息输入到预先训练好的语义模型中进行识别，以得到所述文本信息对应的目标语义标签；其中，所述目标语义标签中包括多个目标标注数据；获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数；根据所述目标语义标签及所述影响系数对所述语义模型进行调优。2.根据权利要求1所述的方法，其特征在于，在所述将所述文本信息输入到预先训练好的语义模型中进行识别之前，所述方法还包括：获取标注数据集；将所述标注数据集中的标注数据标注到多个预设语义标签中；其中，多个所述预设语义标签中的每个所述预设语义标签中均包括多个标注数据；针对所述多个预设语义标签中的每个预设语义标签，对该每个预设语义标签中的多个标注数据进行深度学习训练，以得到所述语义模型。3.根据权利要求2所述的方法，其特征在于，所述将所述文本信息输入到预先训练好的语义模型中进行识别，以得到所述文本信息对应的目标语义标签，包括：获取所述文本信息的特征值和每个所述预设语义标签中的多个标注数据的特征值；将所述文本信息的特征值与每个所述预设语义标签中的多个标注数据的特征值进行匹配，以得到与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据；将与所述文本信息的特征值的匹配度大于第一预设阈值的所述目标标注数据所在的预设语义标签确定为所述目标语义标签。4.根据权利要求1所述的方法，其特征在于，所述获取多个所述目标标注数据中的每个所述目标标注数据对得到所述目标语义标签的影响系数，包括：计算多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度；将多个所述目标标注数据中的每个所述目标标注数据与所述文本信息的相似度确定为所述影响系数。5.根据权利要求1或4所述的方法，其特征在于，所述根据所述目标语义标签及所述影响系数对所述语义模型进行调优，包括：根据所述影响系数的大小，对多个所述目标标注数据进行排序，并输出所述目标语义标签及多个所述目标标注数据中所述影响系数大于第二预设阈值的目标标注数据；在所述目标语义标签与所述文本信息语义不相匹配的情况下，将所述影响系数大于第二预设阈值的目标标注数据从所述目标语义标签中删除，以对所述语义模型的训练数据进行调优。6.一种语义模型的调优系统，其特征在于，所述系统包括客户端及服务端，所述客户端和所述服务端通信连接；所述服务端包括第一获取模块、语义...

【专利技术属性】
技术研发人员：林道智，
申请(专利权)人：深圳追一科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人