【技术实现步骤摘要】
实体识别模型的训练方法及实体识别方法、相关装置
本专利技术涉及智能装置
,尤其涉及一种实体识别模型的训练方法及实体识别方法、相关装置。
技术介绍
一直以来命名实体识别都是信息抽取中的重要一环,也是自然语言处理中的一项基础任务,应用范围广泛。条件随机场(CRF)是命名实体识别的主流模型,随着深度学习的发展,使用深度学习模型(BiLSTM)加上CRF在命名实体识别中变得更加普遍,尽管BiLSTM-CRF成为了基于深度学习的实体识别方法的最主流模型,但在语义理解的过程中仍旧精度不够理想,对于部分词槽的信息准确率依然偏低,导致对话系统中无法完整理解用户的表述。
技术实现思路
本专利技术主要提供一种实体识别模型的训练方法及实体识别方法、相关装置,用于提高实体识别的准确率。为解决上述技术问题,本专利技术提供的第一个技术方案为:提供一种实体识别模型的训练方法,包括:获取训练文本,并将所述训练文本与数据库进行匹配,得到多个匹配结果;对多个所述匹配结果进行处理,得到多个所述匹配结果对应的特征向量;对所述训练文 ...
【技术保护点】
1.一种实体识别模型的训练方法,其特征在于,包括:/n获取训练文本,并将所述训练文本与数据库进行匹配,得到多个匹配结果;/n对多个所述匹配结果进行处理,得到多个所述匹配结果对应的特征向量;/n对所述训练文本进行处理,得到所述训练文本对应每个字的字向量;/n根据所述特征向量及所述字向量对初始实体识别模型进行训练,以得到所述实体识别模型。/n
【技术特征摘要】
1.一种实体识别模型的训练方法,其特征在于,包括:
获取训练文本,并将所述训练文本与数据库进行匹配,得到多个匹配结果;
对多个所述匹配结果进行处理,得到多个所述匹配结果对应的特征向量;
对所述训练文本进行处理,得到所述训练文本对应每个字的字向量;
根据所述特征向量及所述字向量对初始实体识别模型进行训练,以得到所述实体识别模型。
2.根据权利要求1所述的训练方法,其特征在于,所述对多个所述匹配结果进行处理,得到多个所述匹配结果对应的特征向量的步骤包括:
对多个所述匹配结果进行处理,得到多个所述匹配结果对应的one-hot向量;
所述根据所述特征向量及所述字向量对初始实体识别模型进行训练,以得到所述实体识别模型的步骤包括:
将多个所述匹配结果对应的所述one-hot向量进行拼接,以得到one-hot向量矩阵;
将所述one-hot向量矩阵与所述字向量进行相加,得到相加后的结果;
将所述相加后的结果输入至初始实体模型中进行训练,以得到所述实体识别模型。
3.一种实体识别模型的实体识别方法,其特征在于,所述方法包括:
获取待识别文本,以对所述待识别文本进行实体识别,以得到若干个识别结果;
输出若干个所述识别结果对应的标签序列,对所述标签序列进行概率计算;
输出概率最高的所述标签序列作为所述待识别文本对应的准确识别结果。
4.根据权利要求3所述的实体识别方法,其特征在于,所述实体识别模型为通过权利要求1~2任一项所述的训练方法所得。
5.根据权利要求3所述的实体识别方法,其特征在于,所述输出概率最高的所述标签序列作为所述待识别文本对应的准确识别结果的步骤还包括:
对所述概率最高的所述标签序列进行验证,判断所述概率最高的所述标签序列是否为所述待识别文本对应的准确识别结果。
6.根据权利要求5所述...
【专利技术属性】
技术研发人员:熊为星,马力,熊友军,
申请(专利权)人:深圳市优必选科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。