实体识别方法及装置，实体识别模型的训练方法及装置制造方法及图纸

技术编号：37617194 阅读：13 留言：0更新日期：2023-05-18 12:08

本申请公开了一种实体识别方法及装置，实体识别模型的训练方法及装置。该方法包括：根据待识别文本和与待识别文本对应的至少一个预设实体提示，通过实体识别模型的并列的第一分支网络和第二分支网络，得到待识别文本中的至少一个实体起始ID所在位置和至少一个实体终止ID所在位置；从至少一个实体终止ID中确定与每个实体起始ID相邻的实体终止ID；确定实体起始ID所在位置和与实体起始ID相邻的实体终止ID所在位置之间的文本为实体，通过第一分支网络和第二分支网络，分别输出至少一个实体起始ID所在位置和至少一个实体终止ID所在位置，避免了实体起始ID所在位置和实体终止ID所在位置在实体识别过程中产生相互竞争，从而提高了实体识别的准确率。了实体识别的准确率。了实体识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
实体识别方法及装置，实体识别模型的训练方法及装置

[0001]本申请涉及人工智能
，具体涉及一种实体识别方法及装置，实体识别模型的训练方法及装置。

技术介绍

[0002]在证券、银行等金融机构里面通常需要对重要的宏观的财经类新闻、中观的行业内新闻和微观的企业新闻进行信息抽取。而对于信息抽取任务来说，命名实体识别(Name Entity Recognition，NER)是信息抽取的重要任务，其在后续的事件抽取，关联分析，知识图谱的任务中作为基础工具。NER是信息提取的一个子任务，旨在将文本中的命名实体定位并分类为预先定义的类别，如人员、组织、位置、时间表达式、数量、货币值、百分比等。一般采用神经网络模型将每个实体的实体起始位置和实体终止位置识别出来，但是由于实体起始位置和实体终止位置为一个实体相关的位置信息，不容易被神经网络模型区分，如果直接采用神经网络模型对每个实体的实体起始位置和实体终止位置进行分类，会导致每个实体的实体起始位置和实体终止位置产生相互竞争，从而降低了实体识别的准确率。

技术实现思路

[0003]有鉴于此，本申请的实施例致力于提供一种实体识别方法及装置，实体识别模型的训练方法及装置，能够提高实体识别的准确率。
[0004]根据本申请实施例的第一方面，提供了一种实体识别方法，包括：根据待识别文本和与待识别文本对应的至少一个预设实体提示，通过实体识别模型的并列的第一分支网络和第二分支网络，得到待识别文本中的至少一个实体起始ID所在位置和至少一个实体终止ID所在位置，其中，至少...

【技术保护点】

【技术特征摘要】
1.一种实体识别方法，其特征在于，包括：根据待识别文本和与所述待识别文本对应的至少一个预设实体提示，通过实体识别模型的并列的第一分支网络和第二分支网络，得到所述待识别文本中的至少一个实体起始ID所在位置和至少一个实体终止ID所在位置，其中，所述至少一个预设实体提示用于描述所述待识别文本中的预设实体，所述第一分支网络用于输出所述至少一个实体起始ID所在位置，每个实体起始ID所在位置为所述预设实体的起始ID所在位置，所述第二分支网络用于输出所述至少一个实体终止ID所在位置，每个实体终止ID所在位置为所述预设实体的终止ID所在位置；从所述至少一个实体终止ID中确定与每个实体起始ID相邻的实体终止ID；确定所述实体起始ID所在位置和与所述实体起始ID相邻的实体终止ID所在位置之间的文本为所述实体。2.根据权利要求1所述的方法，其特征在于，所述根据待识别文本和与所述待识别文本对应的至少一个预设实体提示，通过实体识别模型的并列的第一分支网络和第二分支网络，得到所述待识别文本中的至少一个实体起始ID所在位置和至少一个实体终止ID所在位置，包括：将所述待识别文本和所述至少一个预设实体提示进行拼接，得到至少一个拼接结果；将每个拼接结果输入所述实体识别模型的主干网络中进行特征提取，得到输出向量；将所述输出向量输入所述第一分支网络中进行分类，得到所述至少一个实体起始ID所在位置；将所述输出向量输入所述第二分支网络中进行分类，得到所述至少一个实体终止ID所在位置。3.根据权利要求2所述的方法，其特征在于，在所述至少一个拼接结果包括多个拼接结果的情况下，所述将所述待识别文本和所述至少一个预设实体提示进行拼接，得到至少一个拼接结果，包括：a)将所述待识别文本和与所述待识别文本对应的第i
‑
1预设实体提示进行拼接，得到第i
‑
1拼接结果；b)判断所述第i
‑
1预设实体提示和与所述待识别文本对应的第i预设实体提示是否具有关联关系；c)在所述第i
‑
1预设实体提示与所述第i预设实体提示具有关联关系的情况下，将所述待识别文本和与所述待识别文本对应的第i预设实体提示进行拼接，得到第i拼接结果；迭代执行上述步骤b)和c)至第n次，得到所述多个拼接结果，其中，所述i为大于或等于1且小于或等于n的整数，所述n为大于或等于2的整数。4.根据权利要求2所述的方法，其特征在于，还包括：对所述待识别文本进行语义识别，得到所述待识别文本的语义识别结果；判断所述语义识别结果与所述至少一个预设实体提示是否具有关联关系；其中，所述将所述待识别文本和所述至少一个预设实体提示进行拼接，得到至少一个拼接结果，包括：在所述语义识别结果与所述至少一个预设实体提示具有关联关系的情况下，将所述待识别文本和所述至少一个预设实体提示进行拼接，得到所述至少一个拼接结果。
5.根据权利要求1至4中任一项所述的方法，其特征在于，还包括：通过滑动窗口，在所述待识别文本中抽取预设业务场景下的多个实体提示对应的多个关键词，其中，所述预设业务场景为所述待识别文本所属业务场...

【专利技术属性】
技术研发人员：丁隆耀，蒋宁，夏粉，肖冰，李宽，吕乐宾，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人