基于人工智能的实体识别方法、装置、计算机设备及介质制造方法及图纸

技术编号:38659935 阅读:17 留言:0更新日期:2023-09-02 22:44
本发明专利技术涉及人工智能技术领域,尤其涉及一种基于人工智能的实体识别方法、装置、计算机设备及介质,该方法包括提取待识别文本对应文本特征的时序特征,根据由时序特征预测得到的位置,确定实体识别范围,根据实体识别范围,从待识别文本中确定待识别实体,对待识别实体分类,得到分类结果和分类概率,针对任一待识别实体,根据待识别实体的分类概率确定留存概率,确定待识别实体的相邻实体,根据相邻实体的分类概率确定分配概率,在分配概率和留存概率满足预设条件时,确定分类结果为识别结果,提高实体识别的准确率,进而提高金融服务平台对金融类文本的处理效率,也即提高了金融服务平台的服务效率。平台的服务效率。平台的服务效率。

【技术实现步骤摘要】
基于人工智能的实体识别方法、装置、计算机设备及介质


[0001]本专利技术涉及人工智能
,尤其涉及一种基于人工智能的实体识别方法、装置、计算机设备及介质。

技术介绍

[0002]命名实体,下称“实体”,可以是指具有特定意义或者指代性较强的文本片段,通常包括人名、地名、组织机构名称等,并且可以根据实际应用领域,灵活定义实体包含的文本片段类型,例如在保险领域,实体可以是保险产品名称,保险单据标识等,随着人工智能技术的兴起,人工智能模型已广泛应用于金融服务平台中,金融服务平台可以是保险系统、银行系统、交易系统、订单系统等,金融服务平台可以支持购物、社交、互动游戏、资源转移等功能,还可以具有申请贷款、信用卡或者购买保险、理财产品等功能。
[0003]实体识别技术能够从金融类文本中识别出特定的实体,从而辅助金融服务平台执行应用功能,如保险单据检索功能、理财产品分类功能、金融服务记录功能等。
[0004]但是,现有的实体识别模型仅能根据其在训练过程中从标注实体中学习到的知识,对待识别文本进行实体识别,也即只能识别出与标注实体相同的实体,而无法识别出与标注实体存在语义关联的实体,导致实体识别模型的泛化程度较低,从而导致实体识别的准确率较低,因此,如何提高实体识别的准确率成为亟待解决的问题。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种基于人工智能的实体识别方法、装置、计算机设备及介质,以解决实体识别的准确率较低的问题。
[0006]第一方面,本专利技术实施例提供一种基于人工智能的实体识别方法,所述实体识别方法包括:
[0007]获取待识别文本及其文本特征,提取所述文本特征的时序特征,得到正向时序特征和反向时序特征;
[0008]根据所述正向时序特征,对所述待识别文本中表征实体的起始位置进行预测,得到实体起始位置,根据所述反向时序特征,对所述待识别文本中表征实体的结束位置进行预测,输出实体结束位置;
[0009]根据所述实体起始位置和所述实体结束位置,确定所述待识别文本中的实体识别范围,根据所述实体识别范围,从所述待识别文本中确定至少两个待识别实体;
[0010]采用训练好的分类模型对每个待识别实体进行分类,得到对应待识别实体的分类结果及其分类概率;
[0011]针对任一个待识别实体,以所述待识别实体对应的分类概率和第一预设值的乘积作为所述待识别实体的留存概率,根据待识别实体之间的距离,确定所述待识别实体的至少一个相邻实体,将每个相邻实体在所述分类结果下对应的分类概率分别与第二预设值相乘,得到对应相邻实体的分配概率,在所有分配概率和所述留存概率的和大于预设阈值时,
确定所述分类结果为对应所述待识别实体的识别结果。
[0012]第二方面,本专利技术实施例提供一种基于人工智能的实体识别装置,所述实体识别装置包括:
[0013]特征提取模块,用于获取待识别文本及其文本特征,提取所述文本特征的时序特征,得到正向时序特征和反向时序特征;
[0014]位置预测模块,用于根据所述正向时序特征,对所述待识别文本中表征实体的起始位置进行预测,得到实体起始位置,根据所述反向时序特征,对所述待识别文本中表征实体的结束位置进行预测,输出实体结束位置;
[0015]实体提取模块,用于根据所述实体起始位置和所述实体结束位置,确定所述待识别文本中的实体识别范围,根据所述实体识别范围,从所述待识别文本中确定至少两个待识别实体;
[0016]实体分类模块,用于采用训练好的分类模型对每个待识别实体进行分类,得到对应待识别实体的分类结果及其分类概率;
[0017]实体识别模块,用于针对任一个待识别实体,以所述待识别实体对应的分类概率和第一预设值的乘积作为所述待识别实体的留存概率,根据待识别实体之间的距离,确定所述待识别实体的至少一个相邻实体,将每个相邻实体在所述分类结果下对应的分类概率分别与第二预设值相乘,得到对应相邻实体的分配概率,在所有分配概率和所述留存概率的和大于预设阈值时,确定所述分类结果为对应所述待识别实体的识别结果。
[0018]第三方面,本专利技术实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的实体识别方法。
[0019]第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的实体识别方法。
[0020]本专利技术实施例与现有技术相比存在的有益效果是:
[0021]获取待识别文本及其文本特征,提取文本特征的时序特征,得到正向时序特征和反向时序特征,根据正向时序特征,对待识别文本中表征实体的起始位置进行预测,得到实体起始位置,根据反向时序特征,对待识别文本中表征实体的结束位置进行预测,输出实体结束位置,根据实体起始位置和实体结束位置,确定待识别文本中的实体识别范围,根据实体识别范围,从待识别文本中确定至少两个待识别实体,采用训练好的分类模型对每个待识别实体进行分类,得到对应待识别实体的分类结果及其分类概率,针对任一个待识别实体,以待识别实体对应的分类概率和第一预设值的乘积作为待识别实体的留存概率,根据待识别实体之间的距离,确定待识别实体的至少一个相邻实体,将每个相邻实体在分类结果下对应的分类概率分别与第二预设值相乘,得到对应相邻实体的分配概率,在所有分配概率和留存概率的和大于预设阈值时,确定分类结果为对应待识别实体的识别结果,根据文本的特征信息进行实体范围的预测,由预测得到的实体识别范围确定待识别实体,能够提高实体识别的覆盖程度,避免漏识别,而且根据相邻实体的分类概率修正待识别实体的分类概率,提供了参考信息,从而提高了待识别实体的分类准确率,也即提高了实体识别的准确率,进而提高金融服务平台对金融类文本的处理效率,也即提高了金融服务平台的服
务效率。
附图说明
[0022]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1是本专利技术实施例一提供的一种基于人工智能的实体识别方法的一应用环境示意图;
[0024]图2是本专利技术实施例一提供的一种基于人工智能的实体识别方法的流程示意图;
[0025]图3是本专利技术实施例二提供的一种基于人工智能的实体识别装置的结构示意图;
[0026]图4是本专利技术实施例三提供的一种计算机设备的结构示意图。
具体实施方式
[0027]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的实体识别方法,其特征在于,所述实体识别方法包括:获取待识别文本及其文本特征,提取所述文本特征的时序特征,得到正向时序特征和反向时序特征;根据所述正向时序特征,对所述待识别文本中表征实体的起始位置进行预测,得到实体起始位置,根据所述反向时序特征,对所述待识别文本中表征实体的结束位置进行预测,输出实体结束位置;根据所述实体起始位置和所述实体结束位置,确定所述待识别文本中的实体识别范围,根据所述实体识别范围,从所述待识别文本中确定至少两个待识别实体;采用训练好的分类模型对每个待识别实体进行分类,得到对应待识别实体的分类结果及其分类概率;针对任一个待识别实体,以所述待识别实体对应的分类概率和第一预设值的乘积作为所述待识别实体的留存概率,根据待识别实体之间的距离,确定所述待识别实体的至少一个相邻实体,将每个相邻实体在所述分类结果下对应的分类概率分别与第二预设值相乘,得到对应相邻实体的分配概率,在所有分配概率和所述留存概率的和大于预设阈值时,确定所述分类结果为对应所述待识别实体的识别结果。2.根据权利要求1所述的实体识别方法,其特征在于,所述获取待识别文本及其文本特征,包括:将所述待识别文本输入训练好的特征嵌入模型中进行特征提取,输出所述待识别文本中每个文本词项对应的语义特征;根据每个文本词项在所述待识别文本中对应的位置,确定每个文本词项对应的位置特征;根据所有文本词项分别对应的语义特征和位置特征,形成对应所述待识别文本的所述文本特征。3.根据权利要求1所述的实体识别方法,其特征在于,所述根据所述实体识别范围,从所述待识别文本中确定至少两个待识别实体,包括:从所述待识别文本中提取在所述实体识别范围内的N个文本词项,所述N个文本词项符合所述待识别文本的文本顺序,N为大于零的整数;按照所述文本顺序为所述N个文本词项分配序号,得到对应文本词项的序号;初始化起始序号为1,设置终止序号为所述起始序号与1的和,执行所述第一迭代过程,直至所述终止序号与N+1相同,得到至少两个待识别实体,所述第一迭代过程包括:根据所述起始序号和所述终止序号,确定序号范围,由所述序号范围内所有序号对应的文本词项形成所述待识别实体,将所述终止序号增加1。4.根据权利要求3所述的实体识别方法,其特征在于,在所述执行所述第一迭代过程,直至所述终止序号与N+1相同之后,还包括:执行第二迭代过程,直至所述起始序号与N相同,得到所有待识别实体,所述第二迭代过程包括:将所述起始序号增加1,设置终止序号为所述起始序号与1的和,执行所述第一迭代过程,直至所述终止序号与N+1相同。5.根据权利要求3所述的实体识别方法,其特征在于,所述根据待识别实体之间的距
离,确定所述待识别实体的至少一个相邻实体包括:针对任一个待识别实体,根据所述待识别实体对应的起始序号和终止序号,形成对应所述待识别实体的序号坐标;以序号坐标之间的距离作为对应待识别实体之间的距离,将与所述待识别实体的距离小于预设距离阈值的其他待识别实体确定为相邻实体,得到所述待识别实体的所有相邻实体。6.根据权利要求1至5任一项所述的实体识别方法,其特征在于,所述分类结果包括M个子类别,M为大于零的整数;所述采用训练好的分类模型对每个...

【专利技术属性】
技术研发人员:于凤英王健宗程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1