【技术实现步骤摘要】
基于人工智能的实体抽取方法、装置、设备及介质
本专利技术涉及人工智能
,尤其涉及一种基于人工智能的实体抽取的方法、装置、设备及介质。
技术介绍
当前随着信息以爆炸的速度增长,丰富的数据需要计算机和网络提供更方便快捷高效的服务的同时,信息的提取和处理也成为必不可少的一个重要环节,任何网络用户都不希望因为信息量过大而使得抽取信息变得困难,在这种背景下一些基于网络挖掘的信息处理技术应用而生,信息抽取,信息检索,自动文摘,问题回答等技术都是当今自然语言处理技术的重要研究领域。现有技术中通常采用命名实体识别技术来完成对文本进行实体抽取,但是由于命名实体更新速度快,随着时间层出不穷,不可能通过词典完全收录,例如在招标领域,若文本中出现存在中标金额、中标、金额等命名实体时,无法对命名实体进行准确的抽取,使得在进行实体抽取时,仍然需要人工辅助来完成实体的抽取,导致人力成本居高不下,效率缓慢。
技术实现思路
本专利技术实施例提供了一种基于人工智能的实体抽取的方法、装置、设备及介质,旨在解决现有技术中在对文本进行实体抽 ...
【技术保护点】
1.一种基于人工智能的实体抽取的方法,其特征在于,包括以下步骤:/n根据实体抽取请求获取目标文本并对所述目标文本进行预处理;/n将预处理后的目标文本输入至预置的实体抽取模型中,得到所述目标文本的初始命名实体集合以及所述初始命名实体集合中每个初始命名实体的上下文信息;/n根据预设的正则匹配规则对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第一判别结果;/n根据预设的关键词匹配规则对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第二判别结果;/n基于所述上下文信息,根据预置的卷积神经网络模型对所述每个初始命名实体进行实体判别,得到所述每个初始命名实 ...
【技术特征摘要】
1.一种基于人工智能的实体抽取的方法,其特征在于,包括以下步骤:
根据实体抽取请求获取目标文本并对所述目标文本进行预处理;
将预处理后的目标文本输入至预置的实体抽取模型中,得到所述目标文本的初始命名实体集合以及所述初始命名实体集合中每个初始命名实体的上下文信息;
根据预设的正则匹配规则对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第一判别结果;
根据预设的关键词匹配规则对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第二判别结果;
基于所述上下文信息,根据预置的卷积神经网络模型对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第三判别结果;
基于所述第一判别结果、所述第二判别结果以及所述第三判别结果,采用投票策略从所述初始命名实体集合中获取所述目标文本的目标实体。
2.根据权利要求1所述的基于人工智能的实体抽取的方法,其特征在于,所述对所述目标文本进行预处理,包括:
去除所述目标文本中的特殊字符并将去除特殊字符后的目标文本进行分词处理,得到所述目标文本中的词语;
将所述目标文本中的词语进行词性标注,得到词性标注后的词语。
3.根据权利要求2所述的基于人工智能的实体抽取的方法,其特征在于,所述将预处理后的目标文本输入至预置的实体抽取模型中,得到所述目标文本的初始命名实体集合以及所述初始命名实体集合中每个初始命名实体的上下文信息,包括:
将所述预处理后的目标文本进行词嵌入处理,得到所述目标文本的词向量序列;
将所述词向量序列输入至预置的BiLSTM网络模型中,得到所述目标文本的特征向量序列,其中,所述目标文本的特征向量序列包括所述每个初始命名实体的上下文信息;
将所述目标文本的特征向量序列输入至预置的条件随机场模型中,得到所述目标文本的初始命名实体集合。
4.根据权利要求1所述的基于人工智能的实体抽取的方法,其特征在于,所述根据预设的正则匹配规则对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第一判别结果,包括:
获取多个正则表达式并将所述多个正则表达式中每个正则表达式与所述每个初始命名实体所在的语句进行字符匹配并根据所述字符匹配结果从所述多个正则表达式中获取每个初始命名实体的目标正则表达式;
根据所述目标正则表达式对所述每个初始命名实体进行实体判别,得到所述第一判别结果。
5.根据权利要求1所述的基于人工智能的实体抽取的方法,其特征在于,所述根据预设的关键词匹配规则对所述每个初始命名实体进行实体判别,得到所述每个初始命名实体的第二判别结果,包括:
将所述每个初始命名实体所在的语句与预设的关键词知识库进行关键词...
【专利技术属性】
技术研发人员:苏雪琦,王健宗,程宁,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。