【技术实现步骤摘要】
一种关键信息抽取方法、装置、设备及存储介质
本申请涉及人工智能
,尤其涉及一种关键信息抽取方法、装置、设备及存储介质。
技术介绍
随着人工智能技术的发展,智能外呼、智能客服等一批人工智能产品应运而生,这类智能产品能够通过语音识别、语义理解等技术了解用户的意图,完成与用户的语音交互过程。在语义理解中有两类任务,一类是意图识别,另一类是关键信息抽取。对于关键信息抽取,目前的关键信息抽取方案大多是基于规则的抽取方案。但是,基于规则的抽取方案自动化程度低且通用性较差。
技术实现思路
有鉴于此,本申请提供了一种关键信息抽取方法、装置、设备及存储介质,用以解决现有技术中基于规则的关键信息抽取方案自动化程度低且通用性较差的问题,其技术方案如下:一种关键信息抽取方法,包括:获取待抽取关键信息的目标文本;从所述目标文本中获取关键信息特征序列,其中,所述关键信息特征序列能够表征所述目标文本中的关键信息;根据所述目标文本和所述关键信息特征序列,确定具有特定语义和特定结构的目标关键信息。可选的,所述从所述目标文本中获取关键信息特征序列,包括:通过预先建立的关键信息抽取模型中的关键信息特 ...
【技术保护点】
1.一种关键信息抽取方法,其特征在于,包括:获取待抽取关键信息的目标文本;从所述目标文本中获取关键信息特征序列,其中,所述关键信息特征序列能够表征所述目标文本中的关键信息;根据所述目标文本和所述关键信息特征序列,确定具有特定语义和特定结构的目标关键信息。
【技术特征摘要】
1.一种关键信息抽取方法,其特征在于,包括:获取待抽取关键信息的目标文本;从所述目标文本中获取关键信息特征序列,其中,所述关键信息特征序列能够表征所述目标文本中的关键信息;根据所述目标文本和所述关键信息特征序列,确定具有特定语义和特定结构的目标关键信息。2.根据权利要求1所述的关键信息抽取方法,其特征在于,所述从所述目标文本中获取关键信息特征序列,包括:通过预先建立的关键信息抽取模型中的关键信息特征提取部分,从所述目标文本中提取所述关键信息特征序列;其中,所述关键信息特征序列中包括所述目标文本中每个字对应的关键信息特征,一个字对应的关键信息特征能够表征该字是否为关键信息。3.根据权利要求2所述的关键信息抽取方法,其特征在于,所述通过预先建立的关键信息抽取模型中的关键信息特征提取部分,从所述目标文本中提取所述关键信息特征序列,包括:通过所述关键信息特征提取部分中的字嵌入表示模块,确定所述目标文本对应的字向量序列,其中,所述字向量序列中包括所述目标文本中每个字的字嵌入表示向量;通过所述关键信息特征提取部分中的关键信息特征确定模块和所述目标文本对应的字向量序列,判别所述目标文本中的每个字是否为关键信息,并根据判别结果获得能够表征所述目标文本中的每个字是否为关键信息的关键信息特征序列。4.根据权利要求2所述的关键信息抽取方法,其特征在于,所述根据所述目标文本和所述关键信息特征序列,确定具有特定语义和特定结构的目标关键信息,包括:通过预先建立的关键信息抽取模型中的关键信息确定部分,以及所述目标文本和所述关键信息特征序列,确定具有特定语义和特定结构的目标关键信息。5.根据权利要求4所述的关键信息抽取方法,其特征在于,所述通过预先建立的关键信息抽取模型中的关键信息确定部分,以及所述目标文本和所述关键信息特征序列,确定具有特定语义和特定结构的目标关键信息,包括:通过所述关键信息确定部分中的编码模块,将所述目标文本编码为包含上下文信息的特征序列;将通过所述编码模块编码得到的特征序列与所述关键信息特征序列进行拼接,获得拼接后的特征序列;通过所述关键信息确定部分中的解码模块,确定所述拼接后的特征序列中每个特征的注意力权重,并根据所述拼接后的特征序列和所述拼接后的特征序列中每个特征的注意力权重,确定所述目标关键信息。6.根据权利要求3所述的关键信息抽取方法,其特征在于,所述关键信息特征提取部分中的字嵌入表示模块由稠密卷积神经网络根据大量训练文本训练得到,所述关键信息特征确定模块为双向长短时记忆网络。7.一种关...
【专利技术属性】
技术研发人员:张丹,赵景鹤,高丽蓉,胡加学,贺志阳,
申请(专利权)人:安徽科大讯飞医疗信息技术有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。