文本处理方法、装置、设备及介质制造方法及图纸

技术编号:29673440 阅读:24 留言:0更新日期:2021-08-13 21:55
本申请实施例提供一种文本处理方法、装置、设备及介质。该方法包括:获取待处理文本;将待处理文本输入至预先训练的文本处理模型中,确定待处理文本所属领域属于预设领域的概率;在概率大于预设阈值的情况下,从预设领域的知识库中确定对待处理文本进行回答的信息。根据本申请实施例,能够通过文本处理模型先确定文本所属领域,然后从该领域所对应的知识库中查找可对待处理文本进行回答的相关信息,从而提高了查找对该文本进行回答的相关信息的准确性。

【技术实现步骤摘要】
文本处理方法、装置、设备及介质
本申请属于人机交互自然语言处理领域,尤其涉及一种文本处理方法、装置、设备及介质。
技术介绍
随着人工智能时代的来临,以智能客服为代表的一类智能对话技术也发展迅速,但是由于自然语言表达具有多样性和歧义性,使得同一文本可以表达出不同含义,使得智能客服系统无法识别文本所属领域,进而对该文本的回复信息也不够准确,因此,智能客服系统在与客户进行人机对话过程中,需要准确识别用户输入文本所属领域。在现有技术中,一般是针对领域知识库中的实体-属性、实体-关系-实体的三元信息进行建模,再由回归模型判断文本所对应的实体链接对象。但是,由于其过于依赖于知识库信息,且适用于长文本的语义环境。而在绝大多数智能客服系统的问答环境中,经常使用短文本表达,因此,导致现有技术中存在无法准确确定用户输入文本的所属领域,进而无法准确得到对用户输入文本进行回答的相关信息。
技术实现思路
本申请实施例提供一种文本处理方法、装置、设备及介质,可以准确确定用户输入文本的所属领域,进而可以准确得到对用户输入文本进行回答的相关信息。第一方面,本申请实施例提供一种文本处理方法,方法包括:获取待处理文本;将待处理文本输入至预先训练的文本处理模型中,确定待处理文本所属领域属于预设领域的概率;在概率大于预设阈值的情况下,从预设领域的知识库中确定对待处理文本进行回答的信息。在第一方面的一些实施例中,将待处理文本输入至预先训练的文本处理模型中,确定待处理文本所属领域属于预设领域的概率,包括:将待处理文本输入至预先训练的文本处理模型中的第一网络,确定至少一个标有特征标记的文本编码向量,特征标记用于表示文本编码向量的语义特征;将至少一个文本编码向量输入至预先训练的文本处理模型中的第二网络,确定与至少一个文本编码向量对应的至少一个待处理词语、与每个待处理词语对应的词语开始位置和词语结束位置;将至少一个文本编码向量、至少一个待处理词语、与每个待处理词语对应的词语开始位置和词语结束位置输入至预先训练的文本处理模型中的第三网络,确定待处理文本所属领域属于预设领域的概率。在第一方面的一些实施例中,在获取待处理文本之前,方法还包括:获取训练样本集,训练样本集中包括多个待处理文本样本组,每一个待处理文本样本组包括待处理文本样本及其对应的标签概率;利用训练样本集中的待处理文本样本组训练预设的文本处理模型,直至满足训练停止条件,得到训练后的文本处理模型。在第一方面的一些实施例中,利用训练样本集中的待处理文本样本组训练预设的文本处理模型,直至满足训练停止条件,得到训练后的文本处理模型,具体包括:对每个待处理文本样本组,分别执行以下步骤:将待处理文本样本组输入至预设文本处理模型中的第一网络,确定与每一待处理文本样本对应的至少一个标有参考特征标记的参考文本编码向量,参考特征标记用于表示参考文本编码向量的语义特征;将至少一个参考文本编码向量输入至预设文本处理模型中的第二网络,确定与至少一个参考文本编码向量对应的至少一个参考待处理词语、与每个参考待处理词语对应的参考词语开始位置和参考词语结束位置;将至少一个参考文本编码向量、至少一个参考待处理词语、与每个参考待处理词语对应的参考词语开始位置和参考词语结束位置输入至预设文本处理模型中的第三网络,确定每一待处理文本样本对应的参考概率;根据目标待处理文本样本的参考概率和目标待处理文本样本的标签概率,确定预设文本处理模型的损失函数值,目标待处理文本样本是待处理文本样本组中的任一个;在损失函数值不满足训练停止条件的情况下,调整文本处理模型的模型参数,并利用待处理文本样本组训练参数调整后的文本处理模型,直至损失函数值满足训练停止条件,得到训练后的文本处理模型。在第一方面的一些实施例中,预设文本处理模型中的第二网络包括双向长短期记忆网络和向量随机网络。在第一方面的一些实施例中,将至少一个参考文本编码向量、至少一个参考待处理词语、与每个参考待处理词语对应的参考词语开始位置和参考词语结束位置输入至预设文本处理模型中的第三网络,确定每一待处理文本样本对应的参考概率,包括;对每一待处理文本样本,分别执行以下步骤:根据待处理文本样本中的至少一个参考文本编码向量、与至少一个参考文本编码向量对应的至少一个参考待处理词语、与参考待处理词语对应的参考词语开始位置和参考词语结束位置,拼接得到至少一个拼接向量;根据至少一个拼接向量,确定每一待处理文本样本对应的参考概率。在第一方面的一些实施例中,在确定待处理文本所属领域属于预设领域的概率之后,方法还包括:在概率不大于预设阈值的情况下,根据待处理文本更新预设领域的知识库。第二方面,本申请实施例提供了一种文本处理装置,装置包括:第一获取模块,用于获取待处理文本;第一确定模块,用于将待处理文本输入至预先训练的文本处理模型中,确定待处理文本所属领域属于预设领域的概率;第二确定模块,用于在概率大于预设阈值的情况下,从预设领域的知识库中确定对待处理文本进行回答的信息。第三方面,提供一种文本处理设备,包括:存储器,用于存储计算机程序指令;处理器,用于读取并运行存储器中存储的计算机程序指令,以执行第一方面和第二方面中任一可选的实施方式提供的文本处理方法。第四方面,提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面和第二方面中的任一可选的实施方式提供的文本处理方法。本申请的实施例提供的技术方案至少带来以下有益效果:本申请实施例是在获取用户输入待处理文本的情况下,将待处理文本输入至预先训练的文本处理模型中,以此确定待处理文本所属领域属于预设领域的概率,进而可以在待处理文本大概率属于预设领域的情况下,从该预设领域的知识库中查找到与该待处理文本对应的且可以对该待处理文本进行回答的信息。如此,本申请能够通过文本处理模型先确定文本所属领域,然后从该领域所对应的知识库中查找可对待处理文本进行回答的相关信息,从而提高了查找对该文本进行回答的相关信息的准确性。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本申请实施例提供的一种文本处理方法中的训练模型流程示意图;图2是本申请实施例提供的另一种文本处理方法中的训练模型流程示意图;图3是本申请实施例提供的一种文本处理模型中第二网络的模型结构示意图;图4是本申请实施例提供的一种双向长短期记忆网络结构示意图;图5是本申请实施例提供的一种文本处理方法的流程示意图;图6是本申请实施例提供的另一种文本处理方法的流程示意图;图7是本申请实施例提供的一种文本处理装置的结构示意图;图8是本文档来自技高网...

【技术保护点】
1.一种文本处理方法,其特征在于,包括:/n获取待处理文本;/n将所述待处理文本输入至预先训练的文本处理模型中,确定所述待处理文本所属领域属于预设领域的概率;/n在所述概率大于预设阈值的情况下,从所述预设领域的知识库中确定对所述待处理文本进行回答的信息。/n

【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:
获取待处理文本;
将所述待处理文本输入至预先训练的文本处理模型中,确定所述待处理文本所属领域属于预设领域的概率;
在所述概率大于预设阈值的情况下,从所述预设领域的知识库中确定对所述待处理文本进行回答的信息。


2.根据权利要求1所述的方法,其特征在于,所述将所述待处理文本输入至预先训练的文本处理模型中,确定所述待处理文本所属领域属于预设领域的概率,包括:
将所述待处理文本输入至预先训练的文本处理模型中的第一网络,确定至少一个标有特征标记的文本编码向量,所述特征标记用于表示所述文本编码向量的语义特征;
将所述至少一个文本编码向量输入至预先训练的文本处理模型中的第二网络,确定与所述至少一个文本编码向量对应的至少一个待处理词语、与每个所述待处理词语对应的词语开始位置和词语结束位置;
将所述至少一个文本编码向量、所述至少一个待处理词语、与每个所述待处理词语对应的词语开始位置和词语结束位置输入至预先训练的文本处理模型中的第三网络,确定所述待处理文本所属领域属于预设领域的概率。


3.根据权利要求2所述的方法,其特征在于,在所述获取待处理文本之前,所述方法还包括:
获取训练样本集,所述训练样本集中包括多个待处理文本样本组,每一个待处理文本样本组包括待处理文本样本及其对应的标签概率;
利用所述训练样本集中的待处理文本样本组训练预设的文本处理模型,直至满足训练停止条件,得到训练后的文本处理模型。


4.根据权利要求3所述的方法,其特征在于,所述利用所述训练样本集中的待处理文本样本组训练预设的文本处理模型,直至满足训练停止条件,得到训练后的文本处理模型,具体包括:
对每个所述待处理文本样本组,分别执行以下步骤:
将所述待处理文本样本组输入至预设文本处理模型中的第一网络,确定与每一所述待处理文本样本对应的至少一个标有参考特征标记的参考文本编码向量,所述参考特征标记用于表示所述参考文本编码向量的语义特征;
将所述至少一个参考文本编码向量输入至预设文本处理模型中的第二网络,确定与所述至少一个参考文本编码向量对应的至少一个参考待处理词语、与每个所述参考待处理词语对应的参考词语开始位置和参考词语结束位置;
将所述至少一个参考文本编码向量、所述至少一个参考待处理词语、与每个所述参考待处理词语对应的参考词语开始位置和参考词语结束位置输入至预设文本处理模型中的第三...

【专利技术属性】
技术研发人员:王创张瑜高睿魏卓
申请(专利权)人:中国移动通信集团陕西有限公司中国移动通信集团有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1