【技术实现步骤摘要】
文本的实体分类方法、装置、终端设备和存储介质
本申请属于自然语言处理
,尤其涉及一种文本的实体分类方法、装置、终端设备和存储介质。
技术介绍
目前,可以通过对文本进行实体识别来进行有效信息的提取,但是当文本的篇幅过长时,识别出的实体个数较多,对于仅关注其中某一实体的用户来说,不能快速找到关注的实体,导致对该实体相关的有效信息提取效率较低。
技术实现思路
有鉴于此,本申请实施例提供了一种文本的实体分类方法、装置、终端设备和存储介质,可以对识别出来的实体分类展示,能够让用户快速定位到关注的实体,提高对该实体对应的有效信息的提取效率。第一方面,本申请实施例提供了一种文本的实体分类方法,包括:获取待处理文本;对所述待处理文本进行预处理操作,得到多个词嵌入;将所述多个词嵌入输入预先构建的实体检测模型,得到所述待处理文本包含的实体以及每个所述词嵌入对应的隐层向量;将每个所述词嵌入对应的隐层向量输入预先构建的类别检测模型,得到所述实体的实体类别。本申请实施例在识别出 ...
【技术保护点】
1.一种文本的实体分类方法,其特征在于,包括:/n获取待处理文本;/n对所述待处理文本进行预处理操作,得到多个词嵌入;/n将所述多个词嵌入输入预先构建的实体检测模型,得到所述待处理文本包含的实体以及每个所述词嵌入对应的隐层向量;/n将每个所述词嵌入对应的隐层向量输入预先构建的类别检测模型,得到所述实体的实体类别。/n
【技术特征摘要】
1.一种文本的实体分类方法,其特征在于,包括:
获取待处理文本;
对所述待处理文本进行预处理操作,得到多个词嵌入;
将所述多个词嵌入输入预先构建的实体检测模型,得到所述待处理文本包含的实体以及每个所述词嵌入对应的隐层向量;
将每个所述词嵌入对应的隐层向量输入预先构建的类别检测模型,得到所述实体的实体类别。
2.如权利要求1所述的实体分类方法,其特征在于,在得到所述待处理文本包含的实体以及每个所述词嵌入对应的隐层向量之后,还包括:
将目标词嵌入对应的隐层向量输入预先构建的情感检测模型,得到所述实体的情感类别,其中,所述目标词嵌入为所述多个词嵌入中所述实体所在句子的词嵌入以及所述实体所在句子前后相邻的句子的词嵌入。
3.如权利要求2所述的实体分类方法,其特征在于,所述情感检测模型为情感卷积神经网络模型,将目标词嵌入对应的隐层向量输入预先构建的情感检测模型,得到所述实体的情感类别,包括:
将所述目标词嵌入对应的隐层向量输入所述情感卷积神经网络模型中,得到情感嵌入;
采用所述情感卷积神经网络模型对所述情感嵌入进行识别,得到所述实体的情感类别。
4.如权利要求2所述的实体分类方法,其特征在于,在获取待处理文本之前,还包括:
获取所述实体检测模型的第一目标函数、所述类别检测模型的第二目标函数以及所述情感检测模型的第三目标函数;
计算所述第一目标函数、所述第二目标函数和所述第三目标函数之和,得到总目标函数;
采用所述总目标函数对所述实体检测模型的网络参数、所述类别检测模型的网络参数以及所述情感检测模型的网络参数进行优化更新。
5.如权利要求1所述的实体分类方法,其特征在于,对所述待处理文本进行预处理操作,得到多个词嵌入,包括:
对所述待处理文本执行分词处理;
将分词处理后的所述待处理文本输入词...
【专利技术属性】
技术研发人员:赵洋,陈龙,王宇,魏世胜,王超,
申请(专利权)人:深圳价值在线信息科技股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。