文本处理方法以及装置制造方法及图纸

技术编号：30335831 阅读：15 留言：0更新日期：2021-10-10 01:05

本说明书实施例提供文本处理方法以及装置，其中所述文本处理方法包括：接收待处理文本，将所述待处理文本输入实体识别模型，获得带有实体识别标签的候选文本；将所述带有实体识别标签的候选文本输入实体判别模型，获得所述候选文本的候选实体，并基于所述候选实体确定备选文本；基于所述候选实体与所述备选文本构建关系知识图，基于所述关系知识图计算每个关系知识图节点之间的相似度，确定目标实体关系；基于所述目标实体关系在预设知识库中，确定目标实体文本。定目标实体文本。定目标实体文本。

全部详细技术资料下载

【技术实现步骤摘要】
文本处理方法以及装置

[0001]本说明书实施例涉及计算机
，特别涉及一种文本处理方法。本说明书一个或者多个实施例同时涉及一种文本处理装置，一种计算设备，以及一种计算机可读存储介质。

技术介绍

[0002]随着数据处理技术的进步以及移动互联网的快速普及，计算机技术被广泛地运用到社会的各个领域，其中，在理赔项目中，记录人员通过面访与用户沟通时，笔录问询环节将花费大量时间，记录人员将收集到的信息需要反复向用户确认后，再手工填写到理赔作业系统的表单中，不仅使得人工记录成本较高，处理项目的耗时也较长，极大影响项目处理效率。

技术实现思路

[0003]有鉴于此，本说明书施例提供了一种文本处理方法。本说明书一个或者多个实施例同时涉及一种文本处理装置，一种计算设备，以及一种计算机可读存储介质，以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面，提供了一种文本处理方法，包括：
[0005]接收待处理文本，将所述待处理文本输入实体识别模型，获得带有实体识别标签的候选文本；
[0006]将所述带有实体识别标签的候选文本输入实体判别模型，获得所述候选文本的候选实体，并基于所述候选实体确定备选文本；
[0007]基于所述候选实体与所述备选文本构建关系知识图，基于所述关系知识图计算每个关系知识图节点之间的相似度，确定目标实体关系；
[0008]基于所述目标实体关系在预设知识库中，确定目标实体文本。
[0009]根据本说明书实施例的第二方面，提供了一种...

【技术保护点】

【技术特征摘要】
1.一种文本处理方法，包括：接收待处理文本，将所述待处理文本输入实体识别模型，获得带有实体识别标签的候选文本；将所述带有实体识别标签的候选文本输入实体判别模型，获得所述候选文本的候选实体，并基于所述候选实体确定备选文本；基于所述候选实体与所述备选文本构建关系知识图，基于所述关系知识图计算每个关系知识图节点之间的相似度，确定目标实体关系；基于所述目标实体关系在预设知识库中，确定目标实体文本。2.根据权利要求1所述的文本处理方法，所述实体识别模型通过如下方式训练获得：接收待处理样本文本，基于所述待处理样本文本随机确定对比样本文本，将所述待处理样本文本以及所述对比样本文本确定为训练样本集；基于所述训练样本集训练实体识别模型。3.根据权利要求2所述的文本处理方法，所述接收待处理文本，将所述待处理文本输入实体识别模型，获得带有实体识别标签的候选文本，包括：接收待处理文本，将所述待处理文本输入所述实体识别模型的语义识别模块，获得所述待处理文本的语义向量；基于所述待处理文本的语义向量确定所述待处理文本的拼音向量，将所述语义向量以及所述拼音向量输入所述实体识别模型的全连接层计算损失函数，获得所述待处理文本的损失值；将所述待处理文本的损失值输入所述实体识别模型的概率网络层，获得带有实体识别标签的候选文本。4.根据权利要求3所述的文本处理方法，所述将所述带有实体识别标签的候选文本输入实体判别模型，获得所述候选文本的候选实体，包括：基于带有实体识别标签的候选文本输入实体判别模型确定初始实体，将所述初始实体转换为初始实体拼音，并基于所述初始实体拼音在预设知识库中搜索与所述初始实体拼音相似的备选实体拼音；计算所述初始实体拼音与所述备选实体拼音的相似性，并基于所述相似性与文本属性进行排序，确定实体序列；根据预设序列阈值确定所述候选文本的候选实体。5.根据权利要求1
‑
4任意一项所述的文本处理方法，所述基于所述候选实体确定备选文本，包括：获取所述候选文本的初始实体，并确定所述初始实体与所述候选实体的实体关联关系；基于所述初始实体、所述候选实体以及所述实体关联关系构造关系图；将所述关系图的节点实体嵌入所述待处理文本的初始实体之后，确定待评分文本，并基于所述待评分文本确定备选文本。6.根据权利要求5所述的文本处理方法，所述基于所述待评分文本确定备选文本，包括：将所述待评分文本输入语义识别模型进行编码，获得所述待处理文本的初始实体向量
以及所述关系图的节点实体向量；计算所述初始实体向量以及所述节点实体向量的相似性，确定备选文本。7.根据权利要求6所述的文本处理方法，所述基于所述关系知识图计算每个关系知识图节点之间的相似度，确定目标实体关系，包括：将所述关系知...

【专利技术属性】
技术研发人员：顾大中，梁建增，周梦迪，王洪彬，李楠，乔建伟，乔莉，
申请(专利权)人：支付宝杭州信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人