医疗实体标注方法、装置、设备及存储介质制造方法及图纸

技术编号：38724494 阅读：7 留言：0更新日期：2023-09-08 23:17

本发明专利技术涉及数字医疗领域的人工智能技术，揭露了一种医疗实体标注方法，包括：获取原始医疗问诊对话文本集合，对所述原始医疗问诊对话文本集合中的文本进行文本分类及实体预标注处理，得到问诊训练数据集合，基于预设的神经网络构建原始联合标注模型，利用所述问诊训练数据集合对所述原始联合标注模型进行联合训练，得到标准联合标注模型，利用所述标准联合标注模型对所述问诊训练数据集合进行循环质检处理，得到质检标注结果。本发明专利技术还涉及区块链技术，所述质检标注结果可存储在区块链的节点中。本发明专利技术还提出一种医疗实体标注装置、电子设备以及可读存储介质。本发明专利技术可以提高医疗实体标注的效率。疗实体标注的效率。疗实体标注的效率。

全部详细技术资料下载

【技术实现步骤摘要】
医疗实体标注方法、装置、设备及存储介质

[0001]本专利技术涉及数字医疗及人工智能
，尤其涉及一种医疗实体标注方法、装置、电子设备及可读存储介质。

技术介绍

[0002]随着计算力和数据量的大幅度提升，人工智能技术获得进一步的发展，应用人工智能解决医疗领域问题已成为了热点，例如，通过人工智能对医疗场景中的对话进行实体标注，从而辅助医生问诊。
[0003]现有技术中，医疗问诊文本数据结构化标注是个专业性强、复杂、繁琐的工作，需要耗费大量的人力。并且由于用户对病症的表述相对比较口语化，这也在一定程度上增加了标注的复杂性。当标注问题复杂，标注人员较多时，标注的一致性也难以保证。因此亟需一种能够保证标注一致性的同时，提高标注准确性及效率的方法。

技术实现思路

[0004]本专利技术提供一种医疗实体标注方法、装置、电子设备及可读存储介质，其主要目的在于可以提高医疗实体标注的效率。
[0005]为实现上述目的，本专利技术提供的一种医疗实体标注方法，包括：
[0006]获取原始医疗问诊对话文本集合，对所述原始医疗问诊对话文本集合中的文本进行文本分类及实体预标注处理，得到问诊训练数据集合；
[0007]基于预设的神经网络构建原始联合标注模型；
[0008]利用所述问诊训练数据集合对所述原始联合标注模型进行联合训练，得到标准联合标注模型；
[0009]利用所述标准联合标注模型对所述问诊训练数据集合进行循环质检处理，得到质检标注结果。
[0010]可选地，所...

【技术保护点】

【技术特征摘要】
1.一种医疗实体标注方法，其特征在于，所述方法包括：获取原始医疗问诊对话文本集合，对所述原始医疗问诊对话文本集合中的文本进行文本分类及实体预标注处理，得到问诊训练数据集合；基于预设的神经网络构建原始联合标注模型；利用所述问诊训练数据集合对所述原始联合标注模型进行联合训练，得到标准联合标注模型；利用所述标准联合标注模型对所述问诊训练数据集合进行循环质检处理，得到质检标注结果。2.如权利要求1所述的医疗实体标注方法，其特征在于，所述对所述原始医疗问诊对话文本集合中的文本进行文本分类及实体预标注处理，得到问诊训练数据集合，包括：将所述原始医疗问诊对话文本集合中包含预设关键词的文本分类为有效文本，以及将所述原始医疗问诊对话文本集合中不包含预设关键词的文本分类为无效文本；对所述有效文本进行实体预标注，汇总所有实体预标注后的有效文本及无效文本，得到问诊训练数据集合。3.如权利要求2所述的医疗实体标注方法，其特征在于，所述对所述有效文本进行实体预标注，包括：对所述有效文本进行分词，得到分词结果，对所述分词结果进行频率统计并挑选出预设频率对应的分词作为医疗实体词；获取预构建的医疗补充词，基于所述医疗实体词及所述医疗补充词构建医疗标注库；利用所述医疗标注库对所述有效文本进行实体标注，得到原始标注有效文本，利用接收到的标注修改指令对所述原始标注有效文本进行修正，得到标准标注有效文本。4.如权利要求1中所述的医疗实体标注方法，其特征在于，所述基于预设的神经网络构建原始联合标注模型，包括：将预构建的语义表征模型作为共享编码层；在所述共享编码层后串联一个全连接层，以及在所述共享编码层后串联一个预构建的实体抽取模型；汇总所述共享编码层、所述全连接层及所述实体抽取模型得到原始联合标注模型，其中，共享编码层与全连接层串联用于文本分类，共享编码层与实体抽取模型串联用于实体标注及抽取。5.如权利要求4所述的医疗实体标注方法，其特征在于，所述利用所述问诊训练数据集合对所述原始联合标注模型进行联合训练，得到标准联合标注模型，包括：利用所述原始联合标注模型的共享编码层对所述问诊训练数据集合中的训练文本进行特征编码，得到特征向量；利用所述共享编码层后的全连接层对所述特征向量进行文本分类，得到文本分类结果，并基于所述文本分类结果计算第一损失；利用所述共享编码层后的实体抽取模型对所述特征向量进行实体标签预测，得到预测实体...

【专利技术属性】
技术研发人员：原丽娜，刘道云，
申请(专利权)人：康键信息技术深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人