问诊数据的敏感词处理方法技术

技术编号:39423429 阅读:15 留言:0更新日期:2023-11-19 16:11
本申请涉及人工智能药物和医疗健康技术领域,提出了一种问诊数据的敏感词处理方法

【技术实现步骤摘要】
问诊数据的敏感词处理方法、装置、设备及介质


[0001]本申请涉及人工智能药物和医疗健康
,尤其涉及一种问诊数据的敏感词处理方法

装置

设备及介质


技术介绍

[0002]互联网医疗是新兴的以互联网技术为基础,以互联网平台为载体的在线医疗形态

其核心资源是医生群体,医生通过互联网医疗平台,在国家相关部门的监管之下,向用户提供有限的

合规的医事服务

随着互联网医院的推广应用,越来越多的患者选择线上问诊

[0003]目前,患者在咨询医生过程中偶尔会发送敏感词汇,甚至有个别情绪激动的患者对医生进行辱骂,此现象影响了医生的问诊效率
,
也增加了线上问诊业务的合规风险


技术实现思路

[0004]本申请实施例提供了一种问诊数据的敏感词处理方法

装置

设备及介质,旨在解决相关技术中患者在咨询医生过程中偶尔会发送敏感词汇,甚至有个别情绪激动的患者对医生进行辱骂,从而影响医生的问诊效率
,
增加线上问诊业务的合规风险等技术问题

[0005]第一方面,本申请实施例提供了一种问诊数据的敏感词处理方法,包括:
[0006]接收患者终端发送的问诊文本信息;
[0007]对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词;
[0008]响应于所述问诊文本信息中包含敏感词,对所述问诊文本信息进行脱敏处理,以得到处理后的问诊文本信息;
[0009]发送所述处理后的问诊文本信息至医生终端,并发送预设提示文本至所述患者终端,以提示所述患者文明用语

[0010]在一个实施例中,可选的,所述方法还包括:
[0011]响应于所述问诊文本信息中不包含敏感词,发送所述问诊文本信息至所述医生终端

[0012]在一个实施例中,可选的,对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词,包括:
[0013]对所述问诊文本信息进行分词处理,得到初始词语;
[0014]对所述初始词语进行去重处理,得到至少一个目标词语;
[0015]将各个目标词语与预设敏感词库中的各个敏感词进行比对;
[0016]响应于所述目标词语与所述预设敏感词库中的敏感词相同,确定所述目标词语为敏感词

[0017]在一个实施例中,可选的,对所述问诊文本信息进行脱敏处理,包括:
[0018]使用预设字符替换所述问诊文本信息中的敏感词

[0019]在一个实施例中,可选的,所述方法还包括:
[0020]统计所述患者终端在预设时间段内发送的问诊文本信息中包含敏感词的次数;
[0021]当所述次数大于预设次数时,将所述患者终端加入患者黑名单,以禁止所述患者终端发送问诊文本信息

[0022]在一个实施例中,可选的,对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词,包括:
[0023]对所述问诊文本信息进行分词处理,得到初始词语;
[0024]对所述初始词语进行去重处理,得到至少一个目标词语;
[0025]将每个目标词语输入敏感词识别模型,得到敏感词识别结果;
[0026]根据所述敏感词识别结果,确定所述目标词语是否是敏感词

[0027]在一个实施例中,可选的,所述敏感词识别模型的训练过程包括:
[0028]获取初始数据源;
[0029]将所述初始数据源输入初始敏感词识别模型以及预先构建的规则库,得到初始敏感词集合;
[0030]获取用于对所述初始敏感词识别模型进行增量训练的增量语料数据源;
[0031]基于语义相似度,在所述增量语料数据源中对所述初始敏感词集合进行迭代扩充,得到增量数据源;
[0032]通过所述增量数据源对所述初始敏感词识别模型进行训练,得到敏感词句识别模型

[0033]第二方面,本申请实施例提供了一种问诊数据的敏感词处理装置,包括:
[0034]接收模块,用于接收患者终端发送的问诊文本信息;
[0035]确定模块,用于对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词;
[0036]处理模块,用于响应于所述问诊文本信息中包含敏感词,对所述问诊文本信息进行脱敏处理,以得到处理后的问诊文本信息;
[0037]发送模块,用于发送所述处理后的问诊文本信息至医生终端,并发送预设提示文本至所述患者终端,以提示所述患者文明用语

[0038]第三方面,提供了一种计算机设备,包括存储器

处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述问诊数据的敏感词处理方法的步骤

[0039]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述问诊数据的敏感词处理方法的步骤

[0040]以上问诊数据的敏感词处理方法

装置

设备及介质所实现的方案中,接收患者终端发送的问诊文本信息;对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词;响应于所述问诊文本信息中包含敏感词,对所述问诊文本信息进行脱敏处理,以得到处理后的问诊文本信息;发送所述处理后的问诊文本信息至医生终端,并发送预设提示文本至所述患者终端,以提示所述患者文明用语

本专利技术中,会对问诊文本信息进行敏感词识别,如果识别出问诊文本信息中包含敏感词,会进行脱敏处理后发送给医生终端,这样,医生端就会显示处理后的问诊文本信息,同时还会向患者终端发送预设提示文本,提示患者文明用语,从而以较小的性能损耗,提高医患沟通效率,从而保证线上问诊的合规性

【附图说明】
[0041]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图

[0042]图
1A
是本专利技术一实施例中问诊数据的敏感词处理方法的一应用环境示意图

[0043]图
1B
示出了根据本申请的一个实施例的问诊数据的敏感词处理方法的示意流程图

[0044]图2示出了根据本申请的一个实施例的问诊数据的敏感词处理方法中步骤
S102
的示意流程图

[0045]图3示出了根据本申请的一个实施例的问诊数据的敏感词处理方法中步骤
S102
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种问诊数据的敏感词处理方法,其特征在于,包括:接收患者终端发送的问诊文本信息;对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词;响应于所述问诊文本信息中包含敏感词,对所述问诊文本信息进行脱敏处理,以得到处理后的问诊文本信息;发送所述处理后的问诊文本信息至医生终端,并发送预设提示文本至所述患者终端,以提示所述患者文明用语
。2.
根据权利要求1所述的问诊数据的敏感词处理方法,其特征在于,所述方法还包括:响应于所述问诊文本信息中不包含敏感词,发送所述问诊文本信息至所述医生终端
。3.
根据权利要求1所述的问诊数据的敏感词处理方法,其特征在于,对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词,包括:对所述问诊文本信息进行分词处理,得到初始词语;对所述初始词语进行去重处理,得到至少一个目标词语;将各个目标词语与预设敏感词库中的各个敏感词进行比对;响应于所述目标词语与所述预设敏感词库中的敏感词相同,确定所述目标词语为敏感词
。4.
根据权利要求1所述的问诊数据的敏感词处理方法,其特征在于,对所述问诊文本信息进行脱敏处理,包括:使用预设字符替换所述问诊文本信息中的敏感词
。5.
根据权利要求1所述的问诊数据的敏感词处理方法,其特征在于,所述方法还包括:统计所述患者终端在预设时间段内发送的问诊文本信息中包含敏感词的次数;当所述次数大于预设次数时,将所述患者终端加入患者黑名单,以禁止所述患者终端发送问诊文本信息
。6.
根据权利要求1所述的问诊数据的敏感词处理方法,其特征在于,对所述问诊文本信息进行识别,确定所述问诊文本信息中是否包含敏感词,包...

【专利技术属性】
技术研发人员:章利亮
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1