信息处理方法及装置、计算机设备和计算机可读存储介质制造方法及图纸

技术编号:38360790 阅读:12 留言:0更新日期:2023-08-05 17:30
本申请涉及数据处理技术领域及数字医疗领域,提出了一种信息处理方法及装置、计算机设备和计算机可读存储介质,该方法包括:获取第一文本标识;基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识;若所述未修正文本信息内具有与所述第一文本标识相匹配的所述第二文本标识,对所述未修正文本信息执行修正操作;若所述未修正文本信息内不具有与所述第一文本标识相匹配的所述第二文本标识,确定所述未修正文本信息为有效信息。本申请的技术方案,既减少了对系统资源的占用,也提升了对医疗信息中不合理文本信息进行识别的速度和准确性。和准确性。和准确性。

【技术实现步骤摘要】
信息处理方法及装置、计算机设备和计算机可读存储介质


[0001]本申请涉及数据处理
及数字医疗领域,尤其涉及一种信息处理方法及装置、计算机设备和计算机可读存储介质。

技术介绍

[0002]随着互联网的快速发展,互联网所提供的医疗信息爆炸式增长,一般地,这些医疗信息在自身的主要应用场景中为有效信息,而当用于其他应用场景时,往往为冗余信息。比如,在病历中往往携带患者的个人隐私信息,将病历应用于医疗研发或学习等实际场景时,为保护患者隐私安全,必须对病历中的个人隐私信息进行删除。再比如,在药品、医疗防护用品等医疗产品的描述信息中往往携带厂家设置的品牌名称、促销标语等附加内容,患者在购买医疗产品时,有可能只关注医疗产品本身的功能,而不关注品牌名称和促销标语这些附加内容,此时,这些附加内容属于冗余信息,有待剔除。
[0003]对此,相关技术中一般可通过人工智能的方式训练识别模型来识别这些冗余信息,从而进行剔除。然而,人工智能方式的运行和模型训练均比较复杂,占用硬件资源过大,且由于其复杂性,其得出识别结果所消耗的时间也相对较长,使得冗余信息的识别和剔除具有延时,影响信息获取方的使用体验。因此,人工智能方式整体上成本较高。另外,人工智能方式对模型准确性的依赖程度很高,一旦所得模型准确性不足,其识别结果就易发生错误,影响冗余信息识别的准确性。
[0004]因此,如何在降低医疗信息识别所消耗的成本的同时,提升医疗信息识别的准确性,成为目前亟待解决的技术问题。

技术实现思路

[0005]本申请实施例提供了一种信息处理方法及装置、计算机设备和计算机可读存储介质,旨在解决相关技术中通过人工智能方式从医疗信息中识别冗余信息准确性不足且消耗成本高的技术问题。
[0006]第一方面,本申请实施例提供了一种信息处理方法,包括:获取第一文本标识;基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识;若所述未修正文本信息内具有与所述第一文本标识相匹配的所述第二文本标识,对所述未修正文本信息执行修正操作;若所述未修正文本信息内不具有与所述第一文本标识相匹配的所述第二文本标识,确定所述未修正文本信息为有效信息。
[0007]第二方面,本申请实施例提供了一种信息处理装置,包括:文本标识获取单元,用于获取第一文本标识;文本标识匹配单元,用于基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识;第一执行单元,用于若所述未修正文本信息内具有与所述第一文本标识相匹配的所述第二文本标识,对所述未修正文本信息执行修正操作;第二执行单元,用于若所述未修正文本信息内不具有与所述第一文本标识相匹配的所述第二文本标识,确定所述未修正文本信息为有效信息。
[0008]第三方面,本申请实施例提供了一种计算机设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被设置为用于执行上述第一方面所述的方法。
[0009]第四方面,本申请实施例提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述第一方面所述的方法。
[0010]以上技术方案,针对相关技术中通过人工智能方式从医疗信息中识别冗余信息准确性不足且消耗成本高的技术问题,首先,获取第一文本标识,并基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识。
[0011]其中,第一文本标识为具有指定文本展现形式的文本,用于反映需要被修正的文本信息所具有的指定文本展现形式,而未修正文本信息则包括但不限于病历信息、医疗产品描述信息等任何类型的医疗信息。第一文本标识的文本样式即为第一文本标识所具有的指定文本展现形式,而未修正文本信息是需要被判断是否需被修正的文本信息。若第二文本标识与所述第一文本标识相匹配,说明第二文本标识也具有需要被修正的文本信息所具有的指定文本展现形式。
[0012]在此基础上,当所述未修正文本信息内具有与所述第一文本标识相匹配的所述第二文本标识时,即所述未修正文本信息包括需要被修正的文本信息所具有的指定文本展现形式,说明所述未修正文本信息需要被修正。
[0013]反之,当所述未修正文本信息内不具有与所述第一文本标识相匹配的所述第二文本标识时,即所述未修正文本信息未包括需要被修正的文本信息所具有的指定文本展现形式,说明所述未修正文本信息本身即为有效信息,不需要被修正。
[0014]以上技术方案,通过将未修正文本信息与具有指定文本展现形式的文本进行比较,来判断未修正文本信息中是否具有该指定文本展现形式,从而在未修正文本信息中具有该指定文本展现形式对该未修正文本信息进行修正。通过本申请的技术方案,可简单有效地识别医疗信息中指定文本展现形式的不合理文本信息,相对于相关技术中采用的人工智能方式,识别过程简单快捷,既减少了对系统资源的占用,也提升了识别速度,还无需训练神经网络模型,避免了因模型准确性不足带来的识别结果不准确的技术问题,提升了对医疗信息中不合理文本信息进行识别的准确性。
【附图说明】
[0015]为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0016]图1示出了根据本申请的一个实施例的信息处理方法的流程图;
[0017]图2示出了根据本申请的另一个实施例的信息处理方法的流程图;
[0018]图3示出了根据本申请的再一个实施例的信息处理方法的流程图;
[0019]图4示出了根据本申请的一个实施例的信息处理装置的框图;
[0020]图5示出了根据本申请的一个实施例的计算机设备的框图;
[0021]图6示出了根据本申请的另一个实施例的计算机设备的框图。
【具体实施方式】
[0022]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0023]本申请的技术方案可用于为大量同类型的医疗信息整体剔除冗余信息的实际场景中。
[0024]比如,在医疗产品相关的线上电商场景中,服务端获取第三方平台的医疗产品链接,并将第三方平台的医疗产品链接转换为己方的医疗产品链接,供己方的客户端访问。具体来说,服务端针对来自第三方平台的大量医疗产品标题,可通过医疗产品标题中的品牌名称的文本样式,判断其是否与预设的冗余信息库中的文本标识相匹配。
[0025]若判断结果为该品牌名称与预设的冗余信息库中的文本标识相匹配,则确定该品牌名称本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取第一文本标识;基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识;若所述未修正文本信息内具有与所述第一文本标识相匹配的所述第二文本标识,对所述未修正文本信息执行修正操作;若所述未修正文本信息内不具有与所述第一文本标识相匹配的所述第二文本标识,确定所述未修正文本信息为有效信息。2.根据权利要求1所述的信息处理方法,其特征在于,在所述基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识之前,还包括:确定所述第一文本标识的文本样式是否为指定样式,其中,若所述第一文本标识的文本样式为所述指定样式,进入所述基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识的步骤。3.根据权利要求2所述的信息处理方法,其特征在于,还包括:若所述第一文本标识的文本样式不是所述指定样式,确定预设映射信息库中是否具有所述第一文本标识的映射信息;当所述预设映射信息库中具有所述第一文本标识的映射信息时,检测所述未修正文本信息内是否具有与所述映射信息相匹配的第三文本标识,其中,若所述未修正文本信息内具有与所述映射信息相匹配的所述第三文本标识,对所述未修正文本信息执行修正操作,若所述未修正文本信息内不具有与所述映射信息相匹配的所述第三文本标识,确定所述未修正文本信息为有效信息;当所述预设映射信息库中不具有所述第一文本标识的映射信息时,确定所述未修正文本信息为有效信息。4.根据权利要求2所述的信息处理方法,其特征在于,所述确定所述第一文本标识的文本样式是否为指定样式,包括:确定所述第一文本标识的文本样式是否与样本样式集合中的任一指定样式相匹配;或者按照多种指定样式的排列顺序,轮询所述多种指定样式各自是否与所述第一文本标识的文本样式相匹配,其中,当轮询到任一指定样式与所述第一文本标识的文本样式相匹配时,终止轮询,进入所述基于所述第一文本标识的文本样式,检测未修正文本信息内是否具有与所述第一文本标识相匹配的第二文本标识的步骤。5.根据权利要求4所述的信息处理方法,其特征在于,在所述按照多种指定样式的排列顺序,轮询所述多种指定样式各自是否与所述第一文本标识的文本样式相匹配之前,还包括:将所述第一文本标识所属的标识对象对应的文本样...

【专利技术属性】
技术研发人员:于春涛
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1