一种信息识别方法、装置及电子设备制造方法及图纸

技术编号:26171329 阅读:21 留言:0更新日期:2020-10-31 13:43
本发明专利技术提供一种信息识别方法、装置及电子设备,该方法包括:接收用户输入的输入信息;将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入信息是否属于医疗领域的第一识别信息,其中,所述深度学习模型为使用属于医疗领域的输入信息作为训练样本进行训练得到的;和/或,根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息;根据所述第一识别信息和/或所述第二识别信息,确定所述输入信息是否属于医疗领域。本发明专利技术实施例可以提高输入信息中医疗特征词识别的召回率。

【技术实现步骤摘要】
一种信息识别方法、装置及电子设备
本专利技术涉及数据处理
,尤其涉及一种信息识别方法、装置及电子设备。
技术介绍
目前可以根据输入的内容,搜索上述内容对应的信息。但是如果不能准确的识别输入的内容时,可能导致搜索得到的信息的准确率较低。因此,在医疗服务中,可以对用户输入的信息进行识别,以识别用户输入的信息是否属于医疗领域,但目前输入信息中医疗特征词识别的召回率比较低。
技术实现思路
本专利技术实施例提供一种信息识别方法、装置及电子设备,以解决目前输入信息中医疗特征词识别的召回率比较低的问题。第一方面,本专利技术实施例提供了一种信息识别方法,包括:接收用户输入的输入信息;将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入信息是否属于医疗领域的第一识别信息,其中,所述深度学习模型为使用属于医疗领域的输入信息作为训练样本进行训练得到的;和/或,根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息;根据所述第一识别信息和/或所述第二识别信息,确定所述输入信息是否属于医疗领域。可选的,所述属于医疗领域的输入信息包括:第一信息,其中,所述第一信息为在进行搜索时搜索出的医疗网站,且所述搜索出的医疗网站中被选择的医疗网站对应的信息。可选的,所述深度学习模型的训练过程包括如下过程:使用所述第一信息作为初始训练样本进行训练,得到初始学习模型;对所述初始训练样本进行优化,得到优化训练样本,并使用所述优化训练样本对所述初始学习模型进行训练,得到所述深度学习模型,其中,所述优化包括:标注所述初始训练样本中的边界样本,和/或,增大所述初始训练样本中被标注为医疗领域的正确样本的权重值。可选的,所述根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息,包括:获取所述搜索结果中的站点在预设名单中的级别分布信息,其中,所述预设名单包括多个预设站点,所述多个预设站点根据与医疗领域相关度分为至少2级;获取所述输入信息的召回结果,其中,所述召回结果用于表示所述输入信息是否能召回医疗领域标识;根据所述级别分布信息和所述召回结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息。可选的,所述第一识别信息和所述第二识别信息为所述输入信息属于医疗领域的概率值,根据所述第一识别信息和所述第二识别信息,确定所述输入信息是否属于医疗领域,包括:当所述第一识别信息大于第一预设值时,且所述第二识别信息大于第二预设值时,确定所述输入信息属于医疗领域;或者当所述第二识别信息大于第三预设值时,且所述第一识别信息大于第四预设值时,确定所述输入信息属于医疗领域。第二方面,本专利技术实施例还提供一种信息识别装置,包括:接收模块,用于接收用户输入的输入信息;处理模块,用于将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入信息是否属于医疗领域的第一识别信息,其中,所述深度学习模型为使用属于医疗领域的输入信息作为训练样本进行训练得到的;和/或,根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息;确定模块,用于根据所述第一识别信息和/或所述第二识别信息,确定所述输入信息是否属于医疗领域。可选的,所述属于医疗领域的输入信息包括:第一信息,其中,所述第一信息为在进行搜索时搜索出的医疗网站,且所述搜索出的医疗网站中被选择的医疗网站对应的信息。可选的,所述深度学习模型的训练过程包括如下过程:使用所述第一信息作为初始训练样本进行训练,得到初始学习模型;对所述初始训练样本进行优化,得到优化训练样本,并使用所述优化训练样本对所述初始学习模型进行训练,得到所述深度学习模型,其中,所述优化包括:标注所述初始训练样本中的边界样本,和/或,增大所述初始训练样本中被标注为医疗领域的正确样本的权重值。可选的,所述处理模块包括:第一获取子模块,用于获取所述搜索结果中的站点在预设名单中的级别分布信息,其中,所述预设名单包括多个预设站点,所述多个预设站点根据与医疗领域相关度分为至少2级;第二获取子模块,用于获取所述输入信息的召回结果,其中,所述召回结果用于表示所述输入信息是否能召回医疗领域标识;识别子模块,用于根据所述级别分布信息和所述召回结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息。可选的,所述第一识别信息和所述第二识别信息为所述输入信息属于医疗领域的概率值,所述确定模块还用于:当所述第一识别信息大于第一预设值时,且所述第二识别信息大于第二预设值时,确定所述输入信息属于医疗领域;或者当所述第二识别信息大于第三预设值时,且所述第一识别信息大于第四预设值时,确定所述输入信息属于医疗领域。第三方面,本专利技术实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述信息识别方法中的步骤。第四方面,本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述信息识别方法中的步骤。在本专利技术实施例中,接收用户输入的输入信息;将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入信息是否属于医疗领域的第一识别信息,其中,所述深度学习模型为使用属于医疗领域的输入信息作为训练样本进行训练得到的;和/或,根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息;根据所述第一识别信息和/或所述第二识别信息,确定所述输入信息是否属于医疗领域。这样,根据第一识别信息和/或第二识别信息,可以提高识别输入信息是否属于医疗领域的准确度,从而提高了输入信息中医疗特征词识别的召回率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的一种信息识别方法的流程图;图2是本专利技术实施例提供的另一种信息识别方法的流程图;图3是本专利技术实施例提供的举例图之一;图4是本专利技术实施例提供的举例图之二;图5是本专利技术实施例提供的一种信息识别装置的结构示意图;图6是本专利技术实施例提供的一种信息识别装置的结构示意图;图7是本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,本文档来自技高网...

【技术保护点】
1.一种信息识别方法,其特征在于,包括:/n接收用户输入的输入信息;/n将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入信息是否属于医疗领域的第一识别信息,其中,所述深度学习模型为使用属于医疗领域的输入信息作为训练样本进行训练得到的;和/或,根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息;/n根据所述第一识别信息和/或所述第二识别信息,确定所述输入信息是否属于医疗领域。/n

【技术特征摘要】
1.一种信息识别方法,其特征在于,包括:
接收用户输入的输入信息;
将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入信息是否属于医疗领域的第一识别信息,其中,所述深度学习模型为使用属于医疗领域的输入信息作为训练样本进行训练得到的;和/或,根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息;
根据所述第一识别信息和/或所述第二识别信息,确定所述输入信息是否属于医疗领域。


2.如权利要求1所述的方法,其特征在于,所述属于医疗领域的输入信息包括:第一信息,其中,所述第一信息为在进行搜索时搜索出的医疗网站,且所述搜索出的医疗网站中被选择的医疗网站对应的信息。


3.如权利要求2所述的方法,其特征在于,所述深度学习模型的训练过程包括如下过程:
使用所述第一信息作为初始训练样本进行训练,得到初始学习模型;
对所述初始训练样本进行优化,得到优化训练样本,并使用所述优化训练样本对所述初始学习模型进行训练,得到所述深度学习模型,其中,所述优化包括:标注所述初始训练样本中的边界样本,和/或,增大所述初始训练样本中被标注为医疗领域的正确样本的权重值。


4.如权利要求1所述的方法,其特征在于,所述根据所述输入信息得到的搜索结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息,包括:
获取所述搜索结果中的站点在预设名单中的级别分布信息,其中,所述预设名单包括多个预设站点,所述多个预设站点根据与医疗领域相关度分为至少2级;
获取所述输入信息的召回结果,其中,所述召回结果用于表示所述输入信息是否能召回医疗领域标识;
根据所述级别分布信息和所述召回结果,对所述输入信息进行医疗领域识别,以得到用于确定所述输入信息是否属于医疗领域的第二识别信息。


5.如权利要求1所述的方法,其特征在于,所述第一识别信息和所述第二识别信息为所述输入信息属于医疗领域的概率值,根据所述第一识别信息和所述第二识别信息,确定所述输入信息是否属于医疗领域,包括:
当所述第一识别信息大于第一预设值时,且所述第二识别信息大于第二预设值时,确定所述输入信息属于医疗领域;或者
当所述第二识别信息大于第三预设值时,且所述第一识别信息大于第四预设值时,确定所述输入信息属于医疗领域。


6.一种信息识别装置,其特征在于,包括:
接收模块,用于接收用户输入的输入信息;
处理模块,用于将所述输入信息输入至深度学习模型进行处理,以得到用于确定所述输入...

【专利技术属性】
技术研发人员:何源川寇晓晖张佳宏刘先锐张溢麟
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1