【技术实现步骤摘要】
问诊模板的匹配方法、装置、设备及存储介质
[0001]本专利技术涉及人工智能
,尤其涉及一种问诊模板的匹配方法、装置、设备及存储介质。
技术介绍
[0002]在患者问诊的过程中,首先需要根据患者的主诉病症,向患者提供合适的问诊模板,以供患者填写具体的病症表现。通常,不同的病症所匹配的问诊模板不同,此时,就需要根据患者提供的主诉病症,向患者提供最匹配的问诊模板。相关技术中,通过机器学习的方式训练分类模型,将患者提供的主诉病症输入至该分类模型中,即可输出匹配的问诊模板。但是通过机器学习方式训练得到的分类模型属于黑盒模型,缺少解释性,难以理解,也无法得知其分类的具体过程,一旦出现故障或者业务变更等问题,医学运营人员很难在短时间内更新分类模型,增加了修复或者变更业务的成本。
技术实现思路
[0003]本专利技术提供了一种问诊模板的匹配方法、装置、设备及存储介质,用于使运营人员可以明确知晓每种问诊模板的分类规则,分类过程便于控制,当出现故障或业务变更时,可以尽快修改分类规则,方便运营人员解决故障问题以及更快地对业
【技术保护点】
【技术特征摘要】
1.一种问诊模板的匹配方法,其特征在于,所述方法包括:获取用户提供的主诉信息;所述主诉信息包括所述用户的身体状况信息和不适症状信息;将所述主诉信息与每种问诊模板的正则表达式进行匹配,将匹配成功的正则表达式所对应的问诊模板,确定为目标问诊模板;向所述用户提供所述目标问诊模板;所述目标问诊模板用于所述用户填写病症表现信息;其中,每种所述问诊模板的正则表达式通过下述方式得到:获取所述问诊模板对应的样本集合;基于所述样本集合的样本属性信息,得到初始表达式;基于预设的更新算法更新所述初始表达式和所述样本集合,直至满足第一指定条件,得到所述问诊模板的正则表达式。2.根据权利要求1所述的方法,其特征在于,获取所述问诊模板对应的样本集合的步骤,包括:获取训练语料集;所述训练语料集中包括多组训练预料,每组所述训练预料中包括主诉信息、模板名称和所属科室;从所述训练语料集中获取所述问诊模板的模板名称对应的第一训练语料,将所述第一训练语料作为正样本;从所述训练语料集中获取除所述问诊模板的模板名称以外的模板名称对应的第二训练语料,将所述第二训练语料作为负样本;将所述正样本和所述负样本作为所述问诊模板对应的样本集合。3.根据权利要求1所述的方法,其特征在于,基于所述样本集合的样本属性信息,得到初始表达式的步骤,包括:对所述样本集合中的主诉信息进行分词处理,得到多个文本词;针对每个所述文本词,基于所述文本词的词义,以及所述文本词在样本集合中的出现频率,确定所述文本词的权重;统计所述多个文本词之间的出现位置的关联关系;根据所述样本集合中的多个文本词、每个所述文本词的权重、以及多个文本词之间的出现位置的关联关系,生成初始表达式。4.根据权利要求3所述的方法,其特征在于,基于所述文本词的词义,以及所述文本词在样本集合中的出现频率,确定所述文本词的权重的步骤,包括:基于预设的同义词表,对所述多个文本词进行归一化操作,将同义的文本词划分为同一类,得到每个所述文本词的词义类型;基于每个所述文本词的词义类型,通过词频和逆文档频率的统计方式,得到每个文本词的权重。5.根据权利要求3所述的方法,其特征在于,统计所述多个文本词之间的出现位置的关联关系的步骤,包括:针对所述多个文本词之间的任意两个文本词,统计所述任意两个文本词之间的共现参数;所述共现参数包括共现频率、平均间距、最小间距和最大间距信息;基于所述任意两个文本词之间的共现参数,生成所述多个文本词之间的共现矩阵;在
所述共现矩阵中,每个矩阵位置上包括一个共现参数,所述共现参数为该矩阵位置对应的两个文本词之间的共现参数。6.根...
【专利技术属性】
技术研发人员:赵建双,
申请(专利权)人:康键信息技术深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。