描述文本中目标词的确定方法、装置、设备以及存储介质制造方法及图纸

技术编号:31323444 阅读:35 留言:0更新日期:2021-12-13 00:12
本申请公开了一种描述文本中目标词的确定方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,能够基于描述文本确定对应的动作序列,对描述文本执行动作序列中的动作,以获取描述文本中的感受词,这个感受词能够表示目标对象的感受。基于描述文本、感受词的语义特征、候选词的语义特征以及动作序列,从多个候选词中确定目标词,该目标词也即是描述文本中感受词的标准化表述,由于在确定目标词的过程中是基于语义特征来实现的,那么确定出的目标词与感受词之间的匹配程度也就较高。通过该目标词能够实现对描述文本的标准化,标准化过程也无需人工参与,从而提高了对描述文本进行标准化的效率和准确性。准确性。准确性。

【技术实现步骤摘要】
描述文本中目标词的确定方法、装置、设备以及存储介质


[0001]本申请涉及计算机
,特别涉及一种描述文本中目标词的确定方法、装置、设备以及存储介质。

技术介绍

[0002]随着计算机技术的发展,能够通过设备自动对描述文本进行处理,将描述文本中一些内容用标准化的内容替代,从而统一对同一事物的表达,规范化语言表达,从而代替人工处理,有效提高处理效率。比如,患者就医过程中,会通过语言来描述自己的身体状况,基于患者的表达生成的主诉也即是一种描述文本。由于不同患者的语言表达习惯不同,对于同一种疾病或者感受会以不同的文字来表示。将描述文本中一些内容用标准化的内容替代,能够对主诉进行标准化,从而提高医生诊断的效率。
[0003]相关技术中,对描述文本进行处理时往往会由医护人员手动进行,也即是由医护人员从描述文本中确定出需要替代的内容,进而实现对描述文本标准化。但是,在这种方式下,对描述文本进行标准化的效率较低,准确性较差。

技术实现思路

[0004]本申请实施例提供了一种描述文本中目标词的确定方法、装置、设备以及存储介质,可以提本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种描述文本中目标词的确定方法,其特征在于,所述方法包括:获取目标对象的描述文本,所述描述文本用于记载所述目标对象的感受;基于所述描述文本,确定所述描述文本的动作序列,所述动作序列中的动作对应于所述描述文本的不同处理阶段;对所述描述文本执行所述动作序列中的动作,得到所述描述文本中所述目标对象的感受词;基于所述描述文本、所述感受词的语义特征、多个候选词的语义特征以及所述动作序列,确定目标词,所述目标词为所述多个候选词中与所述感受词对应的候选词,所述候选词为标准化的感受词。2.根据权利要求1所述的方法,其特征在于,所述基于所述描述文本,确定所述描述文本的动作序列包括:基于所述描述文本在各个时间步中的状态信息以及各个时间步对应的历史动作序列,确定所述描述文本的动作序列,所述状态信息用于指示对应时间步中所述描述文本中未处理的字符、待拼接字符以及已处理字符拼接成的词汇,所述历史动作序列为对应时间步之前的时间步确定的动作序列。3.根据权利要求2所述的方法,其特征在于,所述基于所述描述文本在各个时间步中的状态信息以及各个时间步对应的历史动作序列,确定所述描述文本的动作序列包括:在任一时间步i中,确定所述描述文本在所述时间步i的状态信息,其中,i为正整数;获取在时间步i

1确定的历史动作序列;基于所述描述文本在所述时间步i的状态信息以及在所述时间步i

1确定的历史动作序列,确定所述时间步i对应的动作;将所述时间步i对应的动作添加至在所述时间步i

1确定的历史动作序列中,得到所述时间步i对应的动作序列。4.根据权利要求3所述的方法,其特征在于,所述基于所述描述文本在所述时间步i的状态信息以及在所述时间步i

1确定的历史动作序列,确定所述时间步i对应的动作包括:基于所述描述文本的词汇集合、第一字符集合、第二字符集合以及在所述时间步i

1确定的历史动作序列中的第一个动作,确定所述时间步i对应的动作,所述词汇集合包括在所述时间步i时已处理字符拼接成的词汇,所述第一字符集合包括在所述时间步i时待拼接的字符,所述第二字符集合包括在所述时间步i时所述描述文本中未处理的字符。5.根据权利要求4所述的方法,其特征在于,所述基于所述描述文本的词汇集合、第一字符集合、第二字符集合以及在所述时间步i

1确定的历史动作序列中的第一个动作,确定所述时间步i对应的动作包括:将所述词汇集合中的前两个词汇、所述第一字符集合中的第一个字符、所述第二字符集合中的第一个字符以及在所述时间步i

1确定的历史动作序列中的第一个动作,拼接为所述时间步i的第一状态矩阵;采用预设的第一权重矩阵和预设的第一偏置矩阵对所述第一状态矩阵进行处理,得到所述时间步i的第二状态矩阵;采用第一激活函数对所述第二状态矩阵进行处理,得到所述时间步i对应的动作。6.根据权利要求2所述的方法,其特征在于,所述动作序列中的动作包括下述至少一
项:字符删除,用于删除所述描述文本中未处理的字符中的第一个字符;字符转换,用于将所述描述文本中未处理的字符中的第一个字符转换为待拼接的字符;字符拼接,用于将至少两个待拼接的字符拼接为词汇;词汇转换,用于将已处理字符拼接成的词汇确定为部分感受词;词汇拼接,用于将至少两个部分感受词拼接为完整的感受词;感受词转换,用于将完整的感受词确定为所述目标对象的感受词。7.根据权利要求1所述的方法,其特征在于,所述基于所述描述文本、所述感受词的语义特征、多个候选词的语义特征以及所述动作序列,确定目标词包括:基于所述描述文本,获取所述描述文本中所述感受词的左侧词汇与所述感受词之间的第一上下文特征,以及所述描述文本中所述感受词的右侧词汇与所述感受词之间的第二上下文特征;基于所述第一上下文特征、所述第二上下文特征、所述感受词的语义特征...

【专利技术属性】
技术研发人员:张子恒许茜
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1