医疗领域的主体成分提取方法及装置制造方法及图纸

技术编号:16819077 阅读:47 留言:0更新日期:2017-12-16 12:30
本发明专利技术实施例提供的一种医疗领域的主体成分提取方法及装置,涉及医疗领域。所述方法包括获取待提取的语料;再将所述待提取的语料与预存的多个模板分别进行匹配,获取匹配成功的模板及所述匹配成功的模板对应的匹配结果;然后判断所述匹配成功的模板是否满足预设提取条件,若满足,获取满足预设提取条件的所述匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分,以此通过模板来匹配语料,提取出语料的主体成分,实现简单,快速高效。

Extraction method and device of main body component in medical field

The present invention provides a main body component extraction method and device for medical field, which relates to the medical field. The method includes obtaining extracted data; then the multiple template corpus extracted and stored separately, and the corresponding template matching results obtain successful matching template and the matching success; and then determine the successful matching template meets the preset extraction conditions, if met, access to meet the matching results of preset extraction conditions of the matching template corresponding to success, to the subject as the extraction corpus corresponding to the composition, as through the template to match the data, extract the main component, data is simple, fast and efficient.

【技术实现步骤摘要】
医疗领域的主体成分提取方法及装置
本专利技术涉及医疗领域,具体而言,涉及一种医疗领域的主体成分提取方法及装置。
技术介绍
在医疗领域中,机器能够自动识别出用户描述中的医疗相关的主体部位以及对应的状态(比如“我昨天肚子有点疼”,相应的主体部位以及状态(主体成分)为“肚子疼”)。这种识别过程称之为医疗主体成分抽取,属于关系抽取的范畴。现有技术中关系抽取采用基于规则的抽取方法通过领域专家定义描述规则来抽取关系,该方法需要大量人工标注数据,而且难以适应新领域;之后出现了基于机器学习的关系抽取方法,该方法流程复杂等。
技术实现思路
本专利技术的目的在于提供一种医疗领域的主体成分提取方法及装置,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:第一方面,本专利技术实施例提供了一种医疗领域的主体成分提取方法,所述方法包括:获取待提取的语料;将所述待提取的语料与预存的多个模板分别进行匹配,获取匹配成功的模板及所述匹配成功的模板对应的匹配结果;判断所述匹配成功的模板是否满足预设提取条件,若满足,获取满足预设提取条件的所述匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分。第二本文档来自技高网...
医疗领域的主体成分提取方法及装置

【技术保护点】
一种医疗领域的主体成分提取方法,其特征在于,所述方法包括:获取待提取的语料;将所述待提取的语料与预存的多个模板分别进行匹配,获取匹配成功的模板及所述匹配成功的模板对应的匹配结果;判断所述匹配成功的模板是否满足预设提取条件,若满足,获取满足预设提取条件的所述匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分。

【技术特征摘要】
1.一种医疗领域的主体成分提取方法,其特征在于,所述方法包括:获取待提取的语料;将所述待提取的语料与预存的多个模板分别进行匹配,获取匹配成功的模板及所述匹配成功的模板对应的匹配结果;判断所述匹配成功的模板是否满足预设提取条件,若满足,获取满足预设提取条件的所述匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分。2.根据权利要求1所述的方法,其特征在于,预存的多个模板为预存的按照长度排序的多个模板,将所述待提取的语料与预存的多个模板分别进行匹配,获取匹配成功的模板及所述匹配成功的模板对应的匹配结果,包括:将所述待提取的语料与所述预存的按照长度排序的多个模板按照顺序分别进行匹配,获取匹配成功的模板及所述匹配成功的模板对应的匹配结果。3.根据权利要求1所述的方法,其特征在于,所述预设提取条件包括所述匹配成功的模板中有一个匹配成功的模板,判断所述匹配成功的模板是否满足预设提取规则,若满足,获取满足预设提取条件的所述匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分,包括:判断所述匹配成功的模板中是否为一个匹配成功的模板,若是,输出所述一个匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分。4.根据权利要求1所述的方法,其特征在于,所述预设提取条件还包括所述匹配成功的模板中有至少两个匹配成功的模板,判断所述匹配成功的模板是否满足预设提取规则,若满足,获取满足预设提取条件的所述匹配成功的模板对应的匹配结果,以作为所述待提取的语料对应的主体成分,还包括:判断所述匹配成功的模板中是否有至少两个匹配成功的模板,若是,判断所述至少两个匹配成功的模板各自对应的匹配结果中是否存在输出长度最长的匹配结果,若存在输出长度最长的匹配结果,获取所述输出长度最长的匹配结果,以作为所述待提取的语料对应的主体成分。5.根据权利要求4所述的方法,其特征在于,判断所述至少两个匹配成功的模板各自对应的匹配结果中是否存在输出长度最长的匹配结果之后,所述方法还包括:若不存在输出长度最长的匹配结果,判断所述至少两个匹配成功的模板中是否存在全成分模板,若...

【专利技术属性】
技术研发人员:熊子奇姚佳
申请(专利权)人:深圳市空谷幽兰人工智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1