【技术实现步骤摘要】
结构化数据的生成方法、装置、可读介质和电子设备
[0001]本专利技术涉及计算机
,尤其涉及一种结构化数据的生成方法、装置、可读介质和电子设备。
技术介绍
[0002]医学自然语言文本在临床研究、科学探索中无法被直接使用,需要被医学工作者转换为结构化数据之后,才能够用于进行临床研究、科学探索。
[0003]随着社会的发展,人工智能技术逐渐地走进了我们的生活和工作中,人工智能技术在一定程度上能够帮助医生和科研工作者完成上述科研工作。
[0004]但是由于每一家医院都有各自的规定,每一个医生都有自己的书写习惯,这就导致不同的医院的病例会有自己的规律,无法进行统一。实际上也很难让所有的医生都按照相同的规定、格式来书写病历,从而达到比较统一的规律,因此目前病例的结构化效果较差。
技术实现思路
[0005]本专利技术提供了一种结构化数据的生成方法、装置和可读介质、电子设备,基于两个实体之间存在的至少两个逻辑关系和所述至少两个逻辑关系的触发方式,保证了自然语言文本的结构化效果。
[0006] ...
【技术保护点】
【技术特征摘要】
1.一种结构化数据的生成方法,其特征在于,所述方法包括:从自然语言文本中获取第一实体数据和第二实体数据;判断所述第一实体数据和所述第二实体数据是否满足预设的至少两个逻辑关系和所述至少两个逻辑关系的触发方式;响应于所述第一实体数据和所述第二实体数据满足所述至少两个逻辑关系和所述触发方式,生成所述自然语言文本对应的结构化数据。2.根据权利要求1所述的生成方法,其特征在于,在获取所述第一实体数据和所述第二实体数据之前,所述方法还包括:获取多个所述自然语言文本的样例;获取各所述样例中的第三实体数据和第四实体数据;基于各所述样例中的第三实体数据和第四实体数据,建立所述至少两个逻辑关系。3.根据权利要求2所述的生成方法,其特征在于,所述基于各所述样例中的第三实体数据和第四实体数据,建立所述至少两个逻辑关系,包括:基于各所述样例中,所述第三实体数据和所述第四实体数据的排序关系,建立所述逻辑关系;和/或,基于各所述样例中,所述第三实体数据和所述第四实体数据的分布关系,建立所述逻辑关系,所述分布关系用于确定所述第三实体数据和所述第四实体数据是否分布在同一语句中。4.根据权利要求2所述的生成方法,其特征在于,在建立了至少两个逻辑关系之后,在获取所述第一实体数据和所述第二实体数据之前,所述方法还包括:确定所述至少两个逻辑关系的触发方式。5.根据权利要求4所述的生成方法,其特征在于,所述触发方式包括:第一触发方式,其设置成使所述至少两个逻辑关系都被满足;和/或,第二触发方式,其设置成使所述至少两个逻辑关系按照优先级高低的顺序...
【专利技术属性】
技术研发人员:杜梦玲,魏娟,李红杰,刘水清,
申请(专利权)人:南京懿医云大数据科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。