【技术实现步骤摘要】
自组装属性提取方法及装置
[0001]本申请涉及计算机
,尤其涉及一种自组装属性提取方法、装置、存储介质及计算机设备。
技术介绍
[0002]自组装是指基本结构单元自发形成有序结构的技术,例如在一定条件下,纳米材料会自发地组织或聚集为一个稳定且具有规则几何外观的结构。近年来,随着人们对自组装技术的不断探索,基于自组装技术而得到的自组装结构也越来越多,涉及自组装结构的文献数量也迎来了较大的增长。
[0003]然而,目前尚未存在能够自动提取自组装结构属性的方法,因此,在获取自组装结构属性的过程中,需要通过人工的方式来阅读各篇文献并从文献中提取出相关自组装结构的属性。由此可见,现有方法存在提取效率低的问题。
技术实现思路
[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中自组装属性提取效率低的技术缺陷。
[0005]第一方面,本申请实施例提供了一种自组装属性提取方法,该方法包括:获取待提取文本;从所述待提取文本中提取出自组装基本结构单元的名称字段;根据所述名称字段和预设的各个属性关键词对所述待提取文本进行文本匹配,并根据文本匹配的结果从所述待提取文本中提取出自组装属性的属性字段以及生成名称属性映射关系。
[0006]第二方面,本申请实施例提供了一种自组装属性提取装置,该装置包括:文本获取模块,用于获取待提取文本;名称字段提取模块,用于从所述待提取文本中提取出自组装基本结构单元的名称字段;属性字段提取模块,用于根据所述名称字段和预设的各个属性关键词对所述待 ...
【技术保护点】
【技术特征摘要】
1.一种自组装属性提取方法,其特征在于,所述方法包括:获取待提取文本;从所述待提取文本中提取出自组装基本结构单元的名称字段;根据所述名称字段和预设的各个属性关键词对所述待提取文本进行文本匹配,并根据文本匹配的结果从所述待提取文本中提取出自组装属性的属性字段以及生成名称属性映射关系。2.根据权利要求1所述的自组装属性提取方法,其特征在于,所述待提取文本包括多个文本语句;所述从所述待提取文本中提取出自组装基本结构单元的名称字段的步骤,包括:在各个所述文本语句中确定第一目标语句;采用预设的分词规则分别对每个所述第一目标语句进行分词,以得到多个第一字符块;针对每个所述第一字符块,计算该第一字符块所对应的特定字符占比,若根据该第一字符块所对应的特定字符占比,确定该第一字符块为名称字段字符块,则提取该第一字符块记录的字符信息作为所述名称字段。3.根据权利要求2所述的自组装属性提取方法,其特征在于,所述特定字符占比为大写字母占比;所述若根据该第一字符块所对应的特定字符占比,确定该第一字符块为名称字段字符块,则提取该第一字符块记录的字符信息作为所述名称字段的步骤,包括:当该第一字符块所对应的大写字母占比大于或等于预设比例阈值时,确定该第一字符块为所述名称字段字符块,并提取该第一字符块记录的字符信息作为所述名称字段。4.根据权利要求2或3所述的自组装属性提取方法,其特征在于,所述在各个所述文本语句中确定第一目标语句的步骤,包括:根据预设的各个基本结构单元类型关键词,分别对每个所述文本语句进行文本匹配,以在各个所述文本语句中确定所述第一目标语句;其中,每个所述第一目标语句为记录有至少一个所述基本结构单元类型关键词的文本语句。5.根据权利要求1所述的自组装属性提取方法,其特征在于,所述待提取文本包括多个文本语句,各个所述属性关键词包括各个自组装属性的属性类型关键词;所述根据所述名称字段和预设的各个属性关键词对所述待提取文本进行文本匹配,并根据文本匹配的结果从所述待提取文本中提取出自组装属性的属性字段以及生成名称属性映射关系的步骤,包括:根据各个所述属性类型关键词对每个所述文本语句进行文本匹配,以在各个所述文本语句中确定记录有至少一个所述属性类型关键词的第二目标语句;针对每个所述第二目标语句,基于所述名称字段和目标关键词对该第二目标语句进行文本匹配,以判断该第二目标语句中是否记录有所述名称字段和对应于所述目标关键词的属性字段,若是,则从该第二目标语句中提取出所述属性字段,并根据所述属性字段和所述名称字段生成所述名称属性映射关系,其中,所述目标关键词为该第二目标语句记录的所述属性类型关键词。6.根据权利要求5所述的自组装属性提取方法,其特征在于,所述根据所述名称字段和
预设的各个属性关键词对所述待提取文本进行文本匹配,并根据文本匹配的结果从所述待提取文本中提取出自组装属性的属性字段以及生成名称属性映射关系的步骤,还包括:针对每个所述第二目标语句,若该第二目标语句未记录有所述名称字段和所述目标关键词对应的属性字段,则将该第二目标语句、该第二目标语句前方相邻的N个文本语句和后方相邻的N个文本语句作为待匹配语句集合,并根据所述名称字段和所述目标关键词对所述待匹配语句集合进行文本匹配,以判断所述待匹配语句集合是否记录有所述名称字段和对应于所述目标关键词的属性字段,若是,则从所述待匹配语句集合中提取出所述属性字段,并根据所述属性字段和所...
【专利技术属性】
技术研发人员:曹娜娜,王会,李华伟,黄康龙,汪亮,赵笑笑,郭令举,任红轩,施兴华,赵宇亮,
申请(专利权)人:广东粤港澳大湾区国家纳米科技创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。