基因序列的权利范围认定、检索及侵权判定方法、系统技术方案

技术编号:20548190 阅读:28 留言:0更新日期:2019-03-09 20:46
本说明书实施例提供一种基因序列的权利要求保护范围认定、检索及侵权判定方法、系统,其中,所述方法包括:从当前专利申请的权利要求书中识别基因序列;根据预设关键词从所述权利要求书中提取所述基因序列的描述文字;根据提取的所述描述文字,确定所述基因序列的相似度信息,并基于所述相似度信息标注所述基因序列的权利范围。本说明书实施例提供的技术方案,能够在专利库中进行序列检索,并提高基因序列的检索准确度。

【技术实现步骤摘要】
基因序列的权利范围认定、检索及侵权判定方法、系统
本说明书实施例涉及互联网
,特别涉及一种基因序列的权利范围认定、检索及侵权判定方法、系统。
技术介绍
目前,在对生物领域的基因序列进行检索时,检索引擎通常会接收用户提供的待检索的基因序列,然后将该待检索的基因序列与基因库中的基因序列进行比对,从基因库中查询出相关的基因序列。
技术实现思路
本说明书实施例的目的是提供一种基因序列的权利要求保护范围认定、检索及侵权判定方法、系统,能够在专利库中对基因序列进行检索。为实现上述目的,本说明书的一些实施例是这样实现的:一种基因序列的权利要求保护范围认定方法,所述方法包括:从当前专利申请的权利要求书中识别基因序列;根据预设关键词从所述权利要求书中提取所述基因序列的描述文字;根据提取的所述描述文字,确定所述基因序列的相似度信息,并基于所述相似度信息标注所述基因序列的权利要求保护范围。一种基因序列的权利要求保护范围认定系统,所述系统包括:基因序列识别单元,用于从当前专利申请的权利要求书中识别基因序列;描述文字提取单元,用于根据预设关键词从所述权利要求书中提取所述基因序列的描述文字;权利范围确定单元,用于根据提取的所述描述文字,确定所述基因序列的相似度信息,并基于所述相似度信息标注所述基因序列的权利要求保护范围。一种基因序列的检索方法,所述方法包括:获取待检索的基因序列;从专利库的专利申请中抓取文本基因序列,并将所述待检索的基因序列与抓取的所述文本基因序列进行比较,以确定与所述待检索的基因序列相似的目标基因序列;展示包含所述目标基因序列的专利申请的检索结果。一种基因序列的检索方法,所述方法包括:获取待检索的基因序列以及预设相似度阈值;基于所述预设相似度阈值,将所述待检索的基因序列拆分为多个基因子序列;分别对各个所述基因子序列在专利库中进行序列检索,以确定所述基因子序列对应的目标专利申请,并输出所述目标专利申请的检索结果。一种基因序列的侵权判定方法,所述方法包括:获取待检索的基因序列,并查询与所述待检索的基因序列相匹配的专利申请;所述专利申请中包含与所述待检索的基因序列相似的目标基因序列;从所述专利申请的权利要求书中提取包含所述目标基因序列的描述文字,并根据所述描述文字确定所述目标基因序列的权利范围;确定所述待检索的基因序列与所述目标基因序列之间的相似度,并比较所述相似度与所述目标基因序列的权利范围;根据比较结果,标注所述专利申请相对于所述待检索的基因序列的侵权风险信息。由以上可见,本说明书一个或多个实施例中,在获取到用户提供的待检索的基因序列后,首先可以按照基因序列之间的相似度,查询到与该待检索的基因序列相匹配的专利申请。具体地,可以从专利库的专利申请中抓取文本基因序列,并将该待检索的基因序列与抓取的所述文本基因序列进行比较,以确定与所述待检索的基因序列相似的目标基因序列。包含该目标基因序列的专利申请便可以作为与该待检索的基因序列相匹配的专利申请。在这些专利申请中,可以包括与待检索的基因序列相似的目标基因序列。然而,在侵权检索分析等场景中,仅提供基因序列相似度的检索结果是不够的。假设用户针对一个基因序列进行侵权检索分析,那么根据相似度检索出的专利申请中可能仅存在一个相似度为90%的目标基因序列,而没有完全一致的基因序列。然而,此时并不能认定该基因序列能够被自由使用。原因在于,检索得到的专利申请中包含的目标基因序列通常会有一个保护范围,该保护范围例如可以涵盖与专利申请中涉及的目标基因序列相似度在80%以上的基因序列。这样,由于待检索的基因序列与该目标基因序列的相似度为90%,实际上也落入了该专利申请的保护范围,因此依然会存在侵权可能。鉴于此,在本说明书中,在依据相似度检索得到专利申请之后,可以进一步地从该专利申请的权利要求书中提取包含所述目标基因序列的描述文字,并根据所述描述文字确定所述目标基因序列的保护范围。然后,可以将该专利申请对应的相似度以及保护范围一并在检索结果中展示,从而可以让用户比对相似度与保护范围之间的大小关系,进而判断待检索的基因序列是否有侵权可能。由上可见,本说明书一个或多个实施例提供的技术方案,不仅能够在专利库中对基因序列进行检索,还能够向用户提供更加丰富的检索信息,从而提高检索结果的准确度。附图说明为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本说明书提供的一种基因序列的权利要求保护范围认定方法流程图;图2是本说明书提供的识别目标基因序列的方法示意图;图3是本说明书提供的基因序列的权利要求保护范围认定系统的功能模块示意图;图4是本说明书提供的基因序列的权利要求保护范围认定系统的结构示意图;图5是本说明书提供的基因序列的检索方法示意图;图6是本说明书提供的检索结果页面的展示图;图7是本说明书提供的基因序列的相似度图谱示意图;图8是本说明书提供的基因序列发展进度图谱示意图;图9是本说明书提供的基因序列的检索方法示意图;图10是本说明书提供的基因序列的拆分示意图;图11是本说明书提供的基因序列的侵权判定方法流程图;图12是本说明书提供的基因序列的侵权判定系统的结构示意图。具体实施方式为了使本
的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。本申请提供一种基因序列的权利要求保护范围认定方法,所述方法可以应用于检索引擎中,请参阅图1,所述方法可以包括以下步骤。S11:从当前专利申请的权利要求书中识别基因序列。在本实施例中,针对专利库中已存在的与基因序列相关的专利申请,可以分别确定各个专利申请中,基因序列的权利范围。所述当前专利申请可以是待分析的专利申请,所述待分析的专利申请的权利要求书中记载的基因序列,可以作为当前待分析的目标基因序列。在本实施例中,可以按照图2所示的方式从当前专利申请的权利要求书中识别基因序列。具体地,基因序列通常是由一些简写的字母构成的字母序列。例如,字母A表示丙氨酸,字母R表示精氨酸,字母H表示组氨酸等。这样,若权利要求书中存在由连续的字母构成的字母序列,那么该字母序列有可能为基因序列。因此,可以通过文本匹配的方式,从当前专利申请的权利要求书中识别由指定字母构成的字母序列。其中,所述指定字母为基因序列的简写字母。这样,在识别出由指定字母构成的字母序列后,考虑到一般的基因序列往往会具备一定的长度。如果字母序列的长度较短,则可能只是普通的英文单词或者短语。鉴于此,可以进一步地对字母序列的长度进行判断,在所述字母序列的长度达到指定长度阈值时,可以将所述字母序列作为基因序列。其中,所述指定长度阈值可以是对大量的基因序列的长度进行统计后计算的平均值,也可以是在该平均值的基础上减去或者加上本文档来自技高网
...

【技术保护点】
1.一种基因序列的权利要求保护范围认定方法,其特征在于,所述方法包括:从当前专利申请的权利要求书中识别基因序列;根据预设关键词从所述权利要求书中提取所述基因序列的描述文字;根据提取的所述描述文字,确定所述基因序列的相似度信息,并基于所述相似度信息标注所述基因序列的权利要求保护范围。

【技术特征摘要】
1.一种基因序列的权利要求保护范围认定方法,其特征在于,所述方法包括:从当前专利申请的权利要求书中识别基因序列;根据预设关键词从所述权利要求书中提取所述基因序列的描述文字;根据提取的所述描述文字,确定所述基因序列的相似度信息,并基于所述相似度信息标注所述基因序列的权利要求保护范围。2.根据权利要求1所述的方法,其特征在于,从当前专利申请的权利要求书中识别基因序列包括:从当前专利申请的权利要求书中识别由指定字母构成的字母序列,并在所述字母序列的长度达到指定长度阈值时,将所述字母序列作为基因序列;或者从当前专利申请的权利要求书中识别序列标识,并从所述当前专利申请的序列表中读取所述序列标识对应的基因序列。3.根据权利要求1所述的方法,其特征在于,根据预设关键词从所述权利要求书中提取所述基因序列的描述文字包括:在所述权利要求书中识别所述基因序列所处的位置,并从识别出的所述位置的上下文中查找用于限定所述基因序列中部分子序列长度的长度标识;将所述长度标识作为预设关键词,截取包含所述长度标识和所述基因序列的语句,并将截取的所述语句作为所述基因序列的描述文字。4.根据权利要求1所述的方法,其特征在于,确定所述基因序列的相似度信息包括:在所述描述文字中识别所述基因序列对应的有效百分比,并将所述有效百分比作为所述基因序列的相似度信息;或者在所述描述文字中识别用于限定所述基因序列中基因子序列或核心功能序列所处位置的区域信息,并根据所述区域信息确定所述基因子序列或核心功能序列的长度;计算所述基因子序列或核心功能序列的长度在所述基因序列的总长度中所占的百分比,并将计算的所述百分比作为所述基因序列的相似度信息。5.一种基因序列的权利要求保护范围认定系统,其特征在于,所述系统包括:基因序列识别单元,用于从当前专利申请的权利要求书中识别基因序列;描述文字提取单元,用于根据预设关键词从所述权利要求书中提取所述基因序列的描述文字;权利范围确定单元,用于根据提取的所...

【专利技术属性】
技术研发人员:庞卡·库玛蔡洁马库斯·汉斯阿里·侯赛因
申请(专利权)人:智慧芽信息科技苏州有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1