【技术实现步骤摘要】
生命科学文档的自动分类和解释
[0001]相关申请的交叉引用
[0002]本申请是2020年12月4日提交的标题为“生命科学文档的自动分类和解释”的美国序列号17/112,322的部分继续申请,该申请是2020年10月14日提交的标题为“生命科学文档的自动分类和解释”的美国序列号17/070,533的部分继续申请,它是2019年3月1日提交的标题为“生命科学文档的自动分类和解释”的美国序列号16/289,729的继续申请,现为美国专利号10,839,205,其全部内容通过引用并入本文。
技术介绍
[0003]自动分类通常用于有效地管理文档中的文本、图像和非结构化信息。自动分类也称为归类、聚类或文本分类,通常使文档能够基于一组预定义的种类或类别进行划分和组织,以快速且轻松地检索信息。
技术实现思路
[0004]一种计算机实施的工具,用于自动分类和解释文档(诸如支持临床试验的生命科学文档),被配置为执行文本、文档结构和图像分析的组合,以通过实现对文档内容的更全面的基于机器的理解来提高分类准确性。与传统的自动分类工具相比,该 ...
【技术保护点】
【技术特征摘要】
1.一种计算机实施的方法,用于执行生命科学文档的质量审查,所述方法包括:通过移动设备扫描一个或更多个生命科学文档,其中所述一个或更多个生命科学文档被发送到数据库;检查所述一个或更多个生命科学文档的内容,其中,语言、图像、旋转和噪声是所述生命科学文档中检查的内容,其中在所述一个或更多个生命科学文档中检查相似性、可疑更改、文档布局和缺失部分;基于有关成像、旋转和噪声以及相似性、可疑更改、文档布局和缺失部分的内容,系统向所述生命科学文档的创始人发送反馈,其中所述反馈包括所述生命科学文档是否没有任何问题或者所述生命科学文档是否包括一个或更多个问题,其中所述系统为经过内容检查的生命科学文档提供ID;以及共享所述生命科学文档的编辑内容,其中识别需要潜在编辑的内容。2.根据权利要求1所述的计算机实施的方法,其中,所述内容检查包括检查隐私数据或至少一个有效签名。3.根据权利要求1所述的计算机实施的方法,其中,执行所述一个或更多个生命科学文档的可读性的检查。4.一种计算机实施的方法,用于执行自动反馈循环,所述方法包括:下载和更新用于多个分类器的监督学习的临床文档主数据集;更新每个临床文档的基本事实标签,其中随着所述临床文档的主数据集更新而更新所述基本事实标签;基于为所述临床文档的主数据集生成的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。