System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 评价平行设计随机对照研究偏倚风险的机器学习系统及方法技术方案_技高网

评价平行设计随机对照研究偏倚风险的机器学习系统及方法技术方案

技术编号:40459967 阅读:8 留言:0更新日期:2024-02-22 23:15
本发明专利技术提供一种评价平行设计随机对照研究偏倚风险的机器学习系统及方法,由2个子系统(C系统和R系统)实现功能,通过建立数据集,数据预处理,检索到的期刊发表的RCT文章上传至C系统,由C系统自动生成CONSORT查检清单,将已获取的该RCT文章的结构化内容进入R系统,由R系统根据ROB 2.0中算法流程图回答五个领域相应信号问题,最后形成对RCT文章的偏倚风险评估报告和最终评估结果。本申请通过机器学习系统可以实现自动生成平行设计随机对照研究偏倚风险评估报告及评估结果,评价结果较为全面和准确,极大地提高了数据分析的有效性,能提供更为确切、同质化的RCT偏倚风险评估结果。

【技术实现步骤摘要】

本专利技术属于机器学习系统,具体涉及到评价平行设计随机对照研究偏倚风险的机器学习系统及方法


技术介绍

1、临床试验报告标准(consolidated standards of reporting trials,consort)声明包含一份25个主条目(部分条目含子条目,总条目数为37)的查检清单和一张流程图,它是一套随机对照临床试验的报告规范,以提高随机对照临床试验(randomizedcontrolled trial,rct)的报告质量,减少因报告不完整和不透明而导致无法对临床试验质量进行评估。rct文献符合consort声明中查检清单的各条目将有效提高对质量进行严格评估的可行性。cochrane偏倚风险评估工具(cochrane collaboration’s tool forassessing risk of bias in randomized trials,rob)是制作系统综述时常用的主流rct偏倚风险评估工具,rob 2.0是cochrane工作组于2016年在项目网站上发布,并在2019年修订后的版本,包含5个评价领域,每个领域中有若干信号问题,同时为每个领域内的偏倚风险评估设置了一套算法流程图,在确定领域内所有信号问题的答案后,可使用其提供的算法流程图评估各领域内的偏倚风险。

2、进行rct偏倚风险评估有助于正确评估治疗效果,指导医疗卫生决策的制定方向,consort查检清单则是使用rob2.0评估工具进行rct文献偏倚风险评估的基础。然而,使用rob2评估工具需要评估者具备一定的临床研究设计和流行病学基础,耗时长,加之医学数据库中rct文献海量存在,且存在不同评估者因研究经验和知识储备不同而导致评估结果异质性大。因此基于consort的查检清单(checklist)和rob2.0开发一个机器学习系统,实现自动生成rct偏倚风险评估报告及评估结果重要且紧急。平行设计rct是rct的最常见类型,其评估工具是整个rob2.0工具的基础,交叉设计和整群设计的工具均是在此基础上扩展而来的,因此,能够先实现平行设计rct的自动化评估是关键所在。


技术实现思路

1、本专利技术提供一种自动评价平行设计随机对照研究偏倚风险的机器学习系统及方法,具体采用了如下技术方案:

2、一种评价平行设计随机对照研究偏倚风险的机器学习系统,包括:

3、c系统,该部分是基于临床试验报告标准(consolidated standards ofreportingtrials,consort)查检清单开发,主要任务是抽取随机对照临床试验(randomisedcontrolled trial,rct)中每个consort条目对应的相关句子。部分文本内容采用正则化方法进行判别,其中关键词列表由2位临床流行病专家根据若干篇rct文献内容及流行病学经典专著进行提取汇总形成词典,检查条目相对应句子中文本是否符合规则或包含词典中的内容;针对无法利用正则化方法进行判别的文本内容,利用深度学习进行语义分析。针对表格内容,提出结合gpt-3.5将每个单元的层次结构、位置信息和内容编码为一个元组。通过利用每个元组含义和任务逻辑推理过程的解释性描述来增强提示模板进行解析。采用biobert对每个条目相对应句子的信息进行特征提取,将提取到的特征向量直接输入softmax层进行计算,输出预测的条目标签类别,若不符合任意条目标签类别则输出类别为“0”;

4、r系统,该部分基于cochrane偏倚评估工具2.0版本(rob 2.0)开发,主要进行面向医学领域的文本语义分析与文本分类任务,根据rob 2各领域问题与consort条目之间的对应关系,合并支持rob 2每个问题的所有提取到的语句,将该合并文本作为判断每个问题的输入,同c系统中基于深度学习的算法类似,采用biobert获取文本特征向量,通过一个分类层进行文本分类,得到rob 2每个问题的答案后,根据模块的路径图中的判断规则对每个领域进行风险判断。

5、进一步地,该机器学习系统的构建方法,包括如下步骤:

6、s1:建立数据集,确定用于训练、测试和验证r系统和c系统的期刊和文章;

7、s2:进行数据预处理,包括文本预处理、小节划分以及表格预处理等过程;

8、s3:将检索到的期刊发表的rct文章上传至c系统,由c系统自动生成consort查检清单;

9、s4:s1中已获取的该rct文章的结构化内容进入r系统,由r系统根据rob 2中算法规则回答五个领域相应信号问题;

10、s5:形成对rct文章的偏倚风险评估报告和最终评估结果。

11、进一步地,所述步骤s3具体实现流程如下:

12、a.期刊写作结构分析,登录相关期刊网站,选择量化指南模块,获取期刊对于rct文章体例要求,

13、b.用python爬取文献内容,分解结构内容,

14、c.形成相应数据集,包括形成标注后数据集以及形成consort-tr数据集,

15、d.训练c系统,使用公开发布的consort-tm数据集(包含50篇标准后的rct文献,文献来源于11本q1期刊,覆盖医学大类,消化科,风湿科,外科,内分泌代谢科,心脏心血管科,呼吸科,儿科),进行rct文献的流程图解析、表格解析和文本分析(由chatgpt增强的深度学习及chatgpt零样本学习完成),获得训练好的模型、对照consort2010查检清单对rct文献数据集中文献进行对应内容的自动抽取,实现智能化生成每篇文献的consort2010查检清单。

16、进一步地,所述步骤s4具体实现流程如下:

17、a.将c系统获取的consort条目内容归类到rob 2中相应领域以分析具体信号问题;

18、b.建立随机对照研究知识库,解决文章内容中出现何种语句可按rob 2算法建议判定为是(yes,y),可能是(probably yes,py),可能否(probably no,pn),否(no,n),不可知(no information,ni);

19、c.基于rob 2的算法建议,随机对照研究知识库及consort查检清单内容建立每个领域的判断,具体领域包括:

20、领域1:随机化过程中的偏倚;

21、领域2:偏离既定干预的偏倚(干预依从)、偏离既定干预的偏倚(干预分配);

22、领域3:结局数据缺失的偏倚;

23、领域4:结局测量的偏倚;

24、领域5:结局选择性报告的偏倚。

25、进一步地,所述步骤s5形成rct文章的偏倚风险评估报告和最终评估结果具体如下:

26、如果五个模块中的偏倚评价均为低风险,则该文章整体偏倚评价为低风险;

27、如果五个模块均未被评估为高偏倚风险,但任一模块的评价结果为可能存在风险,则整体评价为有一定风险;

28、如果五个模块中任一模块被评估为本文档来自技高网...

【技术保护点】

1.一种评价平行设计随机对照研究偏倚风险的机器学习系统,其特征在于,包括:

2.一种评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,包括如下步骤:

3.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤S3具体实现流程如下:

4.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤S4具体实现流程如下:

5.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤S5形成RCT文章的偏倚风险评估报告和最终评估结果具体如下:

6.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤S2中,数据预处理的文本预处理、小节划分以及表格预处理过程具体如下:

7.根据权利要求4所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述建立随机对照研究知识库的过程包括:提出研究问题,确定纳入文献资源,对文献提取内容以“随机方法”,“盲法”,“统计学和结果分析方法”为一级主题进行归纳和去重,和提炼下一级主题及内容,形成随机对照研究知识库知识库初稿,初稿的信度检验,最后根据德尔菲专家函询法确定随机对照研究知识库内容。

...

【技术特征摘要】

1.一种评价平行设计随机对照研究偏倚风险的机器学习系统,其特征在于,包括:

2.一种评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,包括如下步骤:

3.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤s3具体实现流程如下:

4.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤s4具体实现流程如下:

5.根据权利要求2所述的评价平行设计随机对照研究偏倚风险的机器学习系统的构建方法,其特征在于:所述步骤s5形成rct文章的偏倚风险评估报告和最...

【专利技术属性】
技术研发人员:张晓波冯瑞张玥杰张崇凡王颖雯长凯博文何雯傅唯佳王青
申请(专利权)人:复旦大学附属儿科医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1