【技术实现步骤摘要】
医学文献评价方法、电子设备、存储介质和程序产品
[0001]本专利技术涉及文本分析
,尤其涉及一种医学文献评价方法、电子设备、存储介质和程序产品。
技术介绍
[0002]NLP(natural language processing,自然语言处理)是计算机科学领域与人工智能领域中的一个重要方向,其包括人与计算机之间用自然语言进行有效通信的各种理论和方法。
[0003]随着NLP技术的发展,尤其是BERT(Bidirectional Encoder Representation from Transformers)预训练模型发布之后,基于BERT做文本任务质量更高、效率更高。而在生物医学领域上,由于生物医学文本数据的特殊性,普通的文本挖掘方法不能很好的处理这些医学词汇,基于此,提出生物医学预训练模型(PubMedBERT),以实现生物医学领域的文本任务。
[0004]然而,现有技术中并未采用NLP技术对医学文献进行质量评价,更谈不上利用生物医学预训练模型对医学文献进行质量评价。而不采用NLP技术进行医学文 ...
【技术保护点】
【技术特征摘要】
1.一种医学文献评价方法,其特征在于,包括:获取待评价医学文献的待评价文本;将所述待评价文本输入至质量评价模型,进行质量评价,获得所述质量评价模型输出的质量评价结果,所述质量评价模型是基于句向量相似度结果训练得到的,所述句向量相似度结果是对孪生网络结构的句向量生成模型生成的句向量进行相似度计算得到的,所述句向量生成模型包括生物医学预训练模型。2.根据权利要求1所述的医学文献评价方法,其特征在于,还包括所述质量评价模型的训练方法:获取作为训练数据的第一句子文本和第二句子文本,将所述第一句子文本和所述第二句子文本输入至孪生网络结构的句向量生成模型,进行特征提取,获得所述第一句子文本对应的第一句向量和所述第二句子文本对应的第二句向量,所述句向量生成模型包括生物医学预训练模型;对所述第一句向量和所述第二句向量进行相似度计算,获得句向量相似度结果;基于所述句向量相似度结果,对待训练模型进行训练得到质量评价模型。3.根据权利要求2所述的医学文献评价方法,其特征在于,所述句向量生成模型包括第一句向量生成子模型和第二句向量生成子模型,所述将所述第一句子文本和所述第二句子文本输入至孪生网络结构的句向量生成模型,进行特征提取,获得所述第一句子文本对应的第一句向量和所述第二句子文本对应的第二句向量,包括:将所述第一句子文本输入至所述第一句向量生成子模型,进行特征提取,获得所述第一句向量生成子模型输出的第一句向量;将所述第二句子文本输入至所述第二句向量生成子模型,进行特征提取,获得所述第二句向量生成子模型输出的第二句向量。4.根据权利要求3所述的医学文献评价方法,其特征在于,所述第一句向量生成子模型包括生物医学预训练模型和池化层,所述将所述第一句子文本输入至所述第一句向量生成子模型,进行特征提取,获得所述第一句向量生成子模型输出的第一句向量,包括:将所述第一句子文本输入至所述生物医学预训练模型,进行特征提取,获得所述生物...
【专利技术属性】
技术研发人员:余晓霞,伍俊妍,何志超,朱建红,骆锦均,刘鹏,王则远,
申请(专利权)人:灵犀量子北京医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。