一种基于自然语言处理的疾病风险预测方法及系统技术方案

技术编号：45081490 阅读：19 留言：0更新日期：2025-04-25 18:20

本发明专利技术提供了一种基于自然语言处理的疾病风险预测方法及系统，涉及基于语义识别的疾病风险预测技术领域，目的是实现在疾病风险预测中对矛盾语句进行有效识别与处理，包括获取病患的日常问诊数据；将日常问诊数据中病患的每句语句分别转换为语句向量组，将语句的每个词分别转换为词向量；通过第一语义模型进行矛盾语句识别，提取出矛盾语句对，每对矛盾语句对包括两句相互矛盾语句；获取病患的病历数据，基于病历数据为矛盾语句的语句向量嵌入可信度；将嵌入可信度的矛盾语句放回日常问诊数据得到可信度标注数据，通过第二语义模型基于日常问诊数据进行疾病风险预测。本发明专利技术具有提升疾病风险预测的可靠性和效率的优点。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及基于语义识别的疾病风险预测，具体而言，涉及一种基于自然语言处理的疾病风险预测方法及系统。

技术介绍

1、在疾病风险预测领域，日常问诊数据作为重要的健康信息来源，能够反映出病患的症状、行为习惯及身体状况。

2、通过日常的问诊数据判断病患的疾病发展情况是重要环节，也为医疗人员增加了很多工作负担。现有技术开始逐渐引入语义识别进行辅助处理，减小医护工作者的工作量并提升销量。然而，由于病患主观表达的局限性，日常问诊数据中常存在描述不准确甚至前后矛盾等问题。例如，病患可能在不同语句中分别表示“没有发烧”和“体温有点高”，这种矛盾表达容易导致疾病风险预测模型产生误判。现有疾病风险预测方法大多直接将病患的问诊数据输入到模型中分析，未充分考虑矛盾信息的识别与可信度评估，可能会引入噪声数据，降低疾病预测的准确率。

3、因此，需要对基于语义识别的疾病风险进行优化，实现在疾病风险预测中对矛盾语句进行有效识别与处理，提升疾病风险预测的可靠性。

技术实现思路

1、本专利技术的目的...

【技术保护点】

1.一种基于自然语言处理的疾病风险预测方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于自然语言处理的疾病风险预测方法，其特征在于，所述日常问诊数据通过周期性对病患进行问诊，并记载病患的自述病症。

3.根据权利要求1所述的一种基于自然语言处理的疾病风险预测方法，其特征在于，所述通过第一语义模型进行矛盾语句识别的方法为：

4.根据权利要求3所述的一种基于自然语言处理的疾病风险预测方法，其特征在于，获取第i个语句的语句向量和第j个语句的语句向量的相似度的方法为获取余弦相似度：

5.根据权利要求4所述的一种基于自然语言处理的疾病风...

【技术特征摘要】

1.一种基于自然语言处理的疾病风险预测方法，其特征在于，包括以下步骤：

3.根据权利要求1所述的一种基于自然语言处理的疾病风险预测方法，其特征在于，所述通过第一语义模型进行矛盾语句识别的方法为：

5.根据权利要求4所述的一种基于自然语言处理的疾病风险预测方法，其特征在于，基于词向量组获取第i个语句和第j个语句的矛盾词个数的方法为：

6.根据权利要求5所述...

【专利技术属性】
技术研发人员：叶娟，罗彬，
申请(专利权)人：四川互慧软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人