一种基于多模态信息的舌象识别方法、装置及电子设备制造方法及图纸

技术编号：40504677 阅读：4 留言：0更新日期：2024-03-01 13:18

本说明书公开了一种基于多模态信息的舌象识别方法、装置及电子设备。所述方法包括：获取用户的舌体图像和病症信息，病症信息包括病症主诉、症状以及体征；将舌体图像以及病症信息输入舌象识别模型，确定舌体图像对应的图像特征以及病症信息对应的文本特征；根据预设的舌诊知识图谱，确定病症实体与舌象实体之间的对应关系，并获取基于该对应关系所确定图谱特征；将图像特征、文本特征以及图谱特征进行融合，得到目标舌象特征，以根据目标舌象特征进行舌象识别。本方案通过对多模态信息进行整合，有效提升了舌象识别结果的准确性以及可靠性。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书涉及计算机，尤其涉及一种基于多模态信息的舌象识别方法、装置及电子设备。

技术介绍

1、舌诊为中医四诊中“望诊”的主要内容，通过观察患者舌象状况来诊断患者病情。舌诊包括望舌苔和望舌质，舌质指舌的本体，舌苔指舌体表面的附着物。中医医师观察患者舌象时，主要观察舌体颜色、神态以及舌苔的位置和颜色，来推测健康状况和疾病发展。

2、传统舌诊主要通过医生直接观察舌象，很大程度上依赖于医生的主观判断，容易受到医生的知识水平、思维模式和诊断技术的限制，并且在不同医生之间的重复性也较差，在一定程度上限制了舌诊技术的临床应用。而随着计算机成像技术的发展，数字图像识别技术已被广泛应用于智能舌诊中，为客观舌诊的应用提供了便利条件。

3、然而，现有舌象识别方法并不符合中医舌诊整体观诊断思想，其准确性较低，无法全面评估舌象的综合状况，难以为临床上的舌象诊断提供可靠的参照。

4、因此，如何准确的进行舌象识别，进一步保证临床诊断的可靠性，是一个亟待解决的问题。

技术实现思路

1、本说明书提供一种基于多模态信息的舌象识别方法、装置及电子设备，以部分的解决现有技术存在的上述问题。

2、本说明书采用下述技术方案：

3、本说明书提供了一种基于多模态信息的舌象识别方法，包括：

4、接收舌象识别请求；

5、根据所述舌象识别请求，获取用户的舌体图像和病症信息，所述病症信息包括所述用户的病症主诉、症状信息以及体征信息；

6、将所

7、根据预设的舌诊知识图谱，确定所述病症实体与舌象实体之间的对应关系，并获取基于所述对应关系所确定图谱特征；

8、将所述图像特征、所述文本特征以及所述图谱特征进行融合，得到目标舌象特征，以根据所述目标舌象特征进行舌象识别。

9、可选地，根据所述舌象识别请求，获取用户的舌体图像，具体包括：

10、获取原始图像；

11、在所述原始图像中提取舌体区域的图像，得到所述舌体图像。

12、可选地，将所述图像特征、所述文本特征以及所述图谱特征进行融合，得到目标舌象特征，具体包括：

13、将所述文本特征与所述图像特征进行融合，得到第一融合特征，以及，将所述图像特征与所述图谱特征进行融合，得到第二融合特征；

14、根据所述第一融合特征以及所述第二融合特征，确定所述目标舌象特征。

15、可选地，将所述文本特征与所述图像特征进行融合，得到第一融合特征，具体包括：

16、通过所述舌象识别模型中的第一特征融合网络，确定第一注意力权重，所述第一注意力权重用于表征述文本特征与所述图像特征之间的关联程度；

17、基于所述第一注意力权重，将所述文本特征与所述图像特征进行融合，得到所述第一融合特征。

18、可选地，基于所述第一注意力权重，将所述文本特征与所述图像特征进行融合，得到所述第一融合特征，具体包括：

19、确定所述图像特征对应的查询向量以及所述文本特征对应的键向量和值向量；

20、根据所述第一注意力权重、所述图像特征对应的查询向量以及所述文本特征对应的键向量和值向量，确定所述第一融合特征。

21、可选地，将所述图像特征与所述图谱特征进行融合，得到第二融合特征，具体包括：

22、通过所述舌象识别模型中的第二特征融合网络，确定第二注意力权重，所述第二注意力权重用于表征所述图谱特征与所述图像特征之间的关联程度；

23、基于所述第二注意力权重，将所述图谱特征与所述图像特征进行融合，得到所述第二融合特征。

24、可选地，所述图谱特征包括：实体嵌入特征以及用于表征实体间关系的关系嵌入特征；

25、基于所述第二注意力权重，将所述图谱特征与所述图像特征进行融合，得到所述第二融合特征，具体包括：

26、确定所述图像特征对应的查询向量以及所述实体嵌入特征对应的键向量和值向量；

27、根据所述第二注意力权重、所述图像特征对应的查询向量、所述关系嵌入特征以及所述实体嵌入特征对应的键向量和值向量，确定所述第二融合特征。

28、可选地，训练所述舌象识别模型，具体包括：

29、获取训练样本，所述训练样本包括指定用户的历史舌体图像和历史病症信息；

30、将所述历史舌体图像以及所述历史病症信息输入待训练的舌象识别模型中，以通过所述舌象识别模型，提取所述历史病症信息中包含的历史病症实体，并确定所述历史舌体图像对应的历史图像特征以及所述历史病症信息对应的历史文本特征；

31、根据所述舌诊知识图谱，确定所述历史病症实体与舌象实体之间的对应关系，并获取基于所述历史病症实体与舌象实体之间的对应关系所确定历史图谱特征；

32、将所述历史图像特征、所述历史文本特征以及所述历史图谱特征进行融合，得到历史舌象特征，并根据所述历史舌象特征进行舌象识别，得到舌象识别结果；

33、以最小化所述舌象识别结果与所述指定用户的实际舌象类型之间的偏差为优化目标，对所述舌象识别模型进行训练。

34、可选地，所述方法还包括：

35、根据舌象识别结果，对所述用户的病症进行诊断，其中，所述舌象识别结果包括：舌体的舌质类型以及舌苔类型。

36、本说明书提供了一种基于多模态信息的舌象识别装置，包括：

37、接收模块，接收舌象识别请求；

38、获取模块，根据所述舌象识别请求，获取用户的舌体图像和病症信息，所述病症信息包括所述用户的病症主诉、症状信息以及体征信息；

39、输入模块，将所述舌体图像以及所述病症信息输入预先训练的舌象识别模型中，以通过所述舌象识别模型，提取所述病症信息中包含的病症实体，并确定所述舌体图像对应的图像特征以及所述病症信息对应的文本特征；

40、确定模块，根据预设的舌诊知识图谱，确定所述病症实体与舌象实体之间的对应关系，并获取基于所述对应关系所确定图谱特征；

41、识别模块，将所述图像特征、所述文本特征以及所述图谱特征进行融合，得到目标舌象特征，以根据所述目标舌象特征进行舌象识别。

42、本说明书提供了一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于多模态信息的舌象识别方法。

43、本说明书提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述基于多模态信息的舌象识别方法。

44、本说明书采用的上述至少一个技术方案能够达到以下有益效果：

45、在本说明书提供的基于多模态信息的舌本文档来自技高网...

【技术保护点】

1.一种基于多模态信息的舌象识别方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，根据所述舌象识别请求，获取用户的舌体图像，具体包括：

3.如权利要求1所述的方法，其特征在于，将所述图像特征、所述文本特征以及所述图谱特征进行融合，得到目标舌象特征，具体包括：

4.如权利要求3所述的方法，其特征在于，将所述文本特征与所述图像特征进行融合，得到第一融合特征，具体包括：

5.如权利要求4所述的方法，其特征在于，基于所述第一注意力权重，将所述文本特征与所述图像特征进行融合，得到所述第一融合特征，具体包括：

6.如权利要求3所述的方法，其特征在于，将所述图像特征与所述图谱特征进行融合，得到第二融合特征，具体包括：

7.如权利要求6所述的方法，其特征在于，所述图谱特征包括：实体嵌入特征以及用于表征实体间关系的关系嵌入特征；

8.如权利要求1所述的方法，其特征在于，训练所述舌象识别模型，具体包括：

9.如权利要求1所述的方法，其特征在于，所述方法还包括：

10.一种基于多

11.一种计算机可读存储介质，其特征在于，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述权利要求1~9任一项所述的方法。

12.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现上述权利要求1~9任一项所述的方法。

...

【技术特征摘要】

1.一种基于多模态信息的舌象识别方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，根据所述舌象识别请求，获取用户的舌体图像，具体包括：

3.如权利要求1所述的方法，其特征在于，将所述图像特征、所述文本特征以及所述图谱特征进行融合，得到目标舌象特征，具体包括：

4.如权利要求3所述的方法，其特征在于，将所述文本特征与所述图像特征进行融合，得到第一融合特征，具体包括：

5.如权利要求4所述的方法，其特征在于，基于所述第一注意力权重，将所述文本特征与所述图像特征进行融合，得到所述第一融合特征，具体包括：

6.如权利要求3所述的方法，其特征在于，将所述图像特征与所述图谱特征进行融合，得到第二融合特征，具体包括...

【专利技术属性】
技术研发人员：张建峰，李劲松，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人