基于医学疾病数据的语音合成方法、装置及电子设备制造方法及图纸

技术编号:19323354 阅读:34 留言:0更新日期:2018-11-03 12:20
本发明专利技术提供了一种基于医学疾病数据的语音合成方法、装置及电子设备,涉及医疗领域,以缓解现有技术中无法对医学领域进行语音合成的问题,能够基于医学领域的图谱进行语音合成。该方法包括获取患者的医学诊断图谱;将医学诊断图谱与医学数据库的所有知识图谱进行对比,生成相似度值;根据相似度值对知识图谱进行排序,并将相似度值最高的知识图谱作为疑似诊断知识图谱;当疑似诊断知识图谱的相似度值大于预设阈值时,获取与疑似诊断知识图谱对应的文字诊断信息;利用医学文字模型对文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;将所述医学分词词语作为整体对所述文字诊断信息进行语音合成生成语音信息;将语音信息输出。

Speech synthesis method, device and electronic device based on medical disease data

The invention provides a speech synthesis method, device and electronic device based on medical disease data, which relates to the medical field, in order to alleviate the problem that the existing technology can not synthesize speech in the medical field, and can synthesize speech based on the atlas in the medical field. This method includes acquiring the medical diagnosis Atlas of patients; comparing the medical diagnosis atlas with all knowledge atlases of medical database to generate similarity value; sorting the knowledge atlas according to similarity value, and taking the knowledge atlas with the highest similarity value as the suspected diagnosis knowledge atlas; when the suspected diagnosis knowledge atlas When the similarity value is greater than the preset threshold, the text diagnostic information corresponding to the suspected diagnostic knowledge atlas is obtained; the text diagnostic information is recognized by the medical text model, and the medical words and expressions contained in the text diagnostic information are obtained; the medical words and phrases are used as a whole to synthesize the text diagnostic information. Cheng Shengcheng voice information; output speech information.

【技术实现步骤摘要】
基于医学疾病数据的语音合成方法、装置及电子设备
本专利技术涉及医疗
,尤其是涉及一种基于医学疾病数据的语音合成方法、装置及电子设备。
技术介绍
语音合成技术被广泛地用于现实生活中,如讯飞语音服务、百度语音服务等,均能为用户提供语音合成服务、语音搜索服务及其他服务。但这些技术并没有摆脱文字形式,在某些场合下并不方便,尤其是对于通常都是以图谱的形式存在的医学领域,上述语音合成技术并不能很好的适用。综上,针对医学领域的语音合成问题目前尚无有效的解决方案。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种基于医学疾病数据的语音合成方法、装置及电子设备,以缓解现有技术中存在的无法对医学领域进行语音合成的技术问题。第一方面,本专利技术实施例提供了一种基于医学疾病数据的语音合成方法,包括:获取患者的医学诊断图谱;将所述医学诊断图谱与医学数据库的所有知识图谱进行对比,生成相似度值;根据相似度值高低对知识图谱进行排序,并将相似度值最高的知识图谱作为疑似诊断知识图谱;将疑似诊断知识图谱的相似度值与预设阈值进行比较;当疑似诊断知识图谱的相似度值大于预设阈值时,获取与所述疑似诊断知识图谱对应的文字诊断信息;利用医学文字模型对所述文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;将所述语音信息输出。结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,该方法还包括:当疑似诊断知识图谱的相似度值小于预设阈值时,发送人工干预请求至目标医学专家,由目标医学专家补充知识图谱和文字诊断信息。结合第一方面,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,所述利用医学文字模型对所述文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;具体包括:利用医学文字模型对文字诊断信息进行提取、划分、停用词过滤、标注词性、分类和标签提取,得到文字诊断信息中包含的医学分词词语以及非医学分词词语。结合第一方面,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,所述将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;具体包括:根据患者的医学诊断图谱获取与医学诊断图谱对应的医生信息;基于所述医生信息从医生声纹库调取与所述医生信息对应的医生的声纹信息;利用语音合成模型将医生的声纹信息、文字诊断信息中的医学分词词语和非医学分词词语进行语音合成,生成语音信息。结合第一方面,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,所述知识图谱为各类疾病与其相关因素的关联性图谱。结合第一方面,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,该方法还包括:基于所述知识图谱和文字诊断信息建立标准化语音合成场景。结合第一方面,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,所述医学文字模型是通过利用专业词库、医学知识库的词语为单位构筑词向量模型,利用词向量模型进行分词训练并利用CNN神经网络训练建立得到的。结合第一方面,本专利技术实施例提供了第一方面的第七种可能的实施方式,其中,该方法还包括:获取医护人员收集的问题数据库中的随访问题,所述问题数据库预先以科室为单位进行分类;利用医学文字模型对所述随访问题进行提取,得到随访问题中包含的医学分词词语;将所述医学分词词语作为一个整体,对所述随访问题进行语音合成,生成语音随访问题;将所述语音随访问题输出。第二方面,本专利技术实施例还提供一种基于医学疾病数据的语音合成装置,包括:获取模块,用于获取患者的医学诊断图谱;对比模块,用于将所述医学诊断图谱与医学数据库的所有知识图谱进行对比,生成相似度值;排序模块,用于根据相似度值高低对知识图谱进行排序,并将相似度值最高的知识图谱作为疑似诊断知识图谱;比较模块,用于将疑似诊断知识图谱的相似度值与预设阈值进行比较;当疑似诊断知识图谱的相似度值大于预设阈值时,获取与所述疑似诊断知识图谱对应的文字诊断信息;识别模块,用于利用医学文字模型对所述文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;合成模块,用于将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;输出模块,用于将所述语音信息输出。第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面及其可能的实施方式中任一项所述的基于医学疾病数据的语音合成方法的步骤。第四方面,本专利技术实施例提供了一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行前述提及的基于医学疾病数据的语音合成方法。本专利技术实施例带来了以下有益效果:本专利技术实施例提供的基于医学疾病数据的语音合成方法、装置及电子设备中,其中,该基于医学疾病数据的语音合成方法包括:获取患者的医学诊断图谱;将医学诊断图谱与医学数据库的所有知识图谱进行对比,生成相似度值;根据相似度值高低对知识图谱进行排序,并将相似度值最高的知识图谱作为疑似诊断知识图谱;将疑似诊断知识图谱的相似度值与预设阈值进行比较;当疑似诊断知识图谱的相似度值大于预设阈值时,获取与疑似诊断知识图谱对应的文字诊断信息;利用医学文字模型对文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;将语音信息输出。因此,本专利技术实施例提供的技术方案,缓解了现有技术中存在的无法对医学领域进行语音合成的技术问题,能够对医学领域的图谱进行分析及语音合成,对于医疗领域的事业发展具有促进作用。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种基于医学疾病数据的语音合成方法的流程图;图2为本专利技术实施例提供的另一种基于医学疾病数据的语音合成方法的流程图;图3为本专利技术实施例提供的一种基于医学疾病数据的语音合成装置的示意图;图4为本专利技术实施例提供的一种电子设备的示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。目前,语音合成技术被广泛地用于现实生活中,如讯飞语音服务、百度语音服务等,均能为用户提供语音合成服务、语音搜索服务及其他服务。但这些技术并没有摆脱文字形式,在某些场合下并不方便,尤其是对于通常都是以图谱本文档来自技高网...

【技术保护点】
1.一种基于医学疾病数据的语音合成方法,其特征在于,包括:获取患者的医学诊断图谱;将所述医学诊断图谱与医学数据库的所有知识图谱进行对比,生成相似度值;根据相似度值高低对知识图谱进行排序,并将相似度值最高的知识图谱作为疑似诊断知识图谱;将疑似诊断知识图谱的相似度值与预设阈值进行比较;当疑似诊断知识图谱的相似度值大于预设阈值时,获取与所述疑似诊断知识图谱对应的文字诊断信息;利用医学文字模型对所述文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;将所述语音信息输出。

【技术特征摘要】
1.一种基于医学疾病数据的语音合成方法,其特征在于,包括:获取患者的医学诊断图谱;将所述医学诊断图谱与医学数据库的所有知识图谱进行对比,生成相似度值;根据相似度值高低对知识图谱进行排序,并将相似度值最高的知识图谱作为疑似诊断知识图谱;将疑似诊断知识图谱的相似度值与预设阈值进行比较;当疑似诊断知识图谱的相似度值大于预设阈值时,获取与所述疑似诊断知识图谱对应的文字诊断信息;利用医学文字模型对所述文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;将所述语音信息输出。2.根据权利要求1所述的方法,其特征在于,还包括:当疑似诊断知识图谱的相似度值小于预设阈值时,发送人工干预请求至目标医学专家,由目标医学专家补充知识图谱和文字诊断信息。3.根据权利要求1所述的方法,其特征在于,所述利用医学文字模型对所述文字诊断信息进行识别,得到文字诊断信息中包含的医学分词词语;具体包括:利用医学文字模型对文字诊断信息进行提取、划分、停用词过滤、标注词性、分类和标签提取,得到文字诊断信息中包含的医学分词词语以及非医学分词词语。4.根据权利要求1所述的方法,其特征在于,所述将所述医学分词词语作为整体对所述文字诊断信息进行语音合成,生成语音信息;具体包括:根据患者的医学诊断图谱获取与医学诊断图谱对应的医生信息;基于所述医生信息从医生声纹库调取与所述医生信息对应的医生的声纹信息;利用语音合成模型将医生的声纹信息、文字诊断信息中的医学分词词语和非医学分词词语进行语音合成,生成语音信息。5.根据权利要求1所述的方法,其特征在于,所述知识图谱为各类疾病与其相关因素的...

【专利技术属性】
技术研发人员:李成君仇志雄应旭河
申请(专利权)人:杭州认识科技有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1