【技术实现步骤摘要】
一种智能终端问诊的医疗软件及其方法
[0001]本专利技术涉及医疗智能问诊的
,尤其涉及一种智能终端问诊的医疗软件及其方法。
技术介绍
[0002]随着互联网技术的迅速发展,越来越多的在线医疗问诊网站得到患者的信任和依赖,患者通过在线问诊的方式将自身症状跟医生诉说,寻求专业的解答。
[0003]在现有智能问诊方法中,研究人员基于多种机器学习模型训练电子病历,通过调整模型结构得到更好的疾病诊断结果。然而,这些方法只关注了模型表现是否良好,忽略了实际应用中患者无法一次性准确地提供自诊断模型需要的信息。
[0004]鉴于此,如何实现一种交互式的智能问诊方法,成为本领域技术人员亟待解决的问题。
技术实现思路
[0005]本专利技术提供一种智能终端问诊方法,通过建立医疗领域的知识图谱,与用户进行问答交互,并提取用户所上传的文本病历特征以及图像病历特征,利用结合强化学习算法的疾病诊断模型对用户所上传的病历特征进行诊断,将诊断结果以及对应的治疗建议发送给用户,实现智能终端问诊。
[0006]为 ...
【技术保护点】
【技术特征摘要】
1.一种智能终端问诊方法,其特征在于,所述方法包括:获取医疗领域文本数据,并对原始医疗领域文本数据进行数据清洗以及字符切分的数据处理;对医疗领域文本数据进行格式化处理,并建立医疗领域知识图谱;接收用户的问诊信息,利用实体特征提取算法提取问诊信息中的实体特征;利用结合强化学习算法的疾病诊断模型对用户问诊信息中的实体特征进行疾病诊断,根据知识图谱中疾病实体对应的实体关系和实体属性,将诊断结果以及对应的治疗建议发送给用户,实现智能终端问诊。2.如权利要求1所述的一种智能终端问诊方法,其特征在于,所述对原始医疗领域文本数据进行数据清洗以及字符切分的数据处理,包括:所述数据清洗以及字符切分处理流程为:1)利用停用词表对原始医疗领域文本数据进行去停用词处理,所述停用词表数据包括语气词、介词、副词、连接词;2)对于原始医疗领域文本数据中的网页html文本内容,利用xpath函数获取到html的href内容后,再次调用xpath函数对二级页面的class标签进行解析,并将网页html文本内容替换为二次解析内容;3)将疾病的基本信息作为词典,对症状表现、并发疾病信息、治疗方式进行切分,初始化待切分字符串S1、切分字符串S2和每次取的最大字符串长度Max,判断S1是否为空,若为空,说明待切分字符串己完成切分,输出切分结果S2,若为非空,从S2左边开始取不大于Max长度的字符串L,查询词典,若L在词典中,则更新S2的值为原S2加上L和字符“/”,同时更新S1的值为S1减去L,开始新一轮判断S1是否为空;若查词典L不在词典中,则将L最右边的一个字符去掉对L值进行更新,判断L是否为单字,再按上文方式更新S2和S1的值;若L不是单字,则再次判断更新后的L值是否为词典中的词,并反复循环迭代,直到最终输出切分好的字符串S2;将原始文本替换为切分好的字符串文本。3.如权利要求2所述的一种智能终端问诊方法,其特征在于,所述对医疗领域文本数据进行格式化处理,包括:将医疗领域文本数据以格式{
‘
数据标签
’
:
‘
数据内容
’
}进行存储,所述数据标签包括疾病名称、疾病简介、预防措施、易感人群、疾病症状、患病原因、检查项目、就诊科室、疾病传染性、治疗花费、治疗时长、并发疾病、推荐药品、推荐食品、禁吃食品、是否医保类疾病。4.如权利要求3所述的一种智能终端问诊方法,其特征在于,所述建立医疗领域知识图谱,包括:将数据标签分别定义为知识图谱中的实体类型、实体关系以及实体属性定义,其中实体类型标签包括疾病简介、药品、食物、症状、检查项目、就诊科室,实体关系标签包括:属于、疾病推荐药品、疾病推荐食品、疾病禁吃食品、疾病症状、疾病并发疾病,实体属性标签包括:疾病名称、患病原因、预防措施、疾病传染性、治疗花费、治疗市场、是否医保类疾病;将格式化后的医疗领域文本数据导出为json文件,对单个疾病具有的标签属性数据进行遍历,当判断某一标签属性数据的数据内容为非空时,按照上述定义的知识图谱中的实体类型、实体关系以及实体属性,创建该标签属性数据对应的实体节点、实体关系或实体属
性;对所有疾病进行遍历,得到所有的知识图谱。5.如权利要求4所述的一种智能终端问诊方法,其特征在于,所述利用实体特征提取算法提取问诊信息中的实体特征,包括:在本发明一个具体实施例中,所述图像信息包括用户上传的病历图像、病症图像等;并利用实体特征提取算法提取问诊信息中的实体特征,所述实体特征提取算法的流程为:1)利用卷积神经网络对图像信息进行特征提取,得到图像信息的特征向量x
p
,利用word2vec算法将文本信息映射为文本特征向量x
t
;2)利用基于注意力机制的文本实体特征提取算法提取文本信息的实体特征x
ta
:wt=softmax(e)其中:h表示文本信息的序列步长;e表示x
t
中h个序列步长的得分;w为训练权重参数,b为训练偏置参数;表示文本特征向量x
t
的转置;w
t
表示x
t
中每个序列步长的注意力大小;3)对于用户的每一句问诊信息,提取对应的图像特征向量x
p
或文本实体特征x
ta
,将提取到的图像特征向量x
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。