医学语言文本的处理方法、装置和存储介质制造方法及图纸

技术编号:20075346 阅读:23 留言:0更新日期:2019-01-15 00:43
本发明专利技术公开了一种医学语言文本的处理方法、装置和存储介质,包括如下步骤:接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;对得到的多个所述关键词进行分类,获取对应的分类结果。本发明专利技术提高了处理医学语言文本的准确性、专业性,且不需要耗费医疗从业人员大量的精力,从而提高了医疗从业人员的工作效率。

Processing method, device and storage medium of medical language text

The invention discloses a processing method, device and storage medium for medical language text, which comprises the following steps: receiving the medical language text input by the user, and performing word segmentation operation on the medical language text according to the pre-set word segmentation library, obtaining the words corresponding to the medical language text; and corresponding to the medical language text according to the pre-set medical word library. Keyword extraction is performed for the obtained words, and a number of the keywords are classified to obtain the corresponding classification results. The invention improves the accuracy and professionalism of processing medical language texts, and does not need to consume a large amount of energy of medical practitioners, thereby improving the work efficiency of medical practitioners.

【技术实现步骤摘要】
医学语言文本的处理方法、装置和存储介质
本专利技术涉及自然语言处理领域,尤其涉及一种医学语言文本的处理方法、装置和存储介质。
技术介绍
随着医疗系统信息化建立和完善和医院计算机管理网络化,越来越多的医院采用电子病历,电子病历是用电子设备保存、管理、传输和重现的数字化的病人的医疗记录,取代手写纸张病历,但是由医疗人员通过自然语言的方式书写而成的病历,信息结构较为复杂,如何对大量这些信息进行处理和分析是医疗信息化建设的一个重要问题;同时计算机对人类能够读懂的文字信息并不能够理解,在人工智能时代并不能够进行运算,因此必须要将人类的语言转化为计算机能够看得懂的结构化数据库才能够加以后续的应用。现有的处理医学语言文本的方法,大都依赖于医疗从业人员凭借经验对文本内容进行人工处理,需要医疗从业人员耗时艰难阅读病历后从中提取相关有价值的病例数据后进行表格填写,过程实质上是依靠医疗从业人员的医疗知识和医疗经验。这种人工处理的方式需要耗费医疗从业人员大量的精力,而且正确率难以得到保证。为了减少人工处理造成的问题,现有技术提出了一种新的解决的方案:自然语言处理,自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。现有的通过自然语言处理手段处理医学自然语言的方法中,大都依赖医学语言文本中词语的词频来匹配关键词,但是由于词频高的词语并不一定是医学语言文本中的关键词以及所用来检索的医学词库的专业性不够,造成处理结果准确性不高,从而误导医疗从业人员对医疗数据的阅读,增加了医疗从业人员的工作负担。
技术实现思路
本专利技术的主要目的在于提供一种医学语言文本的处理方法、装置和存储介质。本专利技术旨在提高处理医学语言文本的准确性、专业性,从而提高了医疗从业人员的工作效率。为实现上述目的,本专利技术提供一种医学语言文本的处理方法,包括如下步骤:接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;对得到的多个所述关键词进行分类,获取对应的分类结果。可选地,所述对得到的多个所述关键词进行分类,获取对应的分类结果的步骤之后包括:根据关键词分类的结果,使所述关键词以类别形式展现在对应的病历文档中。可选地,所述根据关键词分类的结果,使所述关键词以类别形式展现在对应的病历文档中的步骤包括:根据关键词分类的结果,确定所述关键词对应的疾病种类;根据所述疾病种类确定预先设置的病历文档库中与所述疾病种类对应的病历文档;将所述关键词以类别形式填写到所述对应的中。可选地,所述接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语的步骤包括:接收输入的医学语言文本,并将医学语言文本按段落、标点符号进行拆分,得到对应的语句;确定所述语句的结构,并将所述语句输入到预先设置的分词词库中进行检索,检索得到所述语句中与所述分词词库相匹配的词语;根据所述语句的结构和所述相匹配的词语对所述语句进行拆分,得到对应的词语。可选地,所述对得到的多个所述关键词进行分类,获取对应的分类结果的步骤包括:将得到的多个所述关键词按照医学词库中的词语类别进行分类;将分类后的所述关键词输入到预先设置的同义词词库中进行检索,如果检索到存在同义词,则剔除多余的同义词。可选地,所述接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语的步骤之前包括:根据用户的输入和/或医疗行业标准建立分词词库、医学词库及病历文档库;根据用户的输入和/或医疗行业标准建立同义词词库,所述同义词词库包括有各类词语的同义词。可选地,所述分词词库包括关键节点词典、逻辑词典、标题词典、医学专业设备词典及数值词典;所述医学词库包括医学专业名词词典、医学专业部位词典、医学专业病变名词词典及医学专业设备词典。可选地,所述病历文档包括表格形式的病历和/或文档形式的病历。此外,为实现上述目的,本专利技术还提供一种医学语言文本处理装置,所述医学语言文本处理装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的医学语言文本处理程序,所述医学语言文本处理程序被所述处理器执行时实现如上所述的医学语言文本处理方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有医学语言文本处理程序,所述医学语言文本处理程序被处理器执行时实现如上所述的医学语言文本处理方法的步骤。本专利技术公开了一种医学语言文本的处理方法、装置和存储介质,包括如下步骤:接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;对得到的多个所述关键词进行分类,获取对应的分类结果。通过上述方式,本专利技术运用分词技术和预先设置的分词词库对输入的医学语言文本进行分词,其中分词词库是根据对医学语言文本进行拆分的多次模拟得到的,保证分词结果的准确性;然后根据预先建立专业的医学词库,运用关键词提取技术提取分词结果中的关键词,医学词库由具有行业权威的医学专家和/或医疗机构制定,保证医学词库的专业性;最后对关键词进行分类,得到关键词分类的结果,使得用户不必耗费大量的精力来阅读文本即可完成对文本的阅读,提高了工作效率。此外,根据用户预先建立的病历文档,将关键词分类的结果输入到病历文档中,使得用户输入的医学语言文本以标准化的形式展现在病历文档中,方便用户对病历文档的识别整理,也起到了提高用户工作效率的作用。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的装置结构示意图;图2为本专利技术医学语言文本的处理方法一实施例的流程示意图;图3为本专利技术医学语言文本的处理方法另一实施例的流程示意图;图4为本专利技术实施例中使所述关键词以类别形式展现在对应的病历文档中的步骤细化流程示意图;图5为本专利技术实施例中对所述医学语言文本进行分词操作的步骤细化流程示意图;图6为本专利技术实施例中对得到的多个所述关键词进行分类的步骤细化流程示意图;图7为本专利技术医学语言文本的处理方法又一实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图。本专利技术实施例终端可以是电脑,也可以是智能手机、平板电脑、便携计算机等具有显示功能和输入功能的可移动式终端设备。如图1所示,该终端可以包括:处理器1001,例如CPU,通信总线1002,用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选的用户接口1003还可以包括标准的有线接口、无线接口。网络接口1本文档来自技高网...

【技术保护点】
1.一种医学语言文本的处理方法,其特征在于,包括如下步骤:接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;对得到的多个所述关键词进行分类,获取对应的分类结果。

【技术特征摘要】
1.一种医学语言文本的处理方法,其特征在于,包括如下步骤:接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语;根据预先设置的医学词库对所述医学语言文本对应的词语进行关键词提取;对得到的多个所述关键词进行分类,获取对应的分类结果。2.如权利要求1所述的医学语言文本的处理方法,其特征在于,所述对得到的多个所述关键词进行分类,获取对应的分类结果的步骤之后包括:根据关键词分类的结果,使所述关键词以类别形式展现在对应的病历文档中。3.如权利要求1所述的医学语言文本的处理方法,其特征在于,所述根据关键词分类的结果,使所述关键词以类别形式展现在对应的病历文档中的步骤包括:根据关键词分类的结果,确定所述关键词对应的疾病种类;根据所述疾病种类确定预先设置的病历文档库中与所述疾病种类对应的病历文档;将所述关键词以类别形式填写到所述对应的病历文档中。4.如权利要求1所述的医学语言文本的处理方法,其特征在于,所述接收用户输入的医学语言文本,并根据预先设置的分词词库对所述医学语言文本进行分词操作,得到与所述医学语言文本对应的词语的步骤包括:接收输入的医学语言文本,并将医学语言文本按段落、标点符号进行拆分,得到对应的语句;确定所述语句的结构,并将所述语句输入到预先设置的分词词库中进行检索,检索得到所述语句中与所述分词词库相匹配的词语;根据所述语句的结构和所述相匹配的词语对所述语句进行拆分,得到对应的词语。5.如权利要求1所述的医学语言文本的处理方法,其特征在于,所述对得到的多个所述关键词进行分类...

【专利技术属性】
技术研发人员:侯丹王爽耿妍翁钊
申请(专利权)人:广州达美智能科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1