一种医学智能问答数据处理的方法及装置制造方法及图纸

技术编号:17881105 阅读:33 留言:0更新日期:2018-05-06 02:20
本发明专利技术提供了一种医学智能问答数据处理的方法及装置,涉及智能问答技术领域。方法包括:在用户查询问题数据中提取问题关键词;进行同义转换,确定问题关键词的同义词组;根据问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找;若成功,输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;若失败,对问题关键词进行语义扩展处理,得到问题关键词及其同义词的下位词的同义词组;根据问题关键词及其同义词的下位词的同义词组继续匹配查找,生成包含检索结果的检索结果列表;对检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度;根据各检索结果的相似度对各检索结果进行排序并输出。

A method and device for data processing of medical intelligent question and answer

The invention provides a medical intelligent question answering data processing method and device, which relates to the field of Intelligent Question Answering technology. The methods include: extracting the problem key words in the user query data, making the synonymous conversion and determining the synonym of the problem key words; according to the synonym of the question key words in the pre set question and answer to the knowledge base and the rule knowledge base, the word group of the output key words is asked in the synonym. If the problem key words and their synonyms are synonymous with the semantic extension of the key words and their synonyms, the synonyms of the words of the problem and their synonyms continue to match and find the retrieval results. The result list; calculate the similarity degree of the retrieval results in the list of the retrieval results, determine the similarity of the retrieval results, and sort out the retrieval results according to the similarity of the retrieval results and output the retrieval results.

【技术实现步骤摘要】
一种医学智能问答数据处理的方法及装置
本专利技术涉及智能问答
,尤其涉及一种医学智能问答数据处理的方法及装置。
技术介绍
当前,随着互联网医疗的快速发展、医疗信息的海量增长,人们在浩瀚的医学数据中搜索到想要的医学信息越来越难。传统的信息搜索一般是根据用户提交的关键词返回一组或一篇文本列表或文本超链接,而不能直接定位到文本中具体的所需的内容,用户必须逐一浏览文本内容才能找到其需要的知识信息,可见用户需要手工定位到其真正需要的信息,耗时耗力。由此,智能问答技术应运而生,智能问答技术能够改变传统搜索引擎返回文本超链接的方式,能把海量的互联网信息转化为知识,并能够理解用户的自然语言问题和意图,快速、准确地直接给予答案,大大减少了用户查找信息的时间,提高用户的查询效率。然而,在医学领域,医学的智能问答技术和系统研究还不成熟。目前的智能问答技术及系统还存在比较大的局限性,例如存在对知识库依赖行太强、语义推理能力差、答案准确率较低等问题。
技术实现思路
本专利技术的实施例提供一种医学智能问答数据处理的方法及装置,以解决医学的智能问答技术和系统研究还不成熟,目前的智能问答技术及系统还存在对知识库依赖行太强、语义推理能力差、答案准确率较低的问题。为达到上述目的,本专利技术采用如下技术方案:一种医学智能问答数据处理的方法,包括:获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词;对所述问题关键词进行同义转换,确定问题关键词的同义词组;根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找;若匹配查找成功,则输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;若匹配查找失败,则对所述问题关键词进行语义扩展处理,得到所述问题关键词及其同义词的下位词的同义词组;根据所述问题关键词及其同义词的下位词的同义词组继续在预先设置的问答对知识库和规则知识库中进行匹配查找,生成包含检索结果的检索结果列表;根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度;根据各检索结果的相似度对各检索结果进行排序并输出。具体的,所述获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词,包括:获得用户查询问题数据,并根据预先设置的切分词表,采用逆向最大匹配原则对用户查询问题数据进行切分,确定用户查询问题数据中的核心关键词和功能关键词;其中,所述切分词表包括医学本体词表和通用词表;所述医学本体词表包括本体术语名称、本体标准词、本体术语同义词、本体术语上位词以及本体术语类型;所述通用词表包括通用术语名称、通用术语同义词、通用术语上位词以及通用术语类型;所述核心关键词是从所述医学本体词表中检索得到的;所述功能关键词是从所述通用词表中检索得到的。具体的,对所述问题关键词进行同义转换,确定问题关键词的同义词组,包括:在医学本体词表中检索与所述核心关键词相对的本体术语名称对应的本体标准词和本体术语同义词;根据所述核心关键词及其对应的本体标准词和本体术语同义词确定所述核心关键词的同义词组;在通用词表中检索与所述功能关键词相对的通用术语名称对应的通用术语同义词;根据所述功能关键词及其对应的通用术语同义词确定所述功能关键词的同义词组。具体的,所述问答对知识库包括预先设置的问题项目以及各问题项目对应的答案项目;所述规则知识库包括预先设置的实体项目、属性项目以及值项目;所述方法还包括:预先建立所述问答对知识库的索引和所述规则知识库的索引。具体的,根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找,包括:根据所述用户查询问题数据中提取的问题关键词的核心关键词和功能关键词的组成形式,将用户查询问题数据对应的核心关键词的同义词组和功能关键词的同义词组根据所述问答对知识库的索引和所述规则知识库的索引进行匹配查找。具体的,将用户查询问题数据对应的核心关键词的同义词组和功能关键词的同义词组根据所述问答对知识库的索引和所述规则知识库的索引进行匹配查找,包括:将用户查询问题数据对应的核心关键词的同义词组和功能关键词的同义词组根据所述问答对知识库的索引,匹配查找对应的问题项目和答案项目;将用户查询问题数据对应的核心关键词的同义词组根据所述规则知识库的索引,与所述实体项目进行匹配,将用户查询问题数据对应的功能关键词的同义词组根据所述规则知识库的索引,与所述属性项目进行匹配,以确定用户查询问题数据对应的值项目。具体的,根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度,包括:根据预先设置的用户查询问题数据对应的检索词权重、查询子语句权重、待查询文档权重以及域权重,采用Lucence技术,确定各检索结果的相似度;所述根据各检索结果的相似度对各检索结果进行排序并输出,包括:将各检索结果的相似度以从高到低顺序排列并输出。进一步的,所述的医学智能问答数据处理的方法,还包括:将相似度的最高值对应的检索结果和用户查询问题数据相关联,并更新到问答对知识库中,并设置相似度的最高值对应的检索结果和用户查询问题数据对应的未审核标记。一种医学智能问答数据处理的装置,包括:问题关键词提取单元,用于获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词;同义转换单元,用于对所述问题关键词进行同义转换,确定问题关键词的同义词组;匹配查找单元,用于根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找;结果输出单元,用于在匹配查找成功时,输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;语义扩展处理单元,用于在匹配查找失败时,对所述问题关键词进行语义扩展处理,得到所述问题关键词及其同义词的下位词的同义词组;所述匹配查找单元,还用于根据所述问题关键词及其同义词的下位词的同义词组继续在预先设置的问答对知识库和规则知识库中进行匹配查找,生成包含检索结果的检索结果列表;相似度计算单元,用于根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度;排序输出单元,用于根据各检索结果的相似度对各检索结果进行排序并输出。另外,所述问题关键词提取单元,具体用于:获得用户查询问题数据,并根据预先设置的切分词表,采用逆向最大匹配原则对用户查询问题数据进行切分,确定用户查询问题数据中的核心关键词和功能关键词;其中,所述切分词表包括医学本体词表和通用词表;所述医学本体词表包括本体术语名称、本体标准词、本体术语同义词、本体术语上位词以及本体术语类型;所述通用词表包括通用术语名称、通用术语同义词、通用术语上位词以及通用术语类型;所述核心关键词是从所述医学本体词表中检索得到的;所述功能关键词是从所述通用词表中检索得到的。具体的,所述同义转换单元,包括:第一检索模块,用于在医学本体词表中检索与所述核心关键词相对的本体术语名称对应的本体标准词和本体术语同义词;核心关键词的同义词组确定模块,用于根据所述核心关键词及其对应的本体标准词和本体术语同义词确定所述核心关键词的同义词组;第二检索模块,用于在通用词表中检索与所述功能关键词相对的通用术语名称对应的通用术语同义词;功能关键词的同义词组确定模块,用于根据所本文档来自技高网...
一种医学智能问答数据处理的方法及装置

【技术保护点】
一种医学智能问答数据处理的方法,其特征在于,包括:获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词;对所述问题关键词进行同义转换,确定问题关键词的同义词组;根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找;若匹配查找成功,则输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;若匹配查找失败,则对所述问题关键词进行语义扩展处理,得到所述问题关键词及其同义词的下位词的同义词组;根据所述问题关键词及其同义词的下位词的同义词组继续在预先设置的问答对知识库和规则知识库中进行匹配查找,生成包含检索结果的检索结果列表;根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度;根据各检索结果的相似度对各检索结果进行排序并输出。

【技术特征摘要】
1.一种医学智能问答数据处理的方法,其特征在于,包括:获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词;对所述问题关键词进行同义转换,确定问题关键词的同义词组;根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找;若匹配查找成功,则输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;若匹配查找失败,则对所述问题关键词进行语义扩展处理,得到所述问题关键词及其同义词的下位词的同义词组;根据所述问题关键词及其同义词的下位词的同义词组继续在预先设置的问答对知识库和规则知识库中进行匹配查找,生成包含检索结果的检索结果列表;根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度;根据各检索结果的相似度对各检索结果进行排序并输出。2.根据权利要求1所述的医学智能问答数据处理的方法,其特征在于,所述获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词,包括:获得用户查询问题数据,并根据预先设置的切分词表,采用逆向最大匹配原则对用户查询问题数据进行切分,确定用户查询问题数据中的核心关键词和功能关键词;其中,所述切分词表包括医学本体词表和通用词表;所述医学本体词表包括本体术语名称、本体标准词、本体术语同义词、本体术语上位词以及本体术语类型;所述通用词表包括通用术语名称、通用术语同义词、通用术语上位词以及通用术语类型;所述核心关键词是从所述医学本体词表中检索得到的;所述功能关键词是从所述通用词表中检索得到的。3.根据权利要求2所述的医学智能问答数据处理的方法,其特征在于,对所述问题关键词进行同义转换,确定问题关键词的同义词组,包括:在医学本体词表中检索与所述核心关键词相对的本体术语名称对应的本体标准词和本体术语同义词;根据所述核心关键词及其对应的本体标准词和本体术语同义词确定所述核心关键词的同义词组;在通用词表中检索与所述功能关键词相对的通用术语名称对应的通用术语同义词;根据所述功能关键词及其对应的通用术语同义词确定所述功能关键词的同义词组。4.根据权利要求3所述的医学智能问答数据处理的方法,其特征在于,所述问答对知识库包括预先设置的问题项目以及各问题项目对应的答案项目;所述规则知识库包括预先设置的实体项目、属性项目以及值项目;所述方法还包括:预先建立所述问答对知识库的索引和所述规则知识库的索引。5.根据权利要求4所述的医学智能问答数据处理的方法,其特征在于,根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找,包括:根据所述用户查询问题数据中提取的问题关键词的核心关键词和功能关键词的组成形式,将用户查询问题数据对应的核心关键词的同义词组和功能关键词的同义词组根据所述问答对知识库的索引和所述规则知识库的索引进行匹配查找。6.根据权利要求5所述的医学智能问答数据处理的方法,其特征在于,将用户查询问题数据对应的核心关键词的同义词组和功能关键词的同义词组根据所述问答对知识库的索引和所述规则知识库的索引进行匹配查找,包括:将用户查询问题数据对应的核心关键词的同义词组和功能关键词的同义词组根据所述问答对知识库的索引,匹配查找对应的问题项目和答案项目;将用户查询问题数据对应的核心关键词的同义词组根据所述规则知识库的索引,与所述实体项目进行匹配,将用户查询问题数据对应的功能关键词的同义词组根据所述规则知识库的索引,与所述属性项目进行匹配,以确定用户查询问题数据对应的值项目。7.根据权利要求6所述的医学智能问答数据处理的方法,其特征在于,根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检索结果的相似度,包括:根据预先设置的用户查询问题数据对应的检索词权重、查询子语句权重、待查询文档权重以及域权重,采用Lucence技术,确定各检索结果的相似度;所述根据各检索结果的相似度对各检索结果进行排序并输出,包括:将各检索结果的相似度以从高到低顺序排列并输出。8.根据权利要求7所述的医学智能问答数据处理的方法,其特征在于,还包括:将相似度的最高值对应的检索结果和用户查询问题数据相关联,并更新到问答对知识库中,并设置相似度的最高值对应的检索结果和用户查询问题数据对应的未审核标记。9.一种医学智能问答数据处理的装置,其特征在于,包括:问题关键词提取单元,用于获得用户查询问题数据,并在所述用户查询问题数据中提取问题关键词;同义转换单元,用于对所述问题关键词进行同义转换,确定问题关键词的同义词组;匹配查找单元,用于根据所述问题关键词的同义词组在预先设置的问答对知识库和规则知识库中进行匹配查找;结果输出单元,用于在匹配查找成功时,输出问题关键词的同义词组中问题关键词及其同义词对应的答案结果数据;语义扩展处理单元,用于在匹配查找失败时,对所述问题关键词进行语义扩展处理,得到所述问题关键词及其同义词的下位词的同义词组;所述匹配查找单元,还用于根据所述问题关键词及其同义词的下位词的同义词组继续在预先设置的问答对知识库和规则知识库中进行匹配查找,生成包含检索结果的检索结果列表;相似度计算单元,用于根据所述用户查询问题数据,对所述检索结果列表中的检索结果进行相似度计算,确定各检...

【专利技术属性】
技术研发人员:金以东李雪莉黄玉丽周大胜
申请(专利权)人:易保互联医疗信息科技北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1