当前位置: 首页 > 专利查询>沈鑫专利>正文

构建排行榜并进行动态索引的方法及装置制造方法及图纸

技术编号:26504979 阅读:64 留言:0更新日期:2020-11-27 15:32
本发明专利技术涉及一种构建排行榜并进行动态索引的方法及装置,包括获取咨询文本,处理得到关键词和关键词的关系构建知识图谱;将关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状;对关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜;对知识图谱中的多个节点进行组合以获取组合节点,接收用户输入的咨询指令,提取咨询指令中的节点或组合节点在关键词排行榜和症状排行榜中进行搜索,输出结果。本发明专利技术通过构建准确实时的排行榜数据,提升了排行榜数据的准确率;除此之外,结合知识图谱进行排行榜的搜索索引动态构建,无需人工介入,使得搜索触达的内容更能理解用户的意图,实现全流程的人工智能化,节省大量的简单劳动力。

【技术实现步骤摘要】
构建排行榜并进行动态索引的方法及装置
本专利技术数据处理
,具体涉及一种构建排行榜并进行动态索引的方法及装置。
技术介绍
相关技术中,有关排行榜数据的数据产品有TalkData、微博排行榜等,但是这些排行榜数据都只是单一地提供固定排行榜数据内容,且涉及人为干预,采用的自然语言处理技术较为简单,仅涉及简单分词功能。无法解决长文本的聚合问题。以TalkData为例,其排行榜都是已固定方式呈现。一般现有排行榜都是通过构建一张关于排行榜的表,如用户积分表则构建字段为用户和积分的表,通过API调用简单的查询SQL则可以实现。现有技术中只是对短文本数据的简单解析,对于长文本和口语化文本内容暂时无法做到快速准确提取关键性内容,故无法进行有效的内容聚类及爆发性信息统计。
技术实现思路
有鉴于此,本专利技术的目的在于克服现有技术的不足,提供一种构建排行榜并进行动态索引的方法及装置,以解决现有技术中排行榜固定以及无法对长文本快速准确的问题。为实现以上目的,本专利技术采用如下技术方案:一种构建排行榜并进行动态索引的方法,包括:获取咨询文本,并对所述咨询文本进行处理得到关键词和关键词的关系;以所述关键词为节点、关键词的关系为边构建知识图谱;将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状;对所述关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜;对所述知识图谱中的多个节点进行组合以获取组合节点,接收用户输入的咨询指令,提取所述咨询指令中的节点或组合节点在所述关键词排行榜和症状排行榜中进行搜索,输出结果。进一步的,采用依存句法分析咨询文本得到关键词和关键词的关系。进一步的,所述将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状,包括:将所述关键词输入到深度学习模型中,输出咨询症状的第一概率值;将所述关键词输入到传统统计模型中,输出咨询症状的第二概率值;比较第一概率值和第二概率值;输出第一概率值、第二概率值中大的咨询症状。进一步的,所述对所述关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜,包括:将关键词转化为关键词向量,将关键词向量进行聚类,获取关键词排行榜;统计咨询症状的数量,根据数量的高低进行排序,获取咨询症状排行榜。进一步的,所述深度学习模型为bert模型;所述传统统计模型为贝叶斯模型。进一步的,所述输出结果为:关键词排行榜或症状排行榜。进一步的,还包括:将关键词和咨询症状存储至数据库。进一步的,所述关键词包括:咳嗽、头痛、关节痛、鼻塞、吃药、没用;所述关键词关系包括状中关系、动宾关系;所述咨询症状包括:肺炎、支气管炎、感冒、关节炎。本申请实施例提供一种构建排行榜并进行动态索引的分析装置,包括:处理模块,用于获取咨询文本,并对所述咨询文本进行处理得到关键词和关键词的关系;构建模块,用于以所述关键词为节点、关键词的关系为边构建知识图谱;获取模块,用于将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状;聚类模块,用于对所述关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜;输出模块,用于对所述知识图谱中的多个节点进行组合以获取组合节点,接收用户输入的咨询指令,提取所述咨询指令中的节点或组合节点在所述关键词排行榜和症状排行榜中进行搜索,输出结果。进一步的,所述将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状,包括:将所述关键词输入到深度学习模型中,输出咨询症状的第一概率值;将所述关键词输入到传统统计模型中,输出咨询症状的第二概率值;比较第一概率值和第二概率值;输出第一概率值、第二概率值中大的咨询症状。本专利技术采用以上技术方案,能够达到的有益效果包括:本专利技术提供一种构建排行榜并进行动态索引的方法及装置,对于患者在app侧与医生咨询数据,采用先进自然语言处理技术结合知识图谱技术进行解析,提取咨询数据的关键词,将相似关键词进行症状匹配,获取排行榜。通过构建准确实时的排行榜数据,提升了排行榜数据的准确率;除此之外,结合知识图谱进行排行榜的搜索索引动态构建,无需人工介入,使得搜索触达的内容更能理解用户的意图,实现全流程的人工智能化,节省大量的简单劳动力。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术构建排行榜并进行动态索引的方法的步骤示意图;图2为本专利技术构建排行榜并进行动态索引的方法的流程示意图;图3为本专利技术构建排行榜并进行动态索引的咨询文本示意图;图4为本专利技术构建排行榜并进行动态索引的分析装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将对本专利技术的技术方案进行详细的描述。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本专利技术所保护的范围。下面结合附图介绍本申请实施例中提供的一个具体的构建排行榜并进行动态索引的方法。如图1和图2所示,本申请实施例中提供的构建排行榜并进行动态索引的方法包括:S101,获取咨询文本,并对咨询文本进行处理得到关键词和关键词的关系;咨询文本为医生与患者的对话文本,其中医生与患者的对话文本可以是在手机APP上进行咨询获取的,也可以是在网页咨询获取的,可以理解的是,医生与患者对话为多句,本申请是由医生与患者的多句对话文本中提取关键词,和关键词的关系。优选的,本申请中采用依存句法分析咨询文本得到关键词和关键词的关系。例如:患者的对话文本中含有“我最近一直咳嗽,吃药没用”的语句,采用依存句法分析可以获取到关键词“咳嗽”、“吃药”、“没用”,关键词的关系是“吃药没用”。S102,以关键词为节点、关键词的关系为边构建知识图谱;如图3所示,根据依存句法关系的结构,提取相应结构,可将咳嗽、吃药、没用三个词提取作为关键词。然后根据其状中、动宾等关系形成边,即可结合知识图谱做检索。S103,将关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状;可以理解的是,关键词同时输入到深度学习模型和传统统计模型,分别得到症状的概率值,判断概率值的大小,取概率值高的为相应的咨询症状。咨询症状包括:肺炎、支气管炎、关节炎等。S104,对关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜;分别对关键词和咨询症状进行聚类,根据聚类结果得到本文档来自技高网...

【技术保护点】
1.一种构建排行榜并进行动态索引的方法,其特征在于,包括:/n获取咨询文本,并对所述咨询文本进行处理得到关键词和关键词的关系;/n以所述关键词为节点、关键词的关系为边构建知识图谱;/n将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状;/n对所述关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜;/n对所述知识图谱中的多个节点进行组合以获取组合节点,接收用户输入的咨询指令,提取所述咨询指令中的节点或组合节点在所述关键词排行榜和症状排行榜中进行搜索,输出结果。/n

【技术特征摘要】
1.一种构建排行榜并进行动态索引的方法,其特征在于,包括:
获取咨询文本,并对所述咨询文本进行处理得到关键词和关键词的关系;
以所述关键词为节点、关键词的关系为边构建知识图谱;
将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状;
对所述关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜;
对所述知识图谱中的多个节点进行组合以获取组合节点,接收用户输入的咨询指令,提取所述咨询指令中的节点或组合节点在所述关键词排行榜和症状排行榜中进行搜索,输出结果。


2.根据权利要求1所述的方法,其特征在于,
采用依存句法分析咨询文本得到关键词和关键词的关系。


3.根据权利要求1所述的方法,其特征在于,所述将所述关键词同时输入到深度学习模型和传统统计模型中,获取咨询症状,包括:
将所述关键词输入到深度学习模型中,输出咨询症状的第一概率值;
将所述关键词输入到传统统计模型中,输出咨询症状的第二概率值;
比较第一概率值和第二概率值;
输出第一概率值、第二概率值中大的咨询症状。


4.根据权利要求1所述的方法,其特征在于,所述对所述关键词和咨询症状分别进行聚类,得到关键词排行榜和症状排行榜,包括:
将关键词转化为关键词向量,将关键词向量进行聚类,获取关键词排行榜;
统计咨询症状的数量,根据数量的高低进行排序,获取咨询症状排行榜。


5.根据权利要求1所述的方法,其特征在于,
所述深度学习模型为bert模型;
所述传统统计模型为贝叶斯模型。...

【专利技术属性】
技术研发人员:马驰沈鑫
申请(专利权)人:沈鑫
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1