一种语义识别方法、装置、终端设备和存储介质制造方法及图纸

技术编号:20866308 阅读:13 留言:0更新日期:2019-04-17 09:18
本申请实施例公开了一种语义识别方法、装置、终端设备和存储介质,该方法包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。

【技术实现步骤摘要】
一种语义识别方法、装置、终端设备和存储介质
本申请实施例涉及语义识别技术,尤其涉及一种语义识别方法、装置、终端设备和存储介质。
技术介绍
病人去医院看病时,有时候需要咨询一些与医疗相关的问题,但是医院往往有很多病人,如果医护人员需要一一解答病人的咨询问题,会给医护人员增加很多工作量,降低医护人员的工作效率。
技术实现思路
本申请实施例提供一种语义识别方法、装置、终端设备和存储介质,可以自动识别用户的咨询问题并提供对应的信息。第一方面,本申请实施例提供了一种语义识别方法,包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。进一步地,对所述待处理文本信息进行分词处理,以确定分词信息包括:对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值;将所述分解词语和对应的权重值确定为分词信息。进一步地,所述将所述分解词语和对应的权重值确定为分词信息之前,还包括:依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。进一步地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。进一步地,所述对所述待处理文本信息进行分词处理以得到分解词语包括:依据预设的关键词列表对所述待处理文本信息进行分词处理;如果所述待处理文本信息中所包括的连续词语属于所述关键词列表,则确定所述连续词语为一个分解词语。进一步地,所述将所述分词信息与预设知识库中的预设词句信息进行匹配之前,还包括:依据所述连续词语从预设知识库中确定对应的预设词句信息,并确定为待匹配词句信息;所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:将所述分词信息与所述待匹配词句信息进行匹配,以从所述待匹配词句信息中确定目标词句信息。进一步地,所述获取待处理文本信息之前,还包括:获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。第二方面,本申请实施例还提供了一种语义识别装置,包括:信息获取模块,用于获取待处理文本信息;分词模块,用于对所述待处理文本信息进行分词处理,以确定分词信息;匹配模块,用于将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;反馈模块,用于将所述目标词句信息对应的预设信息确定为反馈信息。第三方面,本申请实施例还提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请任意实施例所述的语义识别方法。第四方面,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本申请任意实施例所述的语义识别方法。本申请实施例公开了一种语义识别方案,通过获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。本申请实施例可以对用户输入的文本进行自动识别,确定对应的反馈信息,用户可以通过反馈信息了解到想要知道的信息。附图说明图1是本申请实施例一提供的语义识别方法的流程图;图2是本申请实施例二提供的语义识别方法的流程图;图3是本申请实施例三提供的语义识别方法的流程图;图4是本申请实施例四中的语义识别装置的结构示意图;图5是本申请实施例六中的一种终端设备的硬件结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。实施例一图1为本申请实施例一提供的语义识别方法的流程图,该方法可以由语义识别装置来执行,其中,该装置可以由软件和/或硬件实现,一般可以集成在硬件平台上,具体包括如下步骤:S110、获取待处理文本信息。所述待处理文本信息可以是用户通过输入端所输入的文本信息。示例性地,本申请实施例的语义识别方法可以应用在医护机器人上,医护机器人上设置有键盘或触摸屏,用户可以通过键盘或触摸屏输入待处理文本信息。所述待处理文本信息一般是用户所提出的问题,可以根据本申请实施例的具体应用场景来确定所述待处理文本信息的类型。如果所述语音识别方法应用在医护机器人上,所述待处理文本信息为用户输入的关于医疗相关的问题。可选地,还可以是获取用户输入的语音信息,对所述语音信息进行文本识别以获取待处理文本。所述用户可以通过说话来输入语音信息,采集到用户的语音信息之后进行文本识别就可以得到对应的待处理文本。示例性地,如果本申请实施例应用在医护机器人上,医护机器人上设置有麦克风和语音处理模块,通过麦克风采集用户输入的语音信息,然后通过语音处理模块将麦克风采集的语音信息进行文本识别,以得到对应的待处理文本。S111、对所述待处理文本信息进行分词处理,以确定分词信息。所述待处理文本信息包括至少一个句子,可以对句子进行分词处理。所述分词处理用于将一个句子依据预设分词规则划分为若干个分解词语。示例性地,可以根据正则表达式将待处理文本信息分成至少一个句子,进而根据预设的前缀词典对该句子进行扫描,并确定若干个切分的方案;对于每个切分方案构建有向无环图(DAG,DirectedAcyclicGraph),并根据动态规则算法,计算得到最大概率路径,以确定最终的切分方案,并依据最终的切分方案将该句子划分为若干个分解词语。所述分词信息包括对所述待处理文本进行分词处理所得到的若干个分解词语。S112、将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息。其中,所述预设知识库中包括预设词句信息以及对应的预设信息。预设词句信息为与待处理文本同一个类型的句子,所述预设信息为与预设词句信息相对应的信息。示例性地,如果待处理文本为用户输入的提问,相应地预设词句信息也是提问信息,而预设信息是与提问信息相对应的解答信息。所述预设知识库中包括多个预设词句信息以及分别对应的预设信息,预设知识库中一般是包括针对一个领域的预设词句信息。示例性地,如果本申请实施例是应用在医护机器人上,则所述预设知识库中可以是包括与医疗相关的提问信息和对应的解答信息。其中,可以将所述分词信息与预设知识库中的所有的预设词句信息进行匹配,并从中选择一个匹配度最高的确定为目标词句信息。相应地,预设知识库的预设词句信息包括预设的句子和对应的预设分词信息,可以将所述分词信息和预设本文档来自技高网...

【技术保护点】
1.一种语义识别方法,其特征在于,包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。

【技术特征摘要】
1.一种语义识别方法,其特征在于,包括:获取待处理文本信息;对所述待处理文本信息进行分词处理,以确定分词信息;将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,其中,所述预设知识库中包括预设词句信息以及对应的预设信息;将所述目标词句信息对应的预设信息确定为反馈信息。2.根据权利要求1所述的方法,其特征在于,对所述待处理文本信息进行分词处理,以确定分词信息包括:对所述待处理文本信息进行分词处理以得到分解词语,并确定每个分解词语的权重值;将所述分解词语和对应的权重值确定为分词信息。3.根据权利要求2所述的方法,其特征在于,所述将所述分解词语和对应的权重值确定为分词信息之前,还包括:依据预设的频用词列表调整每个分解词语的权重值,以使属于频用词列表的分解词语的权重降低。4.根据权利要求2所述的方法,其特征在于,所述将所述分词信息与预设知识库中的预设词句信息进行匹配,以从所述预设词句信息中确定目标词句信息,包括:将所述分解词语与预设知识库中的预设词句信息进行匹配,并根据每个分解词语的权重值确定所述分词信息与所述预设词句信息的匹配值;确定所述分词信息与所有预设词句信息的匹配值,将匹配值最高的预设词句信息确定为目标词句信息。5.根据权利要求2所述的方法,其特征在于,所述对所述待处理文本信息进行分词处理以得到分解词语包括:依据预设的关键词列表对所述待处理文本信息进行分词处理;如果所述待处理文本信息中...

【专利技术属性】
技术研发人员:潘晶高再荣沈满崔瑶陈彦品董超薛长城
申请(专利权)人:上海钛米机器人科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1