一种语句匹配方法、存储介质及终端设备组成比例

技术编号:21629075 阅读:40 留言:0更新日期:2019-07-17 11:08
本发明专利技术公开了一种语句匹配方法、存储介质及终端设备,所述方法将输入文本按照语法划分为若干各词并将匹配文本划分为若干语句;将输入文本的包含的词按照输入顺序依次与匹配文本包含的语句进行匹配,并记录各词对应的匹配信息;当匹配信息包含的干扰词的次数大于预设阈值时,停止匹配并生成匹配库;在得到匹配库后在将为匹配的词重复匹配过程直至直至词语库和/或匹配库为空,最后根据匹配得到的所有匹配库得到匹配结果,这样通过干扰词以及匹配库的比较,可以避免跳句、漏输以及错输现象,提高匹配的准确性。

A Statement Matching Method, Storage Media and Terminal Equipment

【技术实现步骤摘要】
一种语句匹配方法、存储介质及终端设备
本专利技术涉及自然语言处理
,特别涉及一种语句匹配方法、存储介质及终端设备。
技术介绍
语句匹配技术已经成为自然语言处理的核心技术之一,而且已经在多个商业系统中扮演了重要角色,例如,语音助手,听力测试,以及聊天机器人等。现有方法通常把输入文本分解成多个词语,并将各词语分别与匹配文本进行匹配,再统计所有词语与匹配文本的匹配情况,最后根据匹配情况得到匹配结果。但是,现有词语匹配方式不能够很好地抓住输入语句的不确定性,如跳句、漏输以及错输等,造成语句匹配准确性低。因而现有技术还有待改进和提高。
技术实现思路
针对现有技术的不足,本专利技术的目的是要提供一种语句匹配方法、存储介质及终端设备。为了解决上述技术问题,本专利技术所采用的技术方案如下:一种语句匹配方法,其包括:获取输入文本以及匹配文本,并对输入文本和匹配文本进行语法分析,确定对应于输入文本的词语库和对应于匹配文本的语句库;将词语库内词按照输入顺序依次与所述语句库进行匹配,并记录各词的匹配信息,其中,所述匹配信息包括干扰次数;当干扰次数达到预设次数时,停止匹配并记录除去干扰词的已匹配词语及语句库内被命中语句以生成匹配库;根据匹配库对词语库以及语句库进行更新,并重复将更新后的词语库内的词与更新后的语句库的进行匹配的步骤直至词语库和/或匹配库为空;获取匹配生成的所有匹配库,并根据获取到所有匹配库生成匹配结果。所述语句匹配方法,其中,所述将词语库内词按照输入顺序依次与所述语句库进行匹配,并记录各词的匹配信息,其中,所述匹配信息包括干扰次数具体包括:按照词语库包含词语的输入顺序将第一词与语句库进行匹配;若第一词命中语句库,则将第一词命中的语句记为第一次命中语句并将干扰次数记为0;将第二词与语句库进行匹配,判断所述第二词是否为干扰词;当所述第二词为干扰词时,将所述干扰次数累加一,并将第三词与语句库进行匹配直至干扰次数达到预设次数。所述语句匹配方法,其中,所述将第二词与语句库进行匹配,判断所述第二词是否为干扰词具体包括:将所述第二词与语句库进行匹配,并获取所述第二词的命中标记;根据所述命中标记确定第二词对应的第二命中语句,并将所述第二命中语句的第二位置与第一命中语句的第一位置进行比较;当第二位置小于第一位置时,判定所述第二词为干扰词。所述语句匹配方法,其中,所述将第二词与语句库进行匹配,判断所述第二词是否为干扰词还包括:当第二位置大于第一位置时,检测第一命中语句是否匹配完毕;若未匹配完毕,则判定所述第二词为干扰词。所述语句匹配方法,其中,所述当干扰次数达到预设次数时,停止匹配并记录除去干扰词的已匹配词语及语句库内被命中语句以生成匹配库具体包括:当干扰次数达到预设次数时,停止词语库与语句库的匹配,并判断被命中语句是否先于干扰词所处的语句;当先于干扰词所处的语句,则并提取已匹配的词语、被命中语句以及被命中语句前所有语句;将已匹配词语包含的干扰词去除以更新已匹配词语,并根据更新后的已匹配词语、被命中语句以及被命中语句前所有语句生成匹配库。所述语句匹配方法,其中,所述当干扰次数达到预设次数时,停止匹配并记录除去干扰词的已匹配词语及语句库内被命中语句以生成匹配库还包括:当不先于干扰词所处的语句时,将被命中语句的被命中率与预设阈值进行比较;若小于等于预设阈值;则将已匹配词语包含的干扰词去除以更新已匹配词语,并根据更新后的已匹配词语生成匹配库;若大于预设阈值,则将已匹配词语包含的干扰词去除以更新已匹配词语,并根据更新后的已匹配词语、被命中语句以及被命中语句前所有语句生成匹配库。所述语句匹配方法,其中,所述根据匹配库对词语库以及语句库进行更新,并重复将更新后的词语库内的词与更新后的语句库的进行匹配的步骤直至词语库和/或匹配库为空具体包括:提取所述匹配库包含的已匹配词语以及命中语句,并将所述词语库内的所述已匹配词语删除以及将所述语句库内的所述命中语句删除,以对所述词语库以及语句库进行更新;重复将更新后的词语库内的词与更新后的语句库的进行匹配直至所有词语匹配完。所述语句匹配方法,其中,所述获取匹配生成的所有匹配库,并根据获取到所有匹配库生成匹配结果具体为:分别确定各匹配库的匹配结果,并根据各匹配库的匹配结果生成输入文本与匹配文本的匹配结果。一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如上任一所述的语句匹配方法中的步骤。一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;所述通信总线实现处理器和存储器之间的连接通信;所述处理器执行所述计算机可读程序时实现如上任一所述的语句匹配方法中的步骤。有益效果:与现有技术相比,本专利技术提供了一种语句匹配方法、存储介质及终端设备,所述方法将输入文本按照语法划分为若干各词并将匹配文本划分为若干语句;将输入文本的包含的词按照输入顺序依次与匹配文本包含的语句进行匹配,并记录各词对应的匹配信息;当匹配信息包含的干扰词的次数大于预设阈值时,停止匹配并生成匹配库;在得到匹配库后在将为匹配的词重复匹配过程直至直至词语库和/或匹配库为空,最后根据匹配得到的所有匹配库得到匹配结果,这样通过干扰词以及匹配库的比较,可以避免跳句、漏输以及错输现象,提高匹配的准确性。附图说明图1为本专利技术提供的语句匹配方法较佳实施例的流程图。图2为本专利技术提供的语句匹配方法较佳实施例中步骤S20的流程图。图3为本专利技术提供的终端设备较佳实施例的结构原理图。具体实施方式本专利技术提供一种语句匹配方法、存储介质及终端设备,为使本专利技术的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。下面结合附图,通过对实施例的描述,对
技术实现思路
作进一步说明。请参照图1,图1为本专利技术提供的语句匹配方法的较佳实施例的流程图。所述方法包括:S10、获取输入文本以及匹配文本,并对输入文本和匹配文本进行语法分析,确定对应于输入文本的词语库和对应于匹配文本的语句库。具体地,所述输入文本为接收到的用户输入文字本文档来自技高网
...

【技术保护点】
1.一种语句匹配方法,其特征在于,其包括:获取输入文本以及匹配文本,并对输入文本和匹配文本进行语法分析,确定对应于输入文本的词语库和对应于匹配文本的语句库;将词语库内词按照输入顺序依次与所述语句库进行匹配,并记录各词的匹配信息,其中,所述匹配信息包括干扰次数;当干扰次数达到预设次数时,停止匹配并记录除去干扰词的已匹配词语及语句库内被命中语句以生成匹配库;根据匹配库对词语库以及语句库进行更新,并重复将更新后的词语库内的词与更新后的语句库的进行匹配的步骤直至词语库和/或匹配库为空;获取匹配生成的所有匹配库,并根据获取到所有匹配库生成匹配结果。

【技术特征摘要】
1.一种语句匹配方法,其特征在于,其包括:获取输入文本以及匹配文本,并对输入文本和匹配文本进行语法分析,确定对应于输入文本的词语库和对应于匹配文本的语句库;将词语库内词按照输入顺序依次与所述语句库进行匹配,并记录各词的匹配信息,其中,所述匹配信息包括干扰次数;当干扰次数达到预设次数时,停止匹配并记录除去干扰词的已匹配词语及语句库内被命中语句以生成匹配库;根据匹配库对词语库以及语句库进行更新,并重复将更新后的词语库内的词与更新后的语句库的进行匹配的步骤直至词语库和/或匹配库为空;获取匹配生成的所有匹配库,并根据获取到所有匹配库生成匹配结果。2.根据权利要求1所述语句匹配方法,其特征在于,所述将词语库内词按照输入顺序依次与所述语句库进行匹配,并记录各词的匹配信息,其中,所述匹配信息包括干扰次数具体包括:按照词语库包含词语的输入顺序将第一词与语句库进行匹配;若第一词命中语句库,则将第一词命中的语句记为第一次命中语句并将干扰次数记为0;将第二词与语句库进行匹配,判断所述第二词是否为干扰词;当所述第二词为干扰词时,将所述干扰次数累加一,并将第三词与语句库进行匹配直至干扰次数达到预设次数。3.根据权利要求2所述语句匹配方法,其特征在于,所述将第二词与语句库进行匹配,判断所述第二词是否为干扰词具体包括:将所述第二词与语句库进行匹配,并获取所述第二词的命中标记;根据所述命中标记确定第二词对应的第二命中语句,并将所述第二命中语句的第二位置与第一命中语句的第一位置进行比较;当第二位置小于第一位置时,判定所述第二词为干扰词。4.根据权利要求3所述语句匹配方法,其特征在于,所述将第二词与语句库进行匹配,判断所述第二词是否为干扰词还包括:当第二位置大于第一位置时,检测第一命中语句是否匹配完毕;若未匹配完毕,则判定所述第二词为干扰词。5.根据权利要求1所述语句匹配方法,其特征在于,所述当干扰次数达到预设次数时,停止匹配并记录除去干扰词的已匹配词语及语句库内被命中语句以生成匹配库具体包括:当干扰次数达到预设次数时,停止词语库与语句库的匹配,并判断被命中语...

【专利技术属性】
技术研发人员:董延平
申请(专利权)人:TCL集团股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1