当前位置: 首页 > 专利查询>王峥嵘专利>正文

一种基于正则表达式的语义分析方法技术

技术编号:16333569 阅读:43 留言:0更新日期:2017-10-02 02:45
本发明专利技术公开了一种基于正则表达式的语义分析方法,包括步骤:建立正则表达式组合数据库,并将各组合和服务建立映射关系;获取用户语音输入所对应的文本信息,对文本信息进行组合的匹配;执行匹配的组合所关联的服务。本发明专利技术处理手段非常透明,利于开发者根据需求做进一步优化,并且语义分析精确、灵活、执行效率高。

A semantic analysis method based on regular expressions

The invention discloses a semantic analysis method based on regular expression includes the following steps: establishing a regular expression and the combination of database, combination and service mapping; the corresponding user voice input to obtain the text information, text information combination matching; matching is performed in the combination of related services. The processing method of the invention is very transparent, which is beneficial for the developer to further optimize according to the requirement, and the semantic analysis is accurate, flexible and high in execution efficiency.

【技术实现步骤摘要】
[
]本专利技术涉及语义分析领域,尤其涉及一种基于正则表达式的语义分析方法。[
技术介绍
]语义分析技术被广泛地用于现实生活中,如iphone的siri服务,以及讯飞语音服务、百度语音服务等,均能为用户提供基于语音命令的搜索服务及其他服务,其主要做法是:先将语音数据转换为文本信息,然后利用文本匹配方式搜索关键字,根据关键字输出相应的项目,即单纯通过关键词进行语义分析,但是我们知道,这些服务中的语义分析方式不可避免地具有以下几种缺陷:一是由于识别的内容过于宽泛,需要大量的第三方通用语义识别开发包,导致程序体积臃肿,识别效率低;二是根据识别语义输出的项目无针对性,执行效率低;三是采用非常复杂并且不透明的处理过程,使得不便于对软件做出精细调整。因此,对识别、执行效率等拥有更高要求的汽车行驶环境,有必要提供一套新的语义分析方案。[
技术实现思路
]针对上述问题,本专利技术提供了一种基于正则表达式的语义分析方法,其不仅具有识别效率高、执行效率高的优势,还能根据需求做出精细调整。具体技术方案如下:一种基于正则表达式的语义分析方法,包括步骤:根据关键字组建正则表达式组合,并将组建的组合预先存于数据库中,每个组合关联一项或多项服务;获取用户语音输入所对应的文本信息,对所述文本信息进行组合的匹配;执行匹配的组合所关联的服务。人们可以根据所需的服务,预先设置与之对应的组合;当用户的语音转换为文本信息后,自动检测文本信息中是否含有匹配的组合,然后根据匹配的组合,执行相应的服务:首先,本专利技术订制化程度非常高,按正则表达式对关键字进行组合,并按正则表达式进行匹配,由于正则表达式是国际通用的文本处理规则,因此处理手段非常透明,开发者可以根据需要进行微调,而规避了深奥的语义识别理论;其次,本专利技术精确了识别范围,简化了识别流程,精简了程序运算资源;最后,本专利技术采用了关键字或组合与具体执行的服务相关联的方式,执行效率得到有效提高。[附图说明]图1是本专利技术的方法流程图。[具体实施方式]为了使本专利技术的目的、技术方案和优点更加清晰,下面结合附图和实施方式作进一步地详细描述。本专利技术所述的基于正则表达式的语义分析方法,可以是基于ios、Android、WP等操作系统上的APP软件,其载体主要为移动终端,其可以广泛的用于语义分析领域,但需要说明的是,本方法尤其适合应用在车辆中,如在应用在车辆导航仪上,显而易见,在车辆导航仪上植入本方法对应的软体,将能够使其在语义分析效率、及执行效率上得到大幅提升。下面通过一较优实施例对本专利技术的方案做具体的介绍。另外,正则表达式是国际通用的文本处理规则,但并不排除各大厂商进行规则的微调,其具体使用方法可以参考互联网上公开的文档,本文不予详述,当然,为了帮助本领域技术人员能够更好的理解,会在下文中简介本申请文件中多次使用到的符号,并会在下文中以举例的方式穿插阐述。本专利技术所述的基于正则表达式的语义分析方法,包括步骤:S1、根据关键字组建正则表达式组合,并将组建的组合预先存于数据库中,每个组合关联一项或多项服务;当开发者打算一项服务时,首先要寻找人们在要求这一服务时,会说的惯常用语,找出多个惯用用语中的共性,即关键字,然后根据这些关键字,按正则表达式的规则,组建含这些关键字的正则表达式组合,然后将这一组合和其对应的服务进行关联;当开发者需要开发一整套服务时,则需要为一整套服务中的各种不同的服务分别关联不同的组合,这些组合预先存于数据库中,供需要的时候调用;需要说明是,当仅使用一个关键字或一个关键词就可以精确定位服务的时候,可以建立该关键字或关键词和相应的服务进行关联,该关键字或关键词可存于数据库中,当然,为了统一性,也可以将单个关键字或单个关键词转换成正则表达式组合的形式存于数据库中;本实施例优选为每个组合只关联一项服务,这样做的好处是,当文本信息中的内容成功匹配到相应的组合后,就可以立即执行组合所关联的服务,因此拥有更加高效的执行效率,尤其适用于对时间要求的高速行驶的车辆中;需要说明的是,关联方式并非是一一对应的关系,即“组合-服务”之间的映射关系,可以是一一对应关系,可以是多对一的映射关系,当然也可以是一对多的映射关系,下文具体的实施例中即是建立多对一的映射关系;S2、获取用户语音输入所对应的文本信息,对所述文本信息进行组合的匹配;即根据正则式匹配规则,将文本信息中的内容和数据库中的组合进行匹配,检测文本信息中是否有匹配的组合存在;需要说明的是,各个组合在对文本信息进行遍历式的匹配时,是具有顺序性的逐个匹配,具体可采用正序或倒序,但为了高效性,本专利技术并不排斥其他的高效的检索或匹配方式;S3、执行匹配的组合所关联的服务;即当在文本信息中检测到有匹配的组合存在时,则执行该组合所关联的服务。在一优选实施例中,还有部分组合对应的设有功能参数,若文本信息和某组合匹配,而该组合对应的设有功能参数,则需要在文本信息相应的位置处提取出所述功能参数,若提取不到,则发出提示用户输入功能参数的请求。例如用户语音输入“上深圳宝安机场去”,该语音信息转换为文本信息后,文本信息与“(上.+)”的组合匹配,而该组合就设有一个表征地址信息的功能参数,因此匹配后,就会在“上”后面的文本信息中提取一个地址信息“深圳宝安机场”,并最终输出到“深圳宝安机场”的导航线路。另外,至少部分组合还对应有附加参数,如在“(上.+)”的组合除了关联信息外,还具有附加信息,该附加信息是要排查“上海”、“上虞”等以“上”为开头的地址,可以看出,附加参数可以理解为是一种对有效信息的补充或对无效信息的排除。在步骤S3中,在执行相应的服务之前,还包括确认或进一步选择性确认的步骤:所谓确认,即执行前的“是与否”的确认,如“(上.+)”的组合与“上深圳宝安机场去”匹配成功后,应该输出到“深圳宝安机场”的导航线路,但在执行该服务前,会有一确认如“请确认是否导航到深圳宝安机场”,若得到用户的确认后,立即执行该服务,输出到“深圳宝安机场”的导航线路;所谓进一步选择性的确认,如输出“到深圳宝安机场东,到深圳宝安机场西,请确认”,待用户确认后,然后输出相应的导航线路。下面采用一具体的实施例,加以说明。在该实施例中,关联有一项服务的关键字或组合与功能参数、服务之间的映射关系如下:从上表中可以看出,部分组合对应的设有功能参数,并且本实施例中的组合与服务之间是多对一的映射关系,另外,上述表格并不用于限制本本文档来自技高网...

【技术保护点】
一种基于正则表达式的语义分析方法,其特征在于,包括步骤:根据关键字组建正则表达式组合,并将组建的组合预先存于数据库中,每个组合关联一项或多项服务;获取用户语音输入所对应的文本信息,对所述文本信息进行组合的匹配;执行匹配的组合所关联的服务。

【技术特征摘要】
1.一种基于正则表达式的语义分析方法,其特征在于,包括步骤:
根据关键字组建正则表达式组合,并将组建的组合预先存于数据库中,每个组合关联一
项或多项服务;
获取用户语音输入所对应的文本信息,对所述文本信息进行组合的匹配;
执行匹配的组合所关联的服务。
2.根据权利要求1所述的语义分析方法,其特征在于,至少部分组合对应的设有功能参
数,根据该功能参数所处的位置从文本信息进行参数提取或者发出提示用户输入所述功能参
数的请求。
3.根据权利要求2所述的语义分析方法,其特征在于,至少部分组合还对应有附...

【专利技术属性】
技术研发人员:王峥嵘
申请(专利权)人:王峥嵘
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1