一种基于状态机的语义解析方法及装置、设备制造方法及图纸

技术编号:15690852 阅读:259 留言:0更新日期:2017-06-24 03:34
本发明专利技术公开了一种基于状态机的语义解析方法,其中,所述方法包括:确定语音产品的功能;根据所述语音产品的功能确定所述语音产品在语义解析中的步骤集合,所述步骤集合中至少包括两个以上的步骤;为所述步骤集合中的每一步骤确定对应的状态机的节点;根据确定的节点形成节点集合;将所述节点集合形成所述语音产品的状态机。本发明专利技术同时还公开了一种基于状态机的语义解析装置、设备。

Method and device for semantic analysis based on state machine

The invention discloses a semantic analysis method based on state machine, the method includes determining voice product function; based on the voice function of products identified in semantic parsing steps in the speech the steps set of products, more than two steps including at least set to determine the node state machine; the corresponding to each step of the steps in the collection; according to the nodes form a node set; the node set state machine to form the voice products. The invention also discloses a semantic analysis device and a device based on a state machine.

【技术实现步骤摘要】
一种基于状态机的语义解析方法及装置、设备
本专利技术涉及语音解析技术,尤其涉及一种基于状态机的语义解析方法及装置、设备。
技术介绍
语音助手是一款智能型的终端应用,通过智能对话与即时问答的智能交互,实现帮忙用户解决问题,其主要是帮忙用户解决生活类问题,其中苹果手机中siri开创智能语音助手的先河。语音助手是一种语音控制应用程序(App,Application;简称应用),通过终端上的声音采集硬件采集用户发出的语音,然后通过语音识别技术对语音进行识别,再对识别出的语音进行语义判断,然后在前台迅速做出回应;还可以通过麦克风与用户进行语音聊天,或者通从用户的命令,帮助用户操控智能终端。从以上可以看出,语音助手是一类可以通过语音交互来实现替代全部或部分,用户在终端如手机上的查询与操作的应用程序。用户通过此类语音应用,可以大大提高在不同场景下操作手机的便利性。其中,语音识别技术是将语音信号转换为计算机可识别的文字符号,解决让机器听懂人说话问题的技术。目前,语音平台中通常包括多个语义解析器,这是因为在语音平台的数据生成过程中,每一个语义解析器大都是为某个业务定制的,而且由于每一业务所涉及的业务数据规模、字段都存在很大的差异,因此,语音平台为每一项业务都搭建一个语义解析器。当需要增加一种新的语音业务时,语音平台还需要为该业务搭建一个语义解析器,可见,现有的语音平台对于新的业务无法进行快速扩展;因此,对于信息服务提供商而言,一般各个业务部门就有几个对应于该业务部分的语音解析器,可见,现有的语音平台虽然将各个业务的语音业务放置在一起,但是并没有做到实际意义上的整合。专利技术内容有鉴于此,本专利技术实施例为解决现有技术中存在的至少一个问题而提供一种基于状态机的语义解析方法及装置、设备,能够增强语音平台的可扩展性。本专利技术实施例的技术方案是这样实现的:第一方面,本专利技术实施例提供一种基于状态机的语义解析方法,所述方法包括:确定语音产品的功能;根据所述语音产品的功能确定所述语音产品在语义解析中的步骤集合,所述步骤集合中至少包括两个以上的步骤;为所述步骤集合中的每一步骤确定对应的状态机的节点;根据确定的节点形成节点集合;将所述节点集合形成所述语音产品的状态机。第二方面,本专利技术实施例提供一种基于状态机的语义解析方法,所述方法还包括:获取语音产品的待解析语句;将所述待解析语句输入预设的状态机的第一个节点;从所述状态机的最后一个节点获取输出结果;将所述输出结果输出。第三方面,本专利技术实施例提供一种基于状态机的语义解析装置,所述装置包括第一确定单元、第二确定单元、第三确定单元、第一形成单元和第二形成单元,其中:所述第一确定单元,用于确定语音产品的功能;所述第二确定单元,用于根据所述语音产品的功能确定所述语音产品在语义解析中的步骤集合,所述步骤集合中至少包括两个以上的步骤;所述第三确定单元,用于为所述步骤集合中的每一步骤确定对应的状态机的节点,所述第一形成单元,用于根据确定的节点形成节点集合;所述第二形成单元,用于将所述节点集合形成所述语音产品的状态机。第四方面,本专利技术实施例提供一种基于状态机的语义解析装置,所述装置还包括第三获取单元、输入单元、第四获取单元和输出单元,其中:所述第三获取单元,用于获取语音产品的待解析语句;所述输入单元,用于将所述待解析语句输入预设的状态机的第一个节点;所述第四获取单元,用于从所述状态机的最后一个节点获取输出结果;所述输出单元,用于将所述输出结果输出。第五方面,本专利技术实施例提供一种计算设备,包括:存储器、处理器和用于存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时用于实现上述第一方面或第二方面的基于状态机的语义解析方法。本专利技术实施例提供一种基于状态机的语义解析方法及装置、设备,其中,确定语音产品的功能;根据所述语音产品的功能确定所述语音产品在语义解析中的步骤集合,所述步骤集合中至少包括两个以上的步骤;为所述步骤集合中的每一步骤确定对应的状态机的节点;根据确定的节点形成节点集合;将所述节点集合形成所述语音产品的状态机;如此,能够增强语音平台的可扩展性。附图说明图1为本专利技术实施例基于状态机的语义解析方法在实现时的流程示意图;图2为相关技术中电梯门的有限状态机的状态图;图3为本实施例中状态机配置的状态图;图4为本专利技术实施例语义解析的流程示意图;图5为本专利技术实施例语义解析的流程示意图;图6为本专利技术实施例基于状态机的语义解析方法的实现流程示意图;图7为本专利技术实施例基于状态机的语义解析装置的组成结构示意图;图8为本专利技术实施例基于状态机的语义解析装置的组成结构示意图;图9为本专利技术实施例的网络架构示意图;图10为本专利技术实施例电子设备的组成结构示意图。具体实施方式现以甲公司作为信息服务提供商为例,来说明
技术介绍
中所记载的技术问题。该甲公司开设有浏览器业务和视频业务,其中这两项业务都需要进行语义解析,因为都嵌入有语音助手,以帮助那些不喜欢进行文字输入或者不具有写能力的用户。这样,用户可以在该甲公司视频业务的web页面上搜索自己感兴趣的电影,在浏览器业务的web页面上搜索自己感兴趣的关键词。由于开展视频业务和开展浏览器业务都需要用到语音解析器,因此,该甲公司将这两项业务整合在一个语音平台上;但是由于视频业务的业务数据规模、字段与浏览器业务的业务数据规模、字段都存在很大的差异,因此,在语音平台中分别为每一业务搭建一个语义解析器。当甲公司要开展一项音乐业务(如QQ音乐)时,该甲公司还需要为该音乐业务搭建一个适用于音乐业务的语义解析器,以便用户可以在即时通讯(QQ)上搜索自己感兴趣的音乐。由此可见,现有的语音平台虽然将各个业务放置在一起,但是并没有做到实际意义上的整合。此外,后台服务在进行语义解析的过程中,具体的解析算法有非常多,比如传统的正则模板、深度学习等。同时,进行产品化时,不同的产品会需要不同的场景及对应的服务。比如对于音箱,只需解析音乐、天气、提醒等有限场景;而微桌面的语音助手,打电话、发短信则是必备场景。不同的语音产品的前置适配、后置兜底要求也不一样,比如浏览器语音助手,在不能提供解析语义时,跳转搜索是合理选择,而手表语音助手则不适合现这样的逻辑。面对解析过程中如此多的变数,如果将所有逻辑写在代码中,在新接入算法或者新接入产品时,将不得不进行重新编码,非常不灵活。为了使得资源得到更加合理的利用,本专利技术以下实施例中提出一种将有限状态机应用于语义解析方法,其中,将语义解析流程中所有可能的步骤都抽象为状态机中的一个节点。即可方便开发人员添加、删除某一步骤,也可在每一种产品接入时,对各个步骤进行随意定制化,生成适应业务的语义解析模型;这样,算法研究人员可灵活更新解析算法,语音产品接入时可灵活定制解析流程。由以上可以看出,采用本专利技术实施例提供的技术方案,将对现有的语音平台进行改进,不但使得资源能够得到更合理的利用,而且能够在有新业务接入时,为该新业务搭建一个语义解析器不再艰难。为了更好地理解本专利技术实施例,本专利技术实施例提供以下名词的解释:语音助手:根据用户的语音输入,为用户提供相应服务的软件。语音平台,本实施例中的语音平台是对现有语音平台的改进,能够为多个产品提供语义解析服务。场景:一句话所本文档来自技高网
...
一种基于状态机的语义解析方法及装置、设备

【技术保护点】
一种基于状态机的语义解析方法,其特征在于,所述方法包括:确定语音产品的功能;根据所述语音产品的功能确定所述语音产品在语义解析中的步骤集合,所述步骤集合中至少包括两个以上的步骤;为所述步骤集合中的每一步骤确定对应的状态机的节点;根据确定的节点形成节点集合;将所述节点集合形成所述语音产品的状态机。

【技术特征摘要】
1.一种基于状态机的语义解析方法,其特征在于,所述方法包括:确定语音产品的功能;根据所述语音产品的功能确定所述语音产品在语义解析中的步骤集合,所述步骤集合中至少包括两个以上的步骤;为所述步骤集合中的每一步骤确定对应的状态机的节点;根据确定的节点形成节点集合;将所述节点集合形成所述语音产品的状态机。2.根据权利要求1所述的方法,其特征在于,所述将所述节点集合形成所述语音产品的状态机,包括:根据所述步骤集合中每两个步骤之间的连接关系确定各每两个步骤对应的节点之间的连接关系;根据所述节点集合中各节点之间的连接关系形成所述语音产品的状态机。3.根据权利要求1所述的方法,其特征在于,所述将所述节点集合形成所述语音产品的状态机,包括:获取每一步骤对应的节点的标识;根据每一步骤对应的节点的标识按照预设的状态图形成所述语音产品的状态机。4.根据权利要求3所述的方法,其特征在于,所述形成预设的状态图包括:确定语义解析中的步骤全集,所述步骤全集至少包括两个以上的步骤,所述步骤集合为所述步骤全集的子集;为所述步骤全集中的每一步骤封装为状态机的节点;根据所述步骤全集中每两个步骤之间的连接关系确定各每两个步骤对应的节点之间的连接关系;根据各节点之间的连接关系,形成状态图。5.根据权利要求4所述的方法,其特征在于,所述为所述步骤集合中的每一步骤确定对应的状态机的节点,包括:获取步骤与节点之间的关联信息;根据所述关联信息确定为所述步骤集合中的每一步骤确定对应的状态机的节点。6.根据权利要求1至5任一项所述的方法,其特征在于,所述方法还包括:获取第一连接关系,所述第一连接关系为所述步骤集合中第一步骤与所述步骤集合中除所述第一步骤外其他步骤之间的连接关系;获取第二连接关系,所述第二连接关...

【专利技术属性】
技术研发人员:冯晓冰廖玲王飞徐浩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1