一种指示描述信息的歧义的方法和装置制造方法及图纸

技术编号:14117444 阅读:85 留言:0更新日期:2016-12-08 00:48
本发明专利技术提供了一种指示描述信息的歧义的方法和装置,其中所述方法包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。本发明专利技术通过将描述信息的歧义予以指示,可以更好地为交互的一方或多方明确描述信息是否足够清楚。

【技术实现步骤摘要】

本专利技术涉及信息分析领域,尤其涉及一种指示描述信息的歧义的方法和装置
技术介绍
现有技术中,用户之间或人机之间或机器与机器之间基于描述信息进行交互时,通常容易遇到理解或分析上的歧义,例如,对于一段描述信息“用户登录成功,如果当前用户是管理员,可以锁定任何用户”,在该段描述信息中,词“用户”第一次作为主语出现,第二次作为宾语出现,从而引发两次出现的“用户”是指同一用户还是指不同用户的歧义。歧义的出现,往往导致交互各方的交互效率显著降低,特别在业务需求领域,业务方(也即提出需求的当事方)通过将描述的需求信息提供给需求实现方,如果描述的需求信息存在歧义,则容易导致实现方在需求实现的效果上与业务方的实际需求背道而驰。
技术实现思路
本专利技术解决的技术问题之一通过将描述信息中存在歧义的地方指出,以更好地为交互的一方或多方明确描述信息是否足够清楚,从而提升交互效率。根据本专利技术的一个实施例,提供了一种指示描述信息的歧义的方法,包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果
包括句子的语法分析的结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。根据本专利技术的另一个实施例,提供了一种指示描述信息的歧义的装置,包括:信息接收单元,被配置为接收输入的描述信息;句子划分单元,被配置为将所述描述信息分为句子;分词单元,被配置为将句子分成词意基本单位;第一判断单元,被配置为基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果包括句子的语法分析的结果;第二判断单元,被配置为基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;指示单元,被配置为基于第一判断结果和第二判断结果,指示描述信息的歧义。由于本专利技术实施例通过对描述信息进行分析,将其中的歧义予以指示,如此,有利于使提供描述信息的一方明确该信息的清楚程度,从而根据指示的歧义进一步完善描述信息,避免引起读取该描述信息的另一方在理解或分析上的歧义,提升交互各方的沟通效率,大幅度减少交互各方在沟通过程中消除歧义的成本。本领域普通技术人员将了解,虽然下面的详细说明将参考图示实施例、附图进行,但本专利技术并不仅限于这些实施例。而是,本专利技术的范围是广泛的,且意在仅通过后附的权利要求限定本专利技术的范围。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为根据本专利技术一个实施例的指示描述信息的歧义的方法1的流程图;图2为根据本专利技术另一个实施例的指示描述信息的歧义的方法1的流程图;图3为根据本专利技术另一个实施例的指示描述信息的歧义的方法1的流程图;图4为根据本专利技术另一个实施例的指示描述信息的歧义的方法1的流程图;图5为根据本专利技术另一个实施例的指示描述信息的歧义的方法1的流程图;图6为根据本专利技术一个实施例的指示描述信息的歧义的装置2的框图;图7为根据本专利技术另一个实施例的指示描述信息的歧义的装置2的框图;图8为根据本专利技术另一个实施例的指示描述信息的歧义的装置2的框图;图9为根据本专利技术另一个实施例的指示描述信息的歧义的装置2的框图;图10为根据本专利技术另一个实施例的指示描述信息的歧义的装置2的框图;附图中相同或相似的附图标记代表相同或相似的部件。具体实施方式在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于
方法、函数、规程、子例程、子程序等等。在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的存续指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本专利技术,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本专利技术。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本专利技术,也应包含在本专利技术保护范围以内,并以引用方式包含于此。后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本专利技术的示例性实施例的目的。但是本专利技术可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施
例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。应当理解的是,当一个单元被称为“连接”或“耦合”到另一单元时,其可以直接连接或耦合到所述另一单元,或者可以存在中间单元。与此相对,当一个单元被称为“直接连接”或“直接耦合”到另一单元时,则不存在中间单元。应当按照类似的方式来解释被用于描述单元之间的关系的其他词语(例如“处于...之间”相比于“直接处于...之间”,“与...邻近”相比于“与...直接邻近”等等)。这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征本文档来自技高网
...
一种指示描述信息的歧义的方法和装置

【技术保护点】
一种指示描述信息的歧义的方法,包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果包括句子的语法分析的结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。

【技术特征摘要】
1.一种指示描述信息的歧义的方法,包括:接收输入的描述信息;将所述描述信息分为句子;将句子分成词意基本单位;基于对句子的语法分析,获得第一判断结果,其中所述第一判断结果包括句子的语法分析的结果;基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果,其中所述第二判断结果包括所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的判断结果;基于第一判断结果和第二判断结果,指示描述信息的歧义。2.根据权利要求1所述的方法,其中所述词意基本单位包括词和/或词组。3.根据权利要求1所述的方法,其中所述接收输入的描述信息的步骤还包括:基于预定的约束条件,过滤掉违反约束条件的所述描述信息,其中所述将所述描述信息分为句子的步骤包括:将过滤后的描述信息分为句子。4.根据权利要求1所述的方法(1),其中所述将所述句子句子分成词意基本单位(S103)的步骤包括:参考通用词意基本单位库和专业词意基本单位库,将句子分成词意基本单位。5.根据权利要求1所述的方法,其中所述基于对句子的语法分析,获得第一判断结果包括:基于对句子的语法分析、以及句子的句型是否匹配于白名单句型库中的句型,获得第一判断结果,其中白名单句型库配置为存储有虽不符合语法但无歧义的句型。6.根据权利要求5所述的方法,其中白名单句型库中的句型是预先设置的。7.根据权利要求5所述的方法,还包括:响应于接收到用户对指示的描述信息的歧义是句子不符合语法的错判纠正反馈,从错判纠正反馈所针对的句子提取出句型;将提取出的句型放入所述白名单句型库。8.根据权利要求1所述的方法,其中基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位,获得第二判断结果的步骤包括:-基于所述描述信息中是否含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位、以及该多次出现的词意基本单位是否在白名单词意基本单位库中,获得第二判断结果;其中白名单词意基本单位库配置为存储有虽在描述信息中以多种词性和/或作为不同的语法成分多次出现、但无歧义的词意基本单位。9.根据权利要求8所述的方法,其中白名单词库中的词意基本单位是预先设置的。10.根据权利要求8所述的方法,还包括:响应于接收到用户对指示的描述信息的歧义是所述描述信息中含有以多种词性和/或作为不同的语法成分多次出现的词意基本单位的错判纠正反馈,将错判纠正反馈所针对的所述词意基本单位放入白名单词意基本单位库。11.根据权利要求4所述的方法,其中通用词意基本单位库包含通用词和通用词组,专业词意基本单位库包含专业词和专业词组,其中通用词组是响应于用户的输入而添加到通用词意基本单位库的,专业词组是响应于用户的输入而添加到专业词意基本单位库的。12.根据权利要求1所述的方法,还包括:如果指示的描述信息的歧义是句子不符合语法,提示对应的修改建议;响应于接收到对所述修改建议的接受或选择,消除所述修改建议的提示。13.根据权利要求10所述的方法,还包括:如果指示的描述信息的歧义是句子不符合语法,根据历史上在指示的描述信息的歧义是同一句子不符合语法的情况下接收到的对提示的修改建议的接受或选择的次数与预定阈值的比较,确定是否采用该修改建议。14.一种指示描述信息的歧义的装置,包括:信息接收单元,被配置为接收输入的描述...

【专利技术属性】
技术研发人员:张翔
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1