篇章语义标注的方法、系统及装置制造方法及图纸

技术编号:31020436 阅读:16 留言:0更新日期:2021-11-30 03:08
本发明专利技术公开了篇章语义标注的方法、系统及装置,包括,获取生语料文档,建立所述生语料文档的篇

【技术实现步骤摘要】
篇章语义标注的方法、系统及装置


[0001]本专利技术涉及篇章语义领域,尤其是涉及一种篇章语义标注的方法、系统及装置。

技术介绍

[0002]自然语言研究研究人的思维模式,而人的思维最重要的特点是具有层次性、抽象性,人最擅长直觉地看到事物高层的抽象联系。自然语言研究的语义代表人脑认知的事物之间的抽象联系,因此真正能代表人思维的语义应该也具有层次性、抽象性。语义技术通过预先定义的方式实现抽象性,比如通过预先定义的词性系统进行词性标注,而不会反过来通过语料发现一个新的词性。但是,现有的语义理论和技术对于语义层次的定义仅限于句子级,关于篇章语义的定义和标注的方法几乎没有,也没有能够在工程上使用的篇章语义标注方法。
[0003]现有方法的不足表现为句子级的语义不能满足工程上对于大空间、多层次、长时间的业务活动进行语义描述的要求,基于单句子及句内词的语义标注方法无法实现具有复杂层次结构的篇章语义标注。

技术实现思路

[0004]本专利技术的目的在于提供一种篇章语义标注的方法、系统及装置,旨在解决篇章语义标注。
[0005]本专利技术提供一种篇章语义标注的方法,包括:
[0006]S1、获取生语料文档,建立所述生语料文档的篇









槽的层次语义结构;
[0007]S2、将所述层次语义结构对应层次融合成统一的篇章语义文档;
[0008]S3、基于正确的逻辑思维对融合后的篇章语义文档进行层次和序号修改;
[0009]S4、将修改后的篇章语义文档存储到熟语料库,完成对所述篇章语义的标注。
[0010]本专利技术还提供一种篇章语义标注的系统,包括,
[0011]语义结构模块:用于获取生语料文档,建立所述生语料文档的篇









槽的层次语义结构;
[0012]融合模块:用于将所述层次语义结构对应层次融合成统一的篇章语义文档;
[0013]修改模块:用于基于正确的逻辑思维对融合后的篇章语义文档进行层次和序号修改;
[0014]存储模块:用于将修改后的篇章语义文档存储到熟语料库,完成对所述篇章语义的标注。
[0015]本专利技术实施例还提供一种篇章语义标注的装置,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述一种篇章语义标注的方法的步骤。
[0016]本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储
有信息传递的实现程序,所述程序被处理器执行时实现上述方法的步骤。
[0017]采用本专利技术实施例,满足工程上对于大空间、多层次、长时间的业务活动进行语义描述的要求,实现具有复杂层次结构的篇章语义标注。
[0018]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
附图说明
[0019]为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是本专利技术实施例的篇章语义标注的方法的流程图;
[0021]图2是现有技术中的文档结构示意图;
[0022]图3是本专利技术实施例的篇章语义标注的方法的逻辑结构示意图;
[0023]图4是本专利技术实施例的篇章语义标注的方法的生语料文档的格式示意图;
[0024]图5是本专利技术实施例的篇章语义标注的方法的篇章语义文档的格式示意图;
[0025]图6是本专利技术实施例的篇章语义标注的方法的标注语料格式示意图;
[0026]图7是本专利技术实施例的篇章语义标注的方法的篇章语义结构示意图;
[0027]图8是本专利技术实施例的篇章语义标注的方法的篇章语义融合示意图;
[0028]图9是本专利技术实施例的篇章语义标注的方法的具体流程图;
[0029]图10是本专利技术实施例的篇章语义标注的系统的示意图;
[0030]图11是本专利技术实施例的篇章语义标注的装置的示意图。
[0031]附图标记说明:
[0032]101:语义结构模块;102:融合模块;103:修改模块;104:存储模块。
具体实施方式
[0033]下面将结合实施例对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0034]在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。
[0035]此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本专利技术的描述中,“多个”的含义是两个或两个以
上,除非另有明确具体的限定。此外,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。
[0036]方法实施例
[0037]根据本专利技术实施例,提供了一种篇章语义标注的方法,
[0038]图1是本专利技术实施例的篇章语义标注的方法的流程图,如图1所示,具体包括:
[0039]S1、获取生语料文档,建立所述生语料文档的篇









槽的层次语义结构;
[0040]S1具体包括:获取生语料文档,根据对应的篇



节字典、段落语义字典、句子语义字典和槽位字典,建立所述文章的篇





本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种篇章语义标注的方法,其特征在于,包括,S1、获取生语料文档,建立所述生语料文档的篇









槽的层次语义结构;S2、将所述层次语义结构对应层次融合成统一的篇章语义文档;S3、基于正确的逻辑思维对融合后的篇章语义文档进行层次和序号修改;S4、将修改后的篇章语义文档存储到熟语料库,完成对所述篇章语义的标注。2.根据权利要求1所述的方法,其特征在于,S1具体包括:获取生语料文档,根据对应的篇



节字典、段落语义字典、句子语义字典和槽位字典,建立所述文章的篇









槽的层次语义结构,其中,篇



节字典和段落语义字典的以句子语义为基本单位。3.根据权利要求2所述的方法,其特征在于,S2具体包括:将所述文章的语义层次对应层次并基于表的形式融合成统一的篇章语义文档。4.根据权利要求3所述的方法,其特征在于,所述S3具体包括:对融合篇章语义文档进行层次和序号修改,并获取人工没有定义的章节按照层次进行的定义。5.一种篇章语义标注的系统,其特征在于,包括,语义结构模块:用于获取生语料文档,建立所述生语料文档的篇







...

【专利技术属性】
技术研发人员:张学龙谭培波刘锋刘伟华马青马学兰
申请(专利权)人:北京智通云联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1