【技术实现步骤摘要】
篇章语义标注的方法、系统及装置
[0001]本专利技术涉及篇章语义领域,尤其是涉及一种篇章语义标注的方法、系统及装置。
技术介绍
[0002]自然语言研究研究人的思维模式,而人的思维最重要的特点是具有层次性、抽象性,人最擅长直觉地看到事物高层的抽象联系。自然语言研究的语义代表人脑认知的事物之间的抽象联系,因此真正能代表人思维的语义应该也具有层次性、抽象性。语义技术通过预先定义的方式实现抽象性,比如通过预先定义的词性系统进行词性标注,而不会反过来通过语料发现一个新的词性。但是,现有的语义理论和技术对于语义层次的定义仅限于句子级,关于篇章语义的定义和标注的方法几乎没有,也没有能够在工程上使用的篇章语义标注方法。
[0003]现有方法的不足表现为句子级的语义不能满足工程上对于大空间、多层次、长时间的业务活动进行语义描述的要求,基于单句子及句内词的语义标注方法无法实现具有复杂层次结构的篇章语义标注。
技术实现思路
[0004]本专利技术的目的在于提供一种篇章语义标注的方法、系统及装置,旨在解决篇章语义标注。< ...
【技术保护点】
【技术特征摘要】
1.一种篇章语义标注的方法,其特征在于,包括,S1、获取生语料文档,建立所述生语料文档的篇
‑
章
‑
节
‑
段
‑
句
‑
槽的层次语义结构;S2、将所述层次语义结构对应层次融合成统一的篇章语义文档;S3、基于正确的逻辑思维对融合后的篇章语义文档进行层次和序号修改;S4、将修改后的篇章语义文档存储到熟语料库,完成对所述篇章语义的标注。2.根据权利要求1所述的方法,其特征在于,S1具体包括:获取生语料文档,根据对应的篇
‑
章
‑
节字典、段落语义字典、句子语义字典和槽位字典,建立所述文章的篇
‑
章
‑
节
‑
段
‑
句
‑
槽的层次语义结构,其中,篇
‑
章
‑
节字典和段落语义字典的以句子语义为基本单位。3.根据权利要求2所述的方法,其特征在于,S2具体包括:将所述文章的语义层次对应层次并基于表的形式融合成统一的篇章语义文档。4.根据权利要求3所述的方法,其特征在于,所述S3具体包括:对融合篇章语义文档进行层次和序号修改,并获取人工没有定义的章节按照层次进行的定义。5.一种篇章语义标注的系统,其特征在于,包括,语义结构模块:用于获取生语料文档,建立所述生语料文档的篇
‑
章
‑
节
‑
段
‑
...
【专利技术属性】
技术研发人员:张学龙,谭培波,刘锋,刘伟华,马青,马学兰,
申请(专利权)人:北京智通云联科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。