【技术实现步骤摘要】
【国外来华专利技术】
本公开的实施例总体涉及计算机技术,并且更具体地涉及语言处理。
技术介绍
1、随着互联网的快速发展,诸如博客、论坛以及聊天软件的各种平台上出现了大量的短文本。短文本的示例可以在诸如聊天消息、搜索查询、产品描述或在线评论的许多上下文中找到。这些短文本承载着丰富的信息,例如数据信息。短文本是稀疏的,特征数量少,并且无法提供足够的词共现,这对使用现有的自然语言处理(nlp)方法来解析短文本提出了巨大的挑战。
技术实现思路
1、本专利技术的实施例提供了一种用于解析短文本的方案。
2、在第一方面,提出了一种方法。方法包括:获得与短文本相关联的句子集合,句子集合中的每个句子包含短文本中的所有单词;确定与句子集合相关联的句法特征集合,句法特征集合中的每个句法特征指示对应句子的成分关系和依存关系中的至少一项;以及基于句法特征集合来确定短文本的语义结构。根据本公开的第一方面的方法能够利用现有的nlp技术来确定短文本的语义结构。从而,与传统解决方案相比,根据本公开的第一方面的方法使得能够以更低的成本
...【技术保护点】
1.一种方法,包括:
2.根据权利要求1所述的方法,其中确定所述短文本的所述语义结构包括:
3.根据权利要求2所述的方法,其中所述句子集合包括目标句子,所述句法特征集合包括与所述目标句子相关联的目标句法特征,所述目标句法特征包括指示所述目标句子的所述成分关系的目标成分树,所述至少一个候选语义结构包括与所述目标句子相关联的目标候选语义结构,并且确定所述至少一个候选语义结构包括:
4.根据权利要求3所述的方法,其中重构所述子树包括:
5.根据权利要求3所述的方法,其中重构所述子树包括:
6.根据权利要求5所述的方
...【技术特征摘要】
【国外来华专利技术】
1.一种方法,包括:
2.根据权利要求1所述的方法,其中确定所述短文本的所述语义结构包括:
3.根据权利要求2所述的方法,其中所述句子集合包括目标句子,所述句法特征集合包括与所述目标句子相关联的目标句法特征,所述目标句法特征包括指示所述目标句子的所述成分关系的目标成分树,所述至少一个候选语义结构包括与所述目标句子相关联的目标候选语义结构,并且确定所述至少一个候选语义结构包括:
4.根据权利要求3所述的方法,其中重构所述子树包括:
5.根据权利要求3所述的方法,其中重构所述子树包括:
6.根据权利要求5所述的方法,其中所述目标句法特征还包括指示所述目标句子的所述依存关系的目标依存树,并且确定所述根节点包括:
7.根据权利要求1所述的方法,其中所述短文本对应于搜索查询,并且获得所述句子集合包括:
8.根据权利要求1所述的方法,其中所述句子集合包括目标句子,确定所述句法特征集合包括:
9.一种系统,包括:
10.根据权利要求9所述的系统,其中确定所述短文本的所述语义结构包括:
11.根据权利要求10所述的系统,其中所述句子集合包括目标句子,所述句法特征集合包括与所述目标句子相关联的目标句法特征,所述目标句法特征包括指示所述目标句子的所述成分关系的目标成分树,所述至少一个候选语义结构包括与所述目标句子相关联的目标候选语义结...
【专利技术属性】
技术研发人员:熊泓宇,汪罕,厉锐,冯一琦,高远,曾翔宇,鹿青怡,刘宾,
申请(专利权)人:脸萌有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。