用于智慧城市少样本数据建模的实体关系表示方法及系统技术方案

技术编号:26171204 阅读:29 留言:0更新日期:2020-10-31 13:42
本发明专利技术实施例提供一种用于智慧城市少样本数据建模的实体关系表示方法及系统,该方法包括:获取智慧城市数据的支持集和查询集,并通过非线性映射ReLU,将支持集和查询集的语义表示映射到对应的通路中;通过类内信息通路,对支持集中每个类别映射后的实例信息进行交互处理;通过类间信息通路,对支持集中所有类别映射后的整体信息进行交互处理;通过支持集‑查询集信息通路,对支持集映射后的所有实例和所述查询集映射后的所有实例进行信息交互。本发明专利技术实施例通过多通路并行处理的方式保留更全面的信息,丰富实体关系类别的文本表示,提高类别知识迁移的信息量,提取更多有价值的特征,更准确地表示实体关系类别的支持集与查询集。

【技术实现步骤摘要】
用于智慧城市少样本数据建模的实体关系表示方法及系统
本专利技术涉及实体关系表示
,尤其涉及一种用于智慧城市少样本数据建模的实体关系表示方法及系统。
技术介绍
在智慧城市建设过程中,智慧城市知识图谱作为提高智能化建设的技术体系尤为重要。在知识图谱的构建过程中,往往需要从海量的文本数据中抽取实体关系,在深度学习技术的加持下,对实体关系文本进行语义表示,成为影响实体关系抽取性能的关键。由于智慧城市数据体系的实体关系繁杂,如果不具备专业知识,难以准确标注实体之间的关系类别,特别是冷门与复杂的实体关系,类别往往是长尾的,这种数据的稀缺问题,严重影响了现有方法对实体关系的表示能力,从而阻碍了整个知识图谱构建的准确性。针对目前智慧城市建设过程中,数据资源共享不足、数据样本较少等问题,通过远程监督机制,可以在一定程度上缓解有标注数据稀缺的问题,但是在技术的落地过程中,智慧城市数据模型的实体关系抽取问题仍然严峻。并且,在实际的生产场景中,随着知识库的更新,会面临新的实体关系的加入,而新的实体关系在知识库中没有足够数据支持,无法依靠远程监督机制生成有本文档来自技高网...

【技术保护点】
1.一种用于智慧城市少样本数据建模的实体关系表示方法,其特征在于,包括:/n获取智慧城市数据的支持集和查询集,并通过非线性映射ReLU,将所述支持集和所述查询集的语义表示映射到对应的通路中,所述通路包括类内信息通路、类间信息通路和支持集-查询集信息通路;/n通过所述类内信息通路,对所述支持集中每个类别映射后的实例信息进行交互处理;/n通过所述类间信息通路,对所述支持集中所有类别映射后的整体信息进行交互处理;/n通过所述支持集-查询集信息通路,对所述支持集映射后的所有实例和所述查询集映射后的所有实例进行信息交互。/n

【技术特征摘要】
1.一种用于智慧城市少样本数据建模的实体关系表示方法,其特征在于,包括:
获取智慧城市数据的支持集和查询集,并通过非线性映射ReLU,将所述支持集和所述查询集的语义表示映射到对应的通路中,所述通路包括类内信息通路、类间信息通路和支持集-查询集信息通路;
通过所述类内信息通路,对所述支持集中每个类别映射后的实例信息进行交互处理;
通过所述类间信息通路,对所述支持集中所有类别映射后的整体信息进行交互处理;
通过所述支持集-查询集信息通路,对所述支持集映射后的所有实例和所述查询集映射后的所有实例进行信息交互。


2.根据权利要求1所述的用于智慧城市少样本数据建模的实体关系表示方法,其特征在于,所述通过非线性映射ReLU,将所述支持集和所述查询集的语义表示映射到对应的通路中,包括:
通过类内通道映射公式,将支持集和查询集的语义表示映射到类内信息通路中,所述类内通道映射公式为:



其中,表示每个类别映射后的实例信息,ReLU表示非线性映射;表示经过CNN层的提取信息,得到支持集的高阶非线性;WIC表示类内信息通道中维度为dCNN×dA的权重矩阵,dA表示隐层维度;
通过类间通道映射公式,将支持集和查询集的语义表示映射到类间信息通道中,所述类间通道映射公式为:



其中,表示映射后所有类别的整体信息,WEC表示类间信息通道中维度为dCNN×dA的权重矩阵;
通过支持集-查询集通道映射公式,将支持集和查询集的语音表示映射到支持集-查询集信息通道中,所述支持集-查询集通道映射公式为:



其中,WSQ表示支持集-查询集信息通道中维度为dCNN×dA的权重矩阵,表示支持集映射后的所有实例,QSQ表示查询集映射后的所有实例;QCNN表示经过CNN层的提取信息,得到查询集的高阶非线性。


3.根据权利要求2所述的用于智慧城市少样本数据建模的实体关系表示方法,其特征在于,所述通过所述类内信息通路,对所述支持集中每个类别映射后的实例信息进行交互处理,包括:
对所述支持集中每个类别映射后的实例信息在T-dimension进行max-pooling操作,得到每个关系类别的实例集合表示c=1,2,…,C;
对每个关系列表的实例集合中K个实例进行两两点乘,得到第一attention矩阵;
对所述第一attention矩阵进行softmax归一化处理,得到类内信息通路的标准信息流输出,公式为:



其中,softmaxK表示对第一attention矩阵在K-dimension执行softmax归一化操作,表示每个关系类别的实体集合,c=1,2,…,C。


4.根据权利要求2所述的用于智慧城市少样本数据建模的实体关系表示方法,其特征在于,所述通过所述类间信息通路,对所述支持集中所有类别映射后的整体信息进行交互处理,包括:
对所述支持集中所有类别映射后的整体信息进行max-pooling和ave-pooling操作,并将max-pooling和ave-pooling操作后的整体信息在dA-dimension进行结合,得到所述支持集中所有类别的整体信息实例集合,公式为:



其中,表示支持集和查询集的语义表示映射到类间信息通路上在c=1到c=C的求和;maxpool和avepool分别表示max-pooling和ave-pooling操作;
对所述整体信息实例集合的各类低维表示进行点乘,得到第二attention矩阵;
对所述第二attention矩阵在C-dimension进行softmax归一化处理,得到类...

【专利技术属性】
技术研发人员:杨杨于海涛高志鹏王臻赵龙军李恒王题苗滢杜忠岩杨杉
申请(专利权)人:北京邮电大学中国雄安集团数字城市科技有限公司中国联合网络通信有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1