一种基于多元神经网络融合的中文专利文本效应类别分类方法技术

技术编号：23085115 阅读：40 留言：0更新日期：2020-01-11 01:10

本发明专利技术涉及一种基于多元神经网络融合的中文专利文本效应类别分类方法，属于文本多分类技术领域。本发明专利技术从专利资源文本按需服务实体产业的视角出发，以反映专利所述产品背后各项技术或各项组件间存在的科学原理即效应知识作为分类标准对专利文本进行分类，提出了集成融合卷积神经网络和引入注意力机制策略的双向门控循环神网络，形成了包含词嵌入层、卷积层、BIGRU层、Attention层和Softmax层的多元神经网络通路。该方法可以更加全面的挖掘专利文本特征，为用户获取正确的效应知识，助其在产品研发过程中产生新的创新原理或技术方案。实验结果证明，在相同实验条件下，相比于CNN模型，GRU模型或其两者组合模型，本发明专利技术所提出的分类方法效果最好，准确率最高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多元神经网络融合的中文专利文本效应类别分类方法
本专利技术涉及一种基于多元神经网络融合的中文专利文本效应类别分类方法，属于文本多分类

技术介绍
科技资源及资源分布复杂多样，科技服务系统众多，与实体经济产业之间、科技服务系统内部之间的组成与关系均很复杂，是典型的分布式资源巨系统。“互联网+”模式下企业正试图通过“智能设备、智能系统、智能决策”实现与“机器、设施和系统网络”全面融合，这种机器、数据和人的新型连接模式迫切需要将科技资源与业务流程相结合，形成一种科技服务。其中科技资源里的专利文献作为知识发展和创新的重要载体，它所蕴含的效应知识反应了实现产品功能的技术或各项组件间存在的科学原理，是推进实体产业创新设计的源动力。从专利资源文本中获取实现产品功能的效应知识，并将其以中间产品或知识创新的方式融入企业技术方案中，对传统产业的转型升级和推动高质量发展都具有重大意义。目前基于深度学习方法的文本分类模型已经逐渐成为主流，它被广泛运用于非结构化数据处理中，相比基于传统机器学习的人工特征工程+浅层分类模...

【技术保护点】
1.一种基于多元神经网络融合的中文专利文本效应类别分类方法，其特征在于：所述方法步骤如下：/n步骤1：对中文专利文本进行预处理；/n步骤2：词嵌入层将进行预处理后的中文专利文本作为输入，文本中的字词会对照预先训练好的向量词典转化为相同维度的向量形式，每篇被向量表示后的中文专利文本都会被组织成一个嵌入矩阵I

【技术特征摘要】
1.一种基于多元神经网络融合的中文专利文本效应类别分类方法，其特征在于：所述方法步骤如下：
步骤1：对中文专利文本进行预处理；
步骤2：词嵌入层将进行预处理后的中文专利文本作为输入，文本中的字词会对照预先训练好的向量词典转化为相同维度的向量形式，每篇被向量表示后的中文专利文本都会被组织成一个嵌入矩阵Il×n；其中，向量词典是通过Word2vec算法单独对所有预处理后的资源文本进行计算得到，文本中的每个字词在向量词典中都有与之对应且维度大小相同的向量表征，l表示文本长度，n表示词向量维度；
步骤3：卷积层以词嵌入层输出的嵌入矩阵Il×n作为输入，并利用多个n×p的卷积核进行卷积操作，通过使用不同窗口大小的卷积核自动提取出句子的不同效应特征；最后每个卷积核捕获的效应特征通过连接，得到卷积层的输出结果MCNN，并被传送到下一步的BIGRU层中；其中，p表示卷积核的窗口大小；
步骤4：BIGRU层以卷积层的输出结果MCNN作为输入，利用正反两个不同传递...

【专利技术属性】
技术研发人员：刘孝保，陆宏彪，阴艳超，陈志成，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南;53

全部详细技术资料下载我是这个专利的主人