一种基于神经网络的需求文档和服务文档匹配方法组成比例

技术编号：19822406 阅读：33 留言：0更新日期：2018-12-19 14:55

本发明专利技术涉及一种基于神经网络的需求文档和服务文档匹配方法。本发明专利技术利用需求文档和服务文档结构，通过对文档进行提取，利用段落嵌入将文档转化为向量，通过长短期记忆神经网络对文章进行分割，在分割文本上利用卷积神经网络计算相似度，求得所有分割文档的相似度后计算加权平均值；最终得到需求文档和服务文档的相似度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络的需求文档和服务文档匹配方法
本专利技术涉及计算机自然语言处理领域，主要针对于需求文档和服务文档的匹配，具体涉及一种基于神经网络的需求文档和服务文档匹配方法。
技术介绍
随着互联网迅速发展和普及，现代企业生产方式变成以技术为基础的互相协作。为了寻找相互协作的企业，需求方编写符合企业需求的需求文档，而技术方编写企业技术能力对应的服务文档，通过连接互联网，加快发现协作企业，减少企业时间和人力成本。企业需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标，企业服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划。如何通过需求文档和服务文档快速为企业寻找合作伙伴成为当下一个热点和难点。目前常用的文档匹配方法通过将文本转化为文档向量空间模型(VectorSpaceModel,VSM)，在逆文档频率(TermFrequency–InverseDocumentFrequencyModel,TF-IDF)模型的基础上通过距离函数计算两个文档的相似度，距离越小就越相似。由于需求文档可能会包含需要合作企业同时满足的几项需求，而服务文档可能会列举企业目前能够最大程度提供的技术服务，服务文档需要满足需求文档中绝大多数或者全部的情况下才是正确的匹配，目前的匹配方法在这方面还存在不足。
技术实现思路
为了克服目前的匹配方法在需求文档和服务文档匹配上的不足，提高需求文档和服务文档匹配的准确率，本专利技术提出了一种基于神经网络的需求文档和服务文档匹配方法，利用需求文...

【技术保护点】
1.一种基于神经网络的需求文档和服务文档匹配方法，其特征在于操作步骤如下：步骤1：输入一篇需求文档和一篇服务文档作为待匹配文档，需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标，服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划；步骤2：根据文档内容判断输入文档是需求文档或服务文档；步骤2.1：包括企业需要解决的问题以及解决该问题时需要达到的指标部分则是需求文档，提取企业需要解决的问题以及解决该问题时需要达到的指标部分；步骤2.2：包括概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分则是服务文档，提取概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分；步骤2.3：最终的需求文档和服务文档的相似度要对所有需求文档提取部分与所有服务文档提取部分计算相似度，以下取需求文档的需要解决的问...

【技术特征摘要】
2018.03.12 CN 20181020062461.一种基于神经网络的需求文档和服务文档匹配方法，其特征在于操作步骤如下：步骤1：输入一篇需求文档和一篇服务文档作为待匹配文档，需求文档包含企业需要解决的问题以及解决该问题时需要达到的指标，服务文档则包含概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划；步骤2：根据文档内容判断输入文档是需求文档或服务文档；步骤2.1：包括企业需要解决的问题以及解决该问题时需要达到的指标部分则是需求文档，提取企业需要解决的问题以及解决该问题时需要达到的指标部分；步骤2.2：包括概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分则是服务文档，提取概述解决该难题技术的方法、解决过类似项目的经验、承接本项目具备的技术储备、所获得的相关专利、拟采取的研究方法、主要实现的技术指标和项目进度计划部分；步骤2.3：最终的需求文档和服务文档的相似度要对所有需求文档提取部分与所有服务文档提取部分计算相似度，以下取需求文档的需要解决的问题和服务文档的概述解决该难题技术的方法为例；步骤3：对需求文档的需要解决的问题部分和服务文档的概述解决该难题技术的方法部分中的句子进行段落嵌入处理，获得句子向量；步骤4：通过长短期记忆网络判断文档分割点；步骤4.1：将获得的句子向量输入训练好的长短期记忆网络中，由长短期记忆网络输出结果判断前一句子是否是一个分割点；步骤4.2：根据分割点将一个...

【专利技术属性】
技术研发人员：邹祥文，吴悦，
申请(专利权)人：上海大学，上海市科技企业联合会，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人