当前位置: 首页 > 专利查询>邹霞专利>正文

机器学习模型的透视分析方法技术

技术编号：16102524 阅读：85 留言：0更新日期：2017-08-29 22:50

本发明专利技术提供了一种机器学习模型的透视分析方法，包括收集用户反馈的错误数据并抽取基本信息，抽取反馈数据中的相关信息生成特征空间向量；计算查询结果的分数，使用原始模型以及子模型对用户查询结果进行学习分类，得到分类结果即评价分数；对于每个用户查询，计算查询结果的

全部详细技术资料下载

【技术实现步骤摘要】
机器学习模型的透视分析方法
本专利技术涉及一种机器学习模型的透视分析方法，属于互联网搜索领域。
技术介绍
随着互联网的快速发展，搜索引擎成为人们使用Internet信息资源的重要工具。伴随Google、Yahoo!、Bing、百度等搜索引擎的兴起和发展，查询结果的相关度越来越受到人们的关注。查询结果排序的优劣亦成为评价搜索引擎的主要指标。随着信息技术快速发展和广泛应用，互联网得到了蓬勃发展，成为全球最大的信息资源，在人们的生活中已经占据了重要的位置。互联网也成为了人们进行信息共享和交互的重要平台。用户要在如此庞大杂乱的互联网资源中查找所需要的信息，就像大海捞针一样，而搜索引擎恰好解决了这一问题。搜索引擎是基于互联网平台，是提供网络信息检索服务的工具。搜索引擎也成为是互联网技术中最重要的应用。用户给出关键词作为查询请求，搜索引擎根据用户查询在自己的索引数据库中进行查询，并将排序和相关性分析的检索结果返回给用户，帮助人们拒绝和忽略大量无关信息，从而起到信息导航的作用。而海量的信息数据则意味着海量的搜索结果。在实际应用中，大多数索引擎的用户只对返回结果的前几页进行浏览，很少关心排名较后的网页。具有强相关性的搜索结果应该排在比较靠前的位置，而弱相关性的搜索结果则应该排在比较靠后的位置。因此根据其相关性对查询结果进行排序成为搜索引擎的核心问题之一。搜索结果的相关性排序也成为评价搜索引擎性能的重要指标。在搜索引擎排序问题中，使用一个多维的特征向量表示每个数据对（用户查询-查询结果）的相关属性和信息。抽取数据集中的部分数据对，并人为的标识每个数据对中查询结果和用户查询的...

【技术保护点】
一种机器学习模型的透视分析方法，其特征在于所述方法包括以下步骤：步骤一、收集用户反馈的错误数据并抽取基本信息，抽取反馈数据中的相关信息生成特征空间向量；步骤二、计算查询结果的分数，使用原始模型以及子模型对用户查询结果进行学习分类，得到分类结果即评价分数；步骤三、对于每个用户查询，计算查询结果的

【技术特征摘要】
1.一种机器学习模型的透视分析方法，其特征在于所述方法包括以下步骤：步骤一、收集用户反馈的错误数据并抽取基本信息，抽取反馈数据中的相关信息生成特征空间向量；步骤二、计算查询结果的分数，使用原始模型以及子模型对用户查询结果进行学习分类，得到分类结果即评价分数；步骤三、对于每个用户查询，计算查询结果的nDCG值，根据机器学习模型训练结果可得到实际排序，根据查询结果与用户查询可得到理想排序，由实际排序和理想排序即刻得到该用户查询的nDCG的值；步骤四、聚类，根据nDCG值变化趋势，获得每个查询的最优子模型，并根据子模型的相似度对用户查询进行聚类；步骤五、抽取属性，分析每个类中的所有成员信息，并抽取某些属性作为这个类的特征空间向量；步骤六、学习未知的用户查询，当给定一个未知的用户查询，分析其属性，并将该用户查询进行分类，从而得到该用户查询在进行学习时，对应的最优子模型。2.如权利要求1所述的机器学习模型的透视分析方法，其特征在于：所述步骤一收集...

【专利技术属性】
技术研发人员：邹霞，
申请(专利权)人：邹霞，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人