一种基于机器学习的图文融合图书推荐方法技术

技术编号：21141145 阅读：21 留言：0更新日期：2019-05-18 05:10

本发明专利技术涉及图书馆检索技术领域，具体地说，是一种基于机器学习的图文融合图书推荐方法，包括以下步骤：采集图书相关数据并进行预处理，从网络上采集图书图文数据并进行预处理；提取图书图片特征，利用DCNN和VGG‑16深度卷积神经网络对于ImageNet2012中的126万张图片进行训练，从而得到较为准确的训练权重，利用其提取图片特征，并对其进行降维；提取图书文本特征，使用RNN和Word2Vec框架将文本转化为与图像向量纬度一致的向量，图像特征与文本特征的融合，设计线性集成方法对于图像文本向量进行融合；实现推荐，利用余弦相似度方法对其进行衡量，并计算分类阈值，结合传统基于物品的协同过滤的推荐方法进行推荐。

A Book Recommendation Method Based on Machine Learning for Image-Text Fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种基于机器学习的图文融合图书推荐方法
本专利技术涉及图书馆检索
，具体地说，是一种基于机器学习的图文融合图书推荐方法。
技术介绍
现如今计算机网络技术发展越来越广泛传统图书馆模式以及不能满足大众的需求了，使得图书馆在新形势下将软件、硬件各方面都进行了创新改革并迅速发展起来。信息资源作为人们生活中不可缺少的重要资源，呈现出了前所未有的增长，服务机构的增多使得信息方面的获取更加的广泛，人们在知识的需求上更加的多样和急切，人们在知识的获取方式上一直在改变。致使信息资源的增长以及信息利用的困难越来越明显，所以图书馆要提供新的服务方式，也就是个性化服务，只有个性化服务才能在根本上改变图书馆整体的局面。高校图书馆的个性化服务是针对高校师生在科研以及教学上进行不同方式的一种服务，它具有层次性、特色性以及专业性。高校图书馆服务的对象都是具有一定专业知识的教师、学生或者科研人员，个性化服务的出发点是能够使用户满意，并且主动服务的基本模式。传统高校图书馆因为是使用馆藏文献来为师生以及科研进行服务的，在查询以及筛选上都费时费力，需要消耗大量的人力。随着网络技术的发展壮大，使得高校图书馆的的使用更加的便捷化、准确化。以网络服务为中心的个性化服务将会成为整个时代发展的必然走向。而且，网络环境下的图书馆不仅在于图书馆里的藏书有多少，更在乎图书馆提供的实质性信息有多少，准确性有多少和用户使用上的满意程度。图书馆个性服务从根本上将自己的服务功能进行了提升。
技术实现思路
为了解决上述技术问题，为图书馆尤其是学校图书馆提供一种精准的图书推荐方法，本专利技术披露了一种基于机器学习的图文融...

【技术保护点】
1.一种基于机器学习的图文融合图书推荐方法，其特征在于，包括以下步骤：步骤一、采集图书相关数据并进行预处理：从网络上采集图书图文数据并进行预处理；步骤二、提取图书图片特征：利用DCNN和VGG‑16深度卷积神经网络对于ImageNet2012中的126万张图片进行训练，从而得到较为准确的训练权重，利用其提取图片特征，并对其进行降维；步骤三、提取图书文本特征：使用RNN和Word2Vec框架将文本转化为与图像向量纬度一致的向量；步骤四：图像特征与文本特征的融合：设计线性集成方法对于图像文本向量进行融合；步骤五：实现推荐：利用余弦相似度方法对其进行衡量，并计算分类阈值，结合传统基于物品的协同过滤的推荐方法进行推荐。

【技术特征摘要】
1.一种基于机器学习的图文融合图书推荐方法，其特征在于，包括以下步骤：步骤一、采集图书相关数据并进行预处理：从网络上采集图书图文数据并进行预处理；步骤二、提取图书图片特征：利用DCNN和VGG-16深度卷积神经网络对于ImageNet2012中的126万张图片进行训练，从而得到较为准确的训练权重，利用其提取图片特征，并对其进行降维；步骤三、提取图书文本特征：使用RNN和Word2Vec框架将文本转化为与图像向量纬度一致的向量；步骤四：图像特征与文本特征的融合：设计线性集成方法对于图像文本向量进行融合；步骤五：实现推荐：利用余弦相似度方法对其进行衡量，并计算分类阈值，结合传统基于物品的协同过滤的推荐方法进行推荐。2.根据权利要求1所述的基于机器学习的图文融合图书推荐方法，其特征在于，所述步骤一采用基于requests库和beautifulsoup库的网络爬虫采集图书的图片和文本数据，并进行过滤，以此作为数据集。3.根据权利要求1所述的基于机器学习的图文融合图书推荐方法，其特征在于，所述步骤二中ImageNet2012中的126万张图片是通过网络收集并通过亚马逊机器人来添加标签，对于所有图像都进行统一化采样处理，将其调整为256×256的大小，具体方法为：将矩形图像的短边缩小为256像素，然后从中心选取256×256的区域进行分析，还将每一个像素点的RGB值减去训练图像的平均RGB值来中心化，深度卷积神经网络采用预处理后的RGB值进行训练。4.根据权利要求1所述的基于机器学习的图文融合图书推荐...

【专利技术属性】
技术研发人员：王子豪，牟书念，李兴亮，孙晓燕，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人