面向非结构化数据的新能源规划性文本智能推荐方法技术

技术编号:28320999 阅读:10 留言:0更新日期:2021-05-04 13:01
本发明专利技术公开了一种面向非结构化数据的新能源规划性文本智能推荐方法,包括:获取用户的特征信息和浏览的文本信息;将用户的特征信息和浏览的文本信息与预设的知识图谱的实体进行匹配,得到实体对应表;通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵;通过语义相似性矩阵生成第一文本推荐列表;通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表;将第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表。由此,分别通过知识图谱以及协同过滤的方法对文本进行推荐,这样能够为用户提供更加丰富的内容,并且通过知识图谱的方式进行推荐还弥补了协同过滤算法的冷启动的问题。

【技术实现步骤摘要】
面向非结构化数据的新能源规划性文本智能推荐方法
本专利技术涉及智能推荐领域,尤其涉及一种面向非结构化数据的新能源规划性文本智能推荐方法。
技术介绍
新能源行业处于发展初期,发展初期是一个由政策等规划性文本主导的市场,为了让用户方便、及时的了解国家下发的各种政策信息,构建了能够用于搜索和浏览国家政策等规划性文本的能源互联网平台。为了方便用户使用能源互联网平台,通常会为用户推荐相关的规划性文本信息,传统的推荐算法通常采用基于用户过去喜欢的内容,为用户推荐相似的内容,该种方式推荐的内容有限,无法为用户发现新的感兴趣的信息,无法满足用户的推荐需求。
技术实现思路
有鉴于此,本专利技术实施例公开了一种面向非结构化数据的新能源规划性文本智能推荐方法及装置,解决了现有技术中,不仅能够满足用户的推荐需求,并且不再存在冷启动的问题,即即使在用户没有浏览记录的情况下,也可以为用户推荐感兴趣的内容。本专利技术实施例公开了一种规划性文本智能推荐方法,包括:获取用户的特征信息和浏览的文本信息;将用户的特征信息和浏览的文本信息与预设的知识图谱中的实体进行匹配,得到实体对应表;通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵;通过语义相似性矩阵生成第一文本推荐列表;通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表;将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表。可选的,所述用户的特征信息至少包括:用户的基本信息、用户的浏览行为以及用户的个性化特征信息中的任意一个。可选的,所述通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵,包括:将所述知识图谱中实体以及实体之间的关系表示为低维向量;通过计算每个向量之间的距离确定不同实体之间的语义相似性;通过知识图谱中各个实体之间的语义相似性,生成与所述实体对应表中的实体相对应的语义相似性矩阵。可选的,通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表,包括:通过用户的特征信息和浏览的文本信息生表征用户与浏览的文本的关系的第一矩阵;通过所述第一矩阵,计算用户之间的相似度;基于用户之间的相似度,生成第三文本推荐列表;基于用户浏览的文本信息生成文本偏好特征集;通过计算文本偏好特征集与其它文本的相似性,生成第四文本推荐列表;将所述第三文本推荐列表和第四文本推荐列表进行融合,得到第二文本推荐列表。可选的,所述将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表,包括:按照相似度对所述第一文本推荐列表中的文本进行排序;按照相似度对第二文本推荐列表中的文本进行排序;确定第一文本推荐列表和第二文本推荐列表的融合比例;按照融合比例确定替换文本的数量;按照第二推荐文本列表中文本的排序和替换文本的数量筛选出替换的文本;将替换文本替换掉第一文本推荐列表中的部分文本,得到目标推荐文本。可选的,还包括:针对目标推荐列表中的任意一个文本,按照整句的维度对文本进行划分,得到包含所有句子的数据集;对所述数据集中每个句子进行预处理,并提取数据集中的关键词;从所述文本中获取包含关键词的句子;计算包含关键词的句子之间的相似度;去除掉相似度小于预设的相似度阈值的句子,得到关键句;通过关键句生成文本的摘要,并将所述摘要推荐给用户。本专利技术实施例还公开了一种面向非结构化数据的新能源规划性文本智能推荐装置,包括:获取单元,用于获取用户的特征信息和浏览的文本信息;实体匹配单元,用于将用户的特征信息和浏览的文本信息与预设的知识图谱中的实体进行匹配,得到实体对应表;第一计算单元,用于通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵;第一文本推荐列表生成单元,用于通过语义相似性矩阵生成第一文本推荐列表;第二文本推荐列表生成单元,用于通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表;结果输出单元,用于将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标推荐列表。可选的,所述用户的特征信息至少包括:用户的基本信息、用户的浏览行为以及用户的个性化特征信息中的任意一个。可选的,所述第一计算单元,包括:转换单元,用于将所述知识图谱中实体以及实体之间的关系表示为低维向量;第一计算子单元,用于通过计算每个向量之间的距离确定不同实体之间的语义相似性;语义相似性矩阵生成单元,用于通过知识图谱中各个实体之间的语义相似性,生成与所述实体对应表中的实体相对应的语义相似性矩阵。本专利技术实施例还公开了一种电子设备,包括:存储器和处理器;所述存储器用于存储程序;所述处理器用于执行所述存储器中的程序时,执行上述所述的规划性文本的推荐方法。本专利技术实施例公开了一种面向非结构化数据的新能源规划性文本智能推荐方法,包括:获取用户的特征信息和浏览的文本信息;将用户的特征信息和浏览的文本信息与预设的知识图谱的实体进行匹配,得到实体对应表;通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵;通过语义相似性矩阵生成第一文本推荐列表;通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表;将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表。由此可知,本实施例中分别通过知识图谱以及协同过滤的方法对文本进行推荐,这样能够为用户提供更加丰富的内容,并且,通过知识图谱的方式进行推荐还弥补了协同过滤算法的冷启动的问题。除此之外,不仅考虑了用户特征也考虑了文本本身的特定对用户进行推荐,提升了推荐的有效性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1示出了本专利技术实施例提供的一种面向非结构化数据的新能源规划性文本智能推荐方法的流程示意图;图2示出了本专利技术实施例提供的一种将知识图谱中的三元组采用低维向量进行表示的示意图;图3示出了本专利技术实施例提供的一种摘要生成方法的流程示意图;图4示出了本专利技术实施例提供的一种面向非结构化数据的新能源规划性文本智能推荐装置的结构示意图;图5示出了本专利技术实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发本文档来自技高网...

【技术保护点】
1.一种面向非结构化数据的新能源规划性文本智能推荐方法,其特征在于,包括:/n获取用户的特征信息和浏览的文本信息;/n将用户的特征信息和浏览的文本信息与预设的知识图谱中的实体进行匹配,得到实体对应表;/n通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵;/n通过语义相似性矩阵生成第一文本推荐列表;/n通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表;/n将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表。/n

【技术特征摘要】
1.一种面向非结构化数据的新能源规划性文本智能推荐方法,其特征在于,包括:
获取用户的特征信息和浏览的文本信息;
将用户的特征信息和浏览的文本信息与预设的知识图谱中的实体进行匹配,得到实体对应表;
通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵;
通过语义相似性矩阵生成第一文本推荐列表;
通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表;
将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表。


2.根据权利要求1所述的方法,其特征在于,所述用户的特征信息至少包括:用户的基本信息、用户的浏览行为以及用户的个性化特征信息中的任意一个。


3.根据权利要求1所述的方法,其特征在于,所述通过预设的知识图谱和所述实体对应表,计算语义相似性矩阵,包括:
将所述知识图谱中实体以及实体之间的关系表示为低维向量;
通过计算每个向量之间的距离确定不同实体之间的语义相似性;
通过知识图谱中各个实体之间的语义相似性,生成与所述实体对应表中的实体相对应的语义相似性矩阵。


4.根据权利要求1所述的方法,其特征在于,通过协同过滤算法,结合用户的特征信息和浏览的文本信息,生成第二文本推荐列表,包括:
通过用户的特征信息和浏览的文本信息生表征用户与浏览的文本的关系的第一矩阵;
通过所述第一矩阵,计算用户之间的相似度;
基于用户之间的相似度,生成第三文本推荐列表;
基于用户浏览的文本信息生成文本偏好特征集;
通过计算文本偏好特征集与其它文本的相似性,生成第四文本推荐列表;
将所述第三文本推荐列表和第四文本推荐列表进行融合,得到第二文本推荐列表。


5.根据权利要求1所述的方法,其特征在于,所述将所述第一文本推荐列表和第二文本推荐列表进行融合,得到目标文本推荐列表,包括:
按照相似度对所述第一文本推荐列表中的文本进行排序;
按照相似度对第二文本推荐列表中的文本进行排序;
确定第一文本推荐列表和第二文本推荐列表的融合比例;
按照融合比例确定替换文本的数量;
按照第二推荐文本列表中文本的排序和替换文...

【专利技术属性】
技术研发人员:刘劲松谢国辉刘思革余秋霞栾凤奎谢祥颖艾宇飞李娜娜吴静娄奇鹤樊昊马晓光隋佳音徐若然葛乐矣刘润彪单雨王少婷贺铮李岩昊
申请(专利权)人:国家电网有限公司国网电子商务有限公司国网能源研究院有限公司国网新能源云技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1