一种电视平台上基于语义链接的异构资源推荐方法和装置制造方法及图纸

技术编号：11139717 阅读：116 留言：0更新日期：2015-03-12 20:02

本发明专利技术公开了一种电视平台上基于语义链接的资源推荐方法和装置，该方法包括：提取后台媒体资源库所有媒体资源的文本信息；根据每个媒体资源的文本信息提取该媒体资源的候选特征词，计算所述候选特征词的权值，根据所述权值对所述候选特征词进行过滤得到特征词，生成后台媒体资源库的特征词权值矩阵T；如果用户观看的当前媒体资源是所述后台媒体资源库中的媒体资源，则采用聚类的方法利用所述特征词权值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体资源的聚类相似度，选取聚类相似度最高的L个媒体资源生成媒体资源推荐列表。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及多媒体
,特别是一种电视平台上基于语义链接的异构资源推荐方法和装置。
技术介绍
用户在电视平台上观看电视节目的时候，通常会对当前节目的某些信息感兴趣，想要进一步观看跟当前节目相关的其它媒体资源。针对用户的这一心理，目前出现了一些媒体资源间的推荐方法，一般为根据用户观看的当前资源，获取当前资源的关键词来表征用户特征，使用获得的关键词作为表征用户特征的向量，将与当前资源相似度高的资源推荐给用户。然而目前存在的这些媒体资源间的推荐方法存在很多弊端，例如：多为同类资源间的推荐，异构资源间的推荐应用较少；为数不多的异构资源推荐多为单向推荐，即某种资源到另一种资源，如与电视节目关联的视频源推荐方法、与电视节目关联的产品推荐方法等，多种资源间相互推荐的方法较少；资源推荐方法中起到重要作用的词，部分可识别，部分不能识别需要手工构造，操作起来较为繁琐；局限于词形信息，缺少语义信息；依赖于人工标注，缺少对用户反馈的利用，其推荐结果对用户来说并不十分理想。
技术实现思路
有鉴于此，本专利技术提出了一种电视平台上基于语义链接的异构资源推荐方法和装置，能够根据用户当前观看的资源，无需用户额外操作从而自动、智能推荐异构资源。本专利技术提出的技术方案是：一种电视平台上基于语义链接的异构资源推荐方法，包括：提取后台媒体资源库所有媒体资源的文本信息；根据每个媒体资源的文本信息提取该媒体资源的...
一种电视平台上基于语义链接的异构资源推荐方法和装置

【技术保护点】
一种电视平台上基于语义链接的资源推荐方法，其特征在于，该方法包括：提取后台媒体资源库所有媒体资源的文本信息；根据每个媒体资源的文本信息提取该媒体资源的候选特征词，计算所述候选特征词的权值，根据所述权值对所述候选特征词进行过滤得到特征词，生成后台媒体资源库的特征词权值矩阵T；如果用户观看的当前媒体资源是所述后台媒体资源库中的媒体资源，则采用聚类的方法利用所述特征词权值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体资源的聚类相似度，选取聚类相似度最高的L个媒体资源生成媒体资源推荐列表，所述L为大于0的整数。

【技术特征摘要】
1.一种电视平台上基于语义链接的资源推荐方法，其特征在于，该方法包
括：
提取后台媒体资源库所有媒体资源的文本信息；
根据每个媒体资源的文本信息提取该媒体资源的候选特征词，计算所述候
选特征词的权值，根据所述权值对所述候选特征词进行过滤得到特征词，生成
后台媒体资源库的特征词权值矩阵T；
如果用户观看的当前媒体资源是所述后台媒体资源库中的媒体资源，则采
用聚类的方法利用所述特征词权值矩阵T计算所述后台媒体资源库中每个媒体
资源与当前媒体资源的聚类相似度，选取聚类相似度最高的L个媒体资源生成
媒体资源推荐列表，所述L为大于0的整数。
2.根据权利要求1所述的方法，其特征在于，所述根据每个媒体资源的文
本信息提取该媒体资源的候选特征词，计算所述候选特征词的权值，对所述候
选特征词进行过滤得到特征词，生成后台媒体资源库的特征词权值矩阵T，进
一步包括：
针对所述后台媒体资源库的每个媒体资源，利用词法分析工具根据词性的
不同，将所述每个媒体资源的文本信息切分为分词序列；
将每个媒体资源的分词序列和热词词典进行匹配，将热词词典中包含关系
的多个分词按照最长词串进行合并，合并后的分词作为该媒体资源的候选特征
词；
计算所述候选特征词的权值，所述权值为所述候选特征词的词频-逆文档频
率值，将权值不小于权值阈值的候选特征词通过停用表进行过滤，过滤通过的
候选特征词为该媒体资源的特征词；
利用后台媒体资源库所有媒体资源的特征词构建后台媒体资源库的特征
词，用向量C＝[c1,…,cj,,…,cM]表示，其中，M为后台媒体资源库的特征词数量，
后台媒体资源库的特征词包含了后台媒体资源库中每个媒体资源的特征词，且

\t任意两个后台媒体资源库的特征词不相同；
设定M×N的特征词权值矩阵T，该矩阵的行数M表示后台媒体资源库的
特征词cj的数量，列数N表示后台媒体资源库的媒体资源Di的数量，特征词权
值矩阵T的元素tji表示特征词cj在媒体资源Di中的权值，当特征词cj是媒体资
源Di的特征词时，tji为特征词cj在媒体资源Di中的TF-IDF值；当特征词cj不是
媒体资源Di的特征词时，tji＝0。
3.根据权利要求2所述的方法，其特征在于，该方法进一步包括：
将特征词权值矩阵T进行奇异值分解，奇异值分解后得到包含语义关系的
三个矩阵S、V、UT，且T＝SVUT，其中，UT为特征词权值矩阵T经过奇异值
分解降维后的特征词权值矩阵。
4.根据权利要求1所述的方法，其特征在于，如果用户观看的当前媒体资
源不是所述后台媒体资源库中的媒体资源，所述采用聚类的方法计算所述后台
媒体资源库中每个媒体资源与当前媒体资源的聚类相似度之前，该方法进一步
包括：
获取用户观看的当前媒体资源的文本信息，根据所述当前媒体的文本信息
提取所述当前媒体资源的特征词，计算每一特征词的权值，构建当前媒体资源
的权值向量Y，Y为M×1矩阵，矩阵元素yj(1≤j≤M)为特征词cj在当前媒体资
源中的权值，当特征词cj是当前媒体资源的特征词时，yj为特征词cj在当前媒
体资源中的TF-IDF值；当特征词cj不是当前媒体资源的特征词时，yj＝0。
5.根据权利要求3或4所述的方法，其特征在于，该方法进一步包括：
将矩阵Y进行如下变换：Y1＝YTSV-1，其中YT为Y的转置矩阵，V-1为V的
逆矩阵。
6.根据权利要求1所述的方法，其特征在于，所述采用聚类的方法利用所
述特征词权值矩阵T计算所述后台媒体资源库中每个媒体资源与当前媒体资源
的聚类相似度，进一步包括：
将当前媒体资源的特征词定义为特定特征词，将后台媒体资源库中在所有

\t特定特征词上权值均不为0的媒体资源构成后台媒体资源集合采用K-means算法对后台媒体资源集合进行聚类，其中K-means算
法中的K取特定特征词的个数，将后台媒体资源集合划分为K个类
遍历中每个后台媒体资源与当前媒体资源的聚类相似度，
中后台媒体资源Dj与当前媒体资源D'之间的聚类相似度通过如下公
式进行计算：
其中，后台媒体资源Dj与当前媒体资源D'之间的相似度Sim(Dj,D')用余弦相
似度进行计算：
Sim(Dj,D′)=Σk=1(ujk×yk)Σk=1ujk2Σk=1yk2;]]>其中，ujk为Dj在UT中对应的第j行第k列元素，yk为D'在Y1中对应的第k
列元素。
7.根据权利要求1所述的方法，其特征在于，该方法进一步包括：
针对用户点击媒体资源推荐列表中的媒体资源的点击顺序和点击量，对后
台媒体资源库的特征词权值矩阵T进行权值调整，具体包括：
根据计算单个用户对媒体资源Rl的评
分，其中Rl为媒体资源推荐列表中被用户当前点击观看的媒体资源，rank(Rl)为
用户对媒体资源Rl的点击顺序，且1≤rank(Rl)≤L，Score_max为限定单个用户对
媒体资源评分的最大值的常数；
根据计算媒体资源Rl当前的总评分，其中P为当前点击媒体资源
Rl的用户数量；
如果媒体资源Rl当前的总评分不大于评分阈值根据公式
f(tj)＝tj×(1+Score(Rl)/(α+1))对媒体资源Rl的每个特征词权值进行调整；
如果媒体资源Rl当前的总评分大于评分阈值将媒体资源Rl的所有特征词加入高频特征词集合中，根据公式f(tj)＝tj×(1+Score(Rl)/(β+1))
对媒体资源Rl的每个特征词权值进行调整；
其中，tj为媒体资源Rl的第j个特征词的权值，即特征词权值矩阵T中媒
体资源Rl对应的元素，f(tj)为媒体资源Rl的第j个特征词调整后的权值；α为
权值调整参数，且中的特征词存在互异性，即不包含重复的特征词；β为权值调整参数，且X为中包含的特征词数量。
8.一种电视平台上基于语义链接的资源...

【专利技术属性】
技术研发人员：郑玄，陈洁，
申请(专利权)人：三星电子中国研发中心，三星电子株式会社，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人