当前位置: 首页 > 专利查询>清华大学专利>正文

多领域服务主题匹配推荐方法技术

技术编号:9991019 阅读:119 留言:0更新日期:2014-05-02 04:29
一种多领域服务主题匹配推荐方法,其分析用户所输入的文本信息中所包含的服务组合及服务组合的主题分布,并利用训练好的‘需求-领域’匹配器中得到所获取的服务组合与D个服务领域的相关概率,根据相关概率对D个服务领域进行从高到低排序,并将排序结果推荐给用户。在每个服务领域中分别利用与各自的服务领域相对应的‘领域-服务’匹配器,得到每个服务领域的‘领域-服务’匹配器所预测的服务的主题分布,然后计算该服务领域所对应的服务的主题分布与该服务领域内每个服务的主题分布的相似度;在每个服务领域中,对所计算出的相似度按照从大到小排序以得到对该服务领域中服务进行由高到低的排序,并将排序的结果推荐给用户。

【技术实现步骤摘要】
多领域服务主题匹配推荐方法
本专利技术涉及计算机系统建模及数据分析领域,尤其涉及多领域服务主题匹配推荐方法。
技术介绍
随着网络服务的不断发展成熟,互联网正在经历由“数据为中心”到“以服务为中心”的转变。近年来,随着面向服务计算(ServiceOrientedComputing,简称SOC)的兴起,互联网上大量的软件提供商改变了自己的传统经营模式,开始采用软件即服务(SoftwareasaService,简称SaaS)的模式来提供软件服务(以下均简称服务),与此同时大量用户利用互联网上SaaS模式的开放服务来开发自己的应用。为了满足复杂多变的需求,众多的服务以动态组合的形式被开发者组合并产生了附加价值,形成了服务组合这样一种形式。在这种模式下,一方面互联网上大量的服务提供商提供的各类服务具有不同的功能、不同的服务质量;一方面用户的需求复杂多变,用户很难能清晰的表达需要哪些类型的服务。因此,在这种服务信息过载,又缺少统一信息描述规范的情况下,如何利用语义描述信息针对服务组合进行有效的服务推荐,使用户高效地进行服务组合,对互联网的良性发展有着十分重要的意义。传统的服务推荐往往只需要满足用户单一功能需求;然而在服务组合中,用户可能同时需要不同领域的几个服务,并将他们集成服务组合,满足复杂的需求。例如,用户要开发这样一个应用“基于GPS定位的社交网络应用,用户可以与社交网络中的好友分享地理信息”。从用户的这段需求描述中,我们可以提炼出来对三个领域服务的潜在需求:一是“地图和定位”领域相关的服务,用以获得地理信息;二是“社交网络平台”领域的相关服务,用以提供连接社交网络平台的接口;三是“移动终端”领域的相关服务,显然用户的‘GPS定位’很可能会调用一些移动终端相关的领域的服务。从上例中我们了解到,针对服务组合的服务推荐包含两个关键点:一是理解用户隐含在需求中的多方面功能性需求和非功能性需求;二是根据这些需求,找到相关的领域,并且推荐这些领域内满足条件的服务。现有的针对服务组合的服务推荐技术,大多针对第一个关键点做出了一些探索性的工作;然而如何抽取用户需求中的可能相关领域,并为针对每个相关领域都提供一个推荐服务列表依然没有得到有效的解决,这也影响了服务推荐的效果,降低了用户进行服务组合的效率。
技术实现思路
鉴于以上内容,有必要提供一种多领域服务主题匹配推荐方法,其能抽取用户需求中相关的服务领域,并为针对每个服务领域都推荐一个服务列表。一种多领域服务主题匹配推荐方法,其包括:接收步骤,接收用户输入的文本信息;获取步骤,利用训练好的服务组合隐狄利克雷分布LDA主题模型获取所接收的文本信息中所包含的服务组合及服务组合的主题分布;计算步骤一,根据所获取的服务组合的主题分布,并利用训练好的‘需求-领域’匹配器中得到所获取的服务组合与D个服务领域的相关概率;排序步骤一,对所获取的服务组合与D个服务领域的相关概率从大到小排序以得到对D个服务领域进行从高到低进行排序,并将D个服务领域进行从高到低进行排序的结果推荐给用户;计算步骤二,根据所获取的服务组合的主题分布,在每个服务领域中分别利用与各自的服务领域相对应的‘领域-服务’匹配器,得到每个服务领域的‘领域-服务’匹配器所预测的服务的主题分布,并对每个‘领域-服务’匹配器所预测的服务的主题分布进行归一化处理;计算步骤三,在每个服务领域中,计算该服务领域所对应的归一化处理后的服务的主题分布与该服务领域内每个服务的主题分布的相似度;排序步骤二,在每个服务领域中,对所计算出的该服务领域所对应的归一化处理后的服务的主题分布与该服务领域内每个服务的主题分布的相似度,按照从大到小进行排序以得到对该服务领域中服务进行由高到低的排序,并将每个服务领域中的服务进行由高到低的排序的结果推荐给用户。相较于现有技术,所述多领域服务主题匹配推荐方法,其能够利用主题相似度将服务有效聚类到不同的服务领域中,对服务进行有效的组织;能够自动挖掘隐含在用户需求文本中的对多个服务领域的需求,对相关服务领域进行排序;能够挖掘每个服务领域中服务与用户需求的匹配程度,对每个服务领域中的服务进行推荐排序,经实证数据验证,本专利技术的方法提高了服务推荐的准确率。附图说明图1是本专利技术多领域服务主题匹配推荐系统的应用环境图。图2是本专利技术多领域服务主题匹配推荐系统的架构图。图3是本专利技术多领域服务主题匹配推荐方法的较佳实施例的流程图。图4是本专利技术多领域服务主题匹配推荐结果的示意图。主要元件符号说明计算装置100存储设备10处理设备20多领域服务主题匹配推荐系统30客户端200接收模块300获取模块301计算模块302排序模块303如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式如图1所示,是本专利技术多领域服务主题匹配推荐系统的应用环境图。应用环境图中包括一个计算装置100,该计算装置100与多个客户端200相连。用户通过客户端200输入自己的需求,所述多领域服务主题匹配推荐系统30(以下简称“系统30”)应用于计算装置100中有效抽取用户需求中涉及的多个服务领域,并在每个领域中推荐与用户需求相关的服务。该计算装置100还包括存储设备10及处理设备20,所述客户端200还用于将每个领域中与用户需求相关的服务推荐给用户。所述存储设备10中存储有多个服务组合的文本信息及多个服务的文本信息。所述文本信息包括描述文本、标签等,一个服务组合会调用一个或者多个服务。在本实施例中,所述多个服务组合的文本信息及多个服务的文本信息是样本数据,用M表示服务组合的总数,用N表示服务的总数,这N个服务就构成一个服务集合,可利用多领域服务聚类法将服务集合中每个服务聚类到预设的D个不同的服务领域中,聚类的过程在后续详述。聚类后的结果用于训练‘需求-领域’匹配器、‘领域-服务’匹配器。‘需求-领域’匹配器、‘领域-服务’匹配器都是事先训练好的,便于系统30在接收到用户的需求后,能利用需求-领域’匹配器及‘领域-服务’匹配器计算出D个领域中与用户需求相关的服务。‘需求-领域’匹配器、‘领域-服务’匹配器的训练过程在后续详述。如图2所示,所述聚类的过程由服务领域聚类模块来处理,训练‘需求-领域’匹配器、‘领域-服务’匹配器的过程由训练匹配器模块来处理。服务集合中有S1,S2...SN个服务,经过多领域服务聚类法聚类后分配到领域1,领域2...领域D中,其中N表示服务集合中总的服务个体数目;表示领域1中的服务个体,其中N1代表领域1的服务个体总数;依次类推N2...ND分别代表领域2~D的服务个体总数。服务集合中的每个服务都有服务主题,用表示。服务组合会调用服务集合中的一个或者多个服务。结合所得到的D个服务领域,从服务组合调用服务的信息中挖掘‘需求-领域’匹配模式以及‘领域-服务’匹配模式以得到‘需求-领域’匹配器,‘领域1-服务’匹配器,...,‘领域D-服务’匹配器,每个服务领域对应一个‘领域-服务’匹配器,如领域1对应‘领域1-服务’匹配器。当用户输入服务组合需求C1,C2...Cm后,结合服务组合的服务主题T1,T2,...,,利用‘需求-领域’匹配器挖掘与用户输入的服务组合需求相关的服务领域;再利用该服务领域的‘领域-服务’匹配器完成给出该服务领域本文档来自技高网
...
多领域服务主题匹配推荐方法

【技术保护点】

【技术特征摘要】
1.一种多领域服务主题匹配推荐方法,应用于计算装置中,其特征在于,该方法包括:接收步骤,接收用户输入的文本信息;获取步骤,利用训练好的服务组合隐含狄利克雷分布LDA主题模型获取所接收的文本信息中所包含的服务组合及服务组合的主题分布;计算步骤一,根据所获取的服务组合的主题分布,并利用训练好的‘需求-领域’匹配器中得到所获取的服务组合与D个服务领域的相关概率;排序步骤一,对所获取的服务组合与D个服务领域的相关概率从大到小排序以得到对D个服务领域从高到低进行的排序,并将D个服务领域从高到低进行排序的结果推荐给用户;计算步骤二,根据所获取的服务组合的主题分布,在每个服务领域中分别利用与各自的服务领域相对应的‘领域-服务’匹配器,得到每个服务领域的‘领域-服务’匹配器所预测的服务的主题分布,并对每个‘领域-服务’匹配器所预测的服务的主题分布进行归一化处理;计算步骤三,在每个服务领域中,计算该服务领域所对应的归一化处理后的服务的主题分布与该服务领域内每个服务的主题分布的相似度;排序步骤二,在每个服务领域中,对所计算出的该服务领域所对应的归一化处理后的服务的主题分布与该服务领域内每个服务的主题分布的相似度,按照从大到小进行排序以得到对该服务领域中的服务进行由高到低的排序,并将每个服务领域中的服务进行由高到低的排序的结果推荐给用户。2.如权利要求1所述的多领域服务主题匹配推荐方法,其特征在于,所述D个服务领域是对计算装置的存储设备中存储的M个服务组合的文本信息及N个服务的文本信息处理得到的,利用多领域服务聚类法将服务集合中的N个服务聚类到预设的D个不同的服务领域;所述利用多领域服务聚类法将服务集合中的N个服务聚类到预设的D个不同的服务领域包括步骤:(a1)对每个服务的的文本信息,利用LDA话题模型获得每个服务的主题分布,用矩阵STF来形式化描述N个服务的主题分布,STF为N×Ks维矩阵,N表示服务的总数,Ks表示服务涉及到的主题总数,STF矩阵第i行第j列的元素STF(i,j)表示T′j在Si中的分布权重,其中T′j表示服务中的主题j,Si表示服务i,矩阵的每一行为一个服务的主题分布;(a2)将存储设备中所存储的服务组合与服务的调用关系用矩阵CS来形式化描述,CS为M×N维稀疏矩阵,M表示服务组合的总数,N表示服务的总数,CS矩阵第i行第j列的元素CS(i,j)=1表示服务组合Ci调用了服务Sj;CS(i,j)=0,表示服务组合Ci没有调用服务Sj;(a3)对所述CS矩阵的每一列求和,即SUM(CS(:,j)),表示服务Sj被所有服务组合调用的次数,用以表征服务Sj的热度Sj.popular;(a4)确定D个服务领域中每个服务领域的核心服务;(a5)将N个服务中其余N-D个服务作为非核心服务分配到D个服务领域的每个服务领域中。3.如权利要求1所述的多领域服务主题匹配推荐方法,其特征在于,训练‘需求-领域’匹配器的步骤包括:(b1)获取训练‘需求-领域’匹配器的输入端数据;(b2)获取训练‘需求-领域’匹配器的输出端数据;(b3)根据训练‘需求-领域’匹配器的输入端数据、输出端数据,并利用ELM标准训练过程训练‘需求-领域’匹配器以得到‘需...

【专利技术属性】
技术研发人员:范玉顺夏博飞黄科满刘轶
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1