一种信息发布方法和装置制造方法及图纸

技术编号:9406273 阅读:111 留言:0更新日期:2013-12-05 06:08
本发明专利技术的实施例提供了一种信息发布方法和装置,可提高信息发布的效率。所述方法包括:接收待发布信息;将基础信息与待发布信息进行匹配;若基础信息与待发布信息匹配成功,在该基础信息处发布所述待发布信息。所述基础信息包括发布基础信息和/或用户信息。根据本发明专利技术实施例,通过基于文本内容匹配的方法进行信息发布,可使信息在发布的目的性更强,从而使提高了信息的针对性,进而提高了信息发布的效率。

【技术实现步骤摘要】
一种信息发布方法和装置
本专利技术涉及一种信息技术,尤其涉及一种基于文本内容匹配技术的信息发布方法和装置。
技术介绍
信息发布技术用途十分广泛。信息发布是指在特定的位置和/或特定时间发布待发布信息。待发布信息可以是广告信息、警告信息、警示信息、引导信息、国家法令规定等信息。例如,发布广告是将待发布信息放置在特定的地方,以便人们了解这些待发布信息。发布警告是将警告信息与特定信息一起发布,以便人们了解该特定信息的负面效果,例如,在基础文本为有关“抽烟”的内容时,可在发布该基础文本时,同时发布抽烟有害身体健康的警示信息,及发布关于与烟草有关的最新国家法令。发布引导信息是将引导信息与特定文本文本一起发布,以便人们了解与该特定文本相关的信息,例如,在基础文本为“游戏”时,可在发布该基础文本时,同时发布游戏时间不要过长的引导信息,及发布关于与游戏有关的最新国家规定。内容匹配技术是指给定一个文本,从一个较大的文本集合里找出内容相近的文本来。目前还没有将信息发布技术和文本内容匹配技术结合起来发布信息的技术,该技术可提高信息发布的效率。
技术实现思路
本专利技术的实施例提供了一种信息发布方法和装置,可提高信息发布的效率。本专利技术的实施例提供了一种信息发布方法,包括:接收待发布信息;将基础信息与待发布信息进行匹配;若基础信息与待发布信息匹配成功,在该基础信息处发布所述待发布信息。所述基础信息包括发布基础信息和/或用户信息。所述基础信息为发布基础信息时,所述将基础信息与待发布信息进行匹配具体包括:获得发布基础信息的主题分布向量;获得待发布信息的主题分布向量;将发布基础信息的主题分布向量与待发布信息的主题分布向量进行匹配。所述将发布基础信息的主题分布向量与待发布信息的主题分布向量进行匹配具体包括:当发布基础信息的主题分布向量与待发布信息的主题分布向量之间的欧式距离小于预定值时,确定为二者匹配成功,所述欧式距离由下式给出:其中d'代表基础信息,p(ti|d')是基础信息的主题分布向量的一个元素。d是待发布信息,p(ti|d)是待发布信息的主题分布向量中的一个元素,n代表主题数目。所述基础信息为用户信息时,所述将基础信息与待发布信息进行匹配具体包括:获得用户信息的主题分布向量;获得待发布信息的主题分布向量;将用户信息的主题分布向量与待发布信息的主题分布向量进行匹配。所述将用户信息的主题分布向量与待发布信息的主题分布向量进行匹配具体包括:当用户信息的主题分布向量与待发布信息的主题分布向量之间的欧式距离小于预定值时,确定为二者匹配成功,所述欧式距离由下式给出:其中d'代表用户信息,p(ti|d')是d'用户信息的主题分布向量的一个元素。d是待发布信息,p(ti|d)是待发布信息的主题分布向量中的一个元素,n代表主题数目。本专利技术实施例还提供了一种信息发布装置,其特征在于,包括:接收单元,用于接收待发布信息;匹配单元,用于将接收单元接收的待发布信息与基础信息进行匹配;判断单元,判断基础信息与待发布信息匹配是否成功,若是启动发布单元;发布单元,用于在基础信息处发布所述待发布信息。所述匹配单元具体包括:第一获得单元,用于获得基础信息的主题分布向量;第二获得单元,用于获得待发布信息的主题分布向量;匹配子单元,用于将基础信息的主题分布向量与待发布信息的主题分布向量进行匹配。所述匹配子单元具体包括:判断单元,判断基础信息的主题分布向量与待发布信息的主题分布向量之间的欧式距离是否小于预定值,若是,启动确定单元;所述欧式距离由下式给出:其中d’代表基础信息,p(ti|d')是基础信息的主题分布向量的一个元素。d是待发布信息,p(ti|d)是待发布信息的主题分布向量中的一个元素,n代表主题数目;确定单元,用于确定发布基础信息与待发布信息匹配成功。根据本专利技术实施例,通过基于文本内容匹配的方法进行信息发布,可使信息在发布的目的性更强,从而使提高了信息的针对性,进而提高了信息发布的效率。在文本内容匹配过程中,进行非监督机器学习方法提取微博和用户主题,从而省去人工建立知识库的繁杂步骤。通过实验表明,其匹配的精度达到90%以上,远比基于知识库的方法高。附图说明图1示出了本专利技术实施例的主题模型匹配的过程;图2示出了微博的一个例子;图3示出了本专利技术实施例的在用户主页投放的例子;图4示出了本专利技术实施例的相关内容推荐的例子;图5示出了本专利技术实施例的信息发布装置。具体实施方式为了便于本领域一般技术人员理解和实现本专利技术,现结合附图描绘本专利技术的实施例。实施例一本实施例提供了一种信息发布方法,该方法包括步骤:接收待发布信息;将基础信息与待发布信息进行匹配;若基础信息与待发布信息匹配成功,在该基础信息处发布待发布信息。所述基础信息包括发布基础信息和/或用户信息。根据本专利技术实施例,优选地,发布基础信息为微博,或是博文,可以是已发布或未发布的微博、博文等。下面以发布基础信息为微博、待发布信息为广告为例,来介绍本专利技术实施例的信息发布方法。在微博中,用户的即时兴趣通常会隐含在其某个时刻或时段发送或转发的内容当中。用户较长时期发送或转发的大量内容,隐含了用户的长期的兴趣爱好,甚至职业信息。根据本专利技术实施例,在广告发布过程中,广告匹配引擎可以根据广告中的文字内容,去匹配用户所发送或转发的微博得内容,并根据匹配结果投放广告,当匹配成功时,投放广告,这样会精确定位到广告所投放的位置,提高广告的效率。广告匹配引擎也可以利用广告的文字内容去匹配用户,并根据匹配结果投放广告,当匹配成功时,投放广告,这样会精确定位到广告所投放的具体用户。内容推荐技术和广告匹配基本类似,可以把用户产生的一条博文当作一条广告,内容推荐引擎可以利用类似的匹配算法,把博文推荐给最适合的用户。所以,文本匹配技术是广告匹配引擎和内容推荐引擎的核心。根据本专利技术实施例,在匹配技术中,优选地,采用基于主题模型(TopicModel)的内容匹配技术。该技术的主要特征是采用非监督学习的方法,能从大量的文本集合中抽取主题,从而得到每个文本的主题分布向量。此技术同时提供推理机制,能够快速有效地从新的文本中抽取主题。在匹配过程中,比较文本内容上的相似性,可以通过比较文本的主题分布的相似性来实现。因此,可以从一定程度上避免短文本带来的数据稀疏问题。同时,可以通过对用户所发送和转发的博文及这些博文的主题分布向量的分析,也可以综合得到用户主题分布向量。在此基础上,通过比较文本的主题分布向量和用户的主题分布向量,来实现对用户投放广告和推荐的目的。此外,通过比较用户之间主题分布向量的相似度,还可以找出相同兴趣的用户。这项文本匹配技术的最大优势是非监督学习方法,一切由机器自动完成,不需要人工建立知识库。算法的操作性也比较简单,在应用过程中不需要复杂的推理和计算机制。通过大量的本文档来自技高网...
一种信息发布方法和装置

【技术保护点】
一种信息发布方法,其特征在于,包括:接收待发布信息;将基础信息与待发布信息进行匹配;若基础信息与待发布信息匹配成功,在该基础信息处发布所述待发布信息。

【技术特征摘要】
1.一种信息发布方法,其特征在于,包括:接收待发布信息;将基础信息与待发布信息进行匹配;若基础信息与待发布信息匹配成功,在该基础信息处发布所述待发布信息;所述将基础信息与待发布信息进行匹配具体包括:获得基础信息的主题分布向量;获得待发布信息的主题分布向量;将基础信息的主题分布向量与待发布信息的主题分布向量进行匹配;所述主题分布向量由B-LDA方法求得,所述B-LDA方法为:其中,d代表文本信息,n(w)是词W在文本信息d中出现的次数;p(t|d)就是该文本信息的主题分布向量,p(t|w)代表文本信息产生词w时用到特定主题t的概率,p(t'|w)的意义和p(t|w)类似,只是t'表示任意的主题,其计算方法可以用下述公式获得:其中p(t)表示主题t的先验概率,P(w)表示词w的概率;p(w|t)是用LDA主题模型训练所得到的主题t生成词w的概率。2.根据权利要求1所述的方法,其特征在于,所述基础信息包括发布基础信息和/或用户信息。3.根据权利要求2所述的方法,其特征在于,所述基础信息为发布基础信息时,所述将基础信息与待发布信息进行匹配具体为:获得发布基础信息的主题分布向量;将发布基础信息的主题分布向量与待发布信息的主题分布向量进行匹配。4.根据权利要求3所述的方法,其特征在于,所述将发布基础信息的主题分布向量与待发布信息的主题分布向量进行匹配具体包括:当发布基础信息的主题分布向量与待发布信息的主题分布向量之间的欧式距离小于预定值时,确定为二者匹配成功,所述欧式距离由下式给出:其中d’代表发布基础信息,p(ti|d')是发布基础信息的主题分布向量的一个元素;d是待发布信息,p(ti|d)是待发布信息的主题分布向量中的一个元素,n代表主题数目。5.根据权利要求2所述的方法,其特征在于,所述基础信息为用户信息时,所述将基础信息与待发布信息进行匹配具体为:获得用户信息的主题分布向量;将用户信息的主题分布向量与待发布信息的主题分布向量进行匹配。6.根据权利要求5所述的方法,其特征在于,所述将用户信息的主题分布向量与待...

【专利技术属性】
技术研发人员:井辉董恭谨伏圣国朱红垒白栓虎
申请(专利权)人:微梦创科网络科技中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1