一种为文本信息匹配资源的方法及装置制造方法及图纸

技术编号:14891659 阅读:50 留言:0更新日期:2017-03-29 00:29
本申请公开了为文本信息匹配资源的方法,包括:依据文本信息,获取文本关键字;依据文本关键字与资源标签的相似度,确定与文本信息相匹配的资源。进一步,可依据文本关键字与资源标签的相似度、及相对应的资源标签在所属资源项中的权重,计算文本关键字与资源项的匹配程度;依据文本关键字与各资源项的匹配程度,确定与文本信息相匹配的资源。进一步,可依据用户的使用信息,对文本关键字与资源项的匹配程度进行调整。本申请还公开了为文本信息匹配资源的装置,包括获取模块和匹配模块,匹配模块进一步包括计算模块和资源确定模块。本申请能依据文本信息的特征,更准确、更全面地确定与该文本信息相匹配的资源,满足用户对表现形式的多样化需求。

【技术实现步骤摘要】

本申请涉及计算机
,尤其涉及一种为文本信息匹配资源的方法及装置
技术介绍
用户会通过各种网络平台记录各种各样的信息,例如记录日常生活的信息,同样,用户也会通过通信平台产生其与其他用户进行通信时的信息。本方法中,通过获取上述用户信息,并对信息进行识别转化,将一段静态的文字自动转化成生动有趣的动画。随着互联网技术的发展,各种多媒体资源日益丰富,各类信息的表现形式也更加灵活、生动、有趣。在用户的实际应用中,有时希望将文本信息采用更多样化的形式展示出来,这就需要找到与这些文本信息相匹配的多媒体资源。例如,发送“祝你生日快乐”的祝福时,可以采用插上蜡烛的生日蛋糕的图片、动画和/或音乐表现,因此,需要依据“祝你生日快乐”的文本信息寻找到与之相匹配的图片、动画和/或音乐。为了为文本信息找到相匹配的资源,现有的做法通常是通过关键词匹配的方法,为每个资源设定一定的关键词,在用户输入一系列词语之后,将用户输入的词语进行同义词扩展,获得查询词列表(Query词列表),再根据查询词列表进行查询,获得对应的查询结果。现有技术的缺点在于:(1)扩展同义词可能使得词语的原本意思出现偏差,而且不好处理否定、以及否定的否定这种关系。(2)在根据查询词列表进行查询时,将查询词列表中的词语与资源的关键词进行匹配,只有完全一致的词语才认定为相匹配,从而可能会因为同义词扩展不够或含义偏差而无法找到相匹配的资源。
技术实现思路
本申请实施例提供一种为文本信息匹配资源的方法,目的在于依据文本信息的特征,更准确、更全面地确定与该文本信息相匹配的资源,满足用户对表现形式的多样化需求。本申请实施例还提供一种为文本信息匹配资源的装置,目的在于依据文本信息的特征,更准确、更全面地确定与该文本信息相匹配的资源,满足用户对表现形式的多样化需求。本申请实施例采用下述技术方案:本申请实施例提供的一种为文本信息匹配资源的方法,包括:依据所述文本信息,获取文本关键字;依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源;其中,所述资源标签与所述资源相对应。可选地,本申请实施例提供的为文本信息匹配资源的方法中,所述文本关键字与资源标签的相似度的确定包括:从词向量库中分别获取所述文本关键字的第一词向量和所述资源标签的第二词向量;所述词向量库中包含至少一个分词的词向量;计算所述第一词向量与所述第二词向量的余弦相似度,作为所述文本关键字与所述资源标签的相似度。可选地,本申请实施例提供的为文本信息匹配资源的方法中,所述词向量库中词向量的获得包括:获取用于训练词向量的训练语料;对所述训练语料进行分词,获得分词集合;依据所述分词集合中各分词的出现频次和/或与其他分词的共现关系,确定各分词的词向量;所述词向量中每一个元素表示对应分词的出现频次和/或与其他分词的共现频次。可选地,本申请实施例提供的为文本信息匹配资源的方法中,依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源,包括:对所述文本关键字与所述资源标签的相似度进行排序;将相似度最高的预设个资源标签输出,用以确定与所述文本信息相匹配的资源。可选地,本申请实施例提供的为文本信息匹配资源的方法中,依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源,包括:依据所述文本关键字与所述资源标签的相似度、以及相对应的资源标签在所属资源项中的权重,计算所述文本关键字与所述资源项的匹配程度;其中,所述资源项中包含至少一个所述资源标签;依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源;其中,所述资源项中包含至少一个所述资源。可选地,本申请实施例提供的为文本信息匹配资源的方法中,计算所述文本关键字与所述资源项的匹配程度,包括:计算所述相似度与所述权重的乘积之和,作为所述文本关键字与相对应的资源标签所属资源项的匹配程度。可选地,本申请实施例提供的为文本信息匹配资源的方法中,依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源,包括:对所述文本关键字与所述资源项的匹配程度进行排序;将最匹配的预设个资源项输出,用以确定与所述文本信息相匹配的资源。可选地,本申请实施例提供的为文本信息匹配资源的方法中,将最匹配的预设个资源项输出,用以确定与所述文本信息相匹配的资源,具体为:将最匹配的预设个资源项输出,作为备选资源项向用户推荐;将用户在所述备选资源项中选取的资源项所对应的资源确定为与所述文本信息相匹配的资源。可选地,本申请实施例提供的为文本信息匹配资源的方法中,所述资源标签在所属资源项中的权重的确定包括:对所述资源标签在所属资源项中的权重设定初始值;依据用户在所述备选资源项中选取的资源项,调整所述资源项中的资源标签和/或调整资源标签在所属资源项中的权重。可选地,本申请实施例提供的为文本信息匹配资源的方法中,所述方法还包括:获取用户的使用信息,所述使用信息包括用户的历史偏好信息、个人信息和/或同类用户的标签信息;则在计算所述文本关键字与所述资源项的匹配程度之后,在依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源之前,还包括:依据用户的所述使用信息,对所述文本关键字与所述资源项的匹配程度进行调整,得到更新后的匹配程度。可选地,本申请实施例提供的为文本信息匹配资源的方法中,依据所述文本信息,获取文本关键字,包括:获取所述文本信息;对所述文本信息进行分词,得到所述文本关键字。可选地,本申请实施例提供的为文本信息匹配资源的方法中,所述资源的类别包括图片、照片、音乐、语音、音效、动作、表情、动画和/或视频。本申请实施例提供的一种为文本信息匹配资源的装置,包括:获取模块,用于依据所述文本信息,获取文本关键字;匹配模块,用于依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源;其中,所述资源标签与所述资源相对应。可选地,本申请实施例提供的为文本信息匹配资源的装置中,所述匹配模块包括:计算模块,用于依据所述文本关键字与所述资源标签的相似度、以及相对应的资源标签在所属资源项中的权重,计算所述文本关键字与所述资源项的匹配程度;其中,所述资源项中包含至少一个所述资源标签;资源确定模块,用于依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源;其中,所述资源项中包含至少一个所述资源。本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:(1)依据文本信息获取的文本关键字可以表现出文本信息的特征,资源标签能表现出资源的特征,文本关键字和资源标签都是通过文本信息或资源本身提炼出来的,没有进行类似现有技术中扩展同义词的步骤,因此,不会出现意思偏差,得到的匹配结果更加准确。(2)引入相似度的概念,通过文本关键字与资源标签的相似度体现文本信息与资源的匹配程度,避免了现有技术中由于无法找到完全一致的关键词而无法找到相匹配的资源的问题。(3)通过训练语料对词语之间的相似度进行计算,并从词语自身的出现频次和/或在同一语句中与其他词语的共现关系的角度考虑词语之间的相似度,能更全面、更准确的体现词语之间语义上的相似性,而不限于文字上的相似性。附图说明此处所说明的附图用来提供对本申请的进一步理解,构成本申请本文档来自技高网...
一种为文本信息匹配资源的方法及装置

【技术保护点】
一种为文本信息匹配资源的方法,其特征在于,包括:依据所述文本信息,获取文本关键字;依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源;其中,所述资源标签与所述资源相对应。

【技术特征摘要】
1.一种为文本信息匹配资源的方法,其特征在于,包括:依据所述文本信息,获取文本关键字;依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源;其中,所述资源标签与所述资源相对应。2.按照权利要求1所述方法,其特征在于,所述文本关键字与资源标签的相似度的确定包括:从词向量库中分别获取所述文本关键字的第一词向量和所述资源标签的第二词向量;所述词向量库中包含至少一个分词的词向量;计算所述第一词向量与所述第二词向量的余弦相似度,作为所述文本关键字与所述资源标签的相似度。3.按照权利要求2所述方法,其特征在于,所述词向量库中词向量的获得包括:获取用于训练词向量的训练语料;对所述训练语料进行分词,获得分词集合;依据所述分词集合中各分词的出现频次和/或与其他分词的共现关系,确定各分词的词向量;所述词向量中每一个元素表示对应分词的出现频次和/或与其他分词的共现频次。4.按照权利要求1所述方法,其特征在于,依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源,包括:对所述文本关键字与所述资源标签的相似度进行排序;将相似度最高的预设个资源标签输出,用以确定与所述文本信息相匹配的资源。5.按照权利要求1所述方法,其特征在于,依据所述文本关键字与资源标签的相似度,确定与所述文本信息相匹配的资源,包括:依据所述文本关键字与所述资源标签的相似度、以及相对应的资源标签在所属资源项中的权重,计算所述文本关键字与所述资源项的匹配程度;其中,所述资源项中包含至少一个所述资源标签;依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源;其中,所述资源项中包含至少一个所述资源。6.按照权利要求5所述方法,其特征在于,计算所述文本关键字与所述资源项的匹配程度,包括:计算所述相似度与所述权重的乘积之和,作为所述文本关键字与相对应的资源标签所属资源项的匹配程度。7.按照权利要求5所述方法,其特征在于,依据所述文本关键字与各所述资源项的匹配程度,确定与所述文本信息相匹配的资源,包括:对所述文本关键字与所述资源项的匹配程度进行排序;将最匹配的预设个资源项...

【专利技术属性】
技术研发人员:刘守达吴松城陈军宏
申请(专利权)人:厦门幻世网络科技有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1