元数据标签描述的生成制造技术

技术编号:17269340 阅读:78 留言:0更新日期:2018-02-14 18:44
提供了用于元数据标签评估的一个或多个技术和/或系统。例如,可以标识与内容相关联的元数据标签(例如,可以使用主题标签#ML来标记社交网络帖子)。可以利用概率矩阵和内容来评估上述内容内的一组字符,以标识经扩展的元数据标签(例如,经扩展的主题标签“机器学习”)。可以检索与经扩展的元数据标签相关联的描述性内容,诸如网站、文章、社交网络帖子和/或其他内容。可以基于描述性内容(例如,用于机器学习的定义)来生成元数据标签的描述。以这种方式,可以将描述、相关元数据标签和/或补充内容提供给有兴趣了解元数据标签的用户。

The generation of metadata label description

One or more technologies and / or systems for the evaluation of the metadata label are provided. For example, a metadata tag associated with a content can be identified (for example, a topic tag #ML can be used to mark social network posts). We can use probability matrix and content to evaluate a set of characters in the above content to identify extended metadata tags (for example, extended theme tag \machine learning\). Descriptive content associated with an extended metadata label, such as web sites, articles, social network posts, and / or other content, can be retrieved. A description of a meta data label can be generated based on descriptive content (for example, a definition of machine learning). In this way, can be described and related metadata tags and / or supplementary content available to interested users data element tag.

【技术实现步骤摘要】
【国外来华专利技术】元数据标签描述的生成
技术介绍
很多用户可以利用元数据标签来标记各种内容。在一个示例中,用户可以利用主题标签#myvacation来标记度假照片。在另一示例中,用户可以利用主题标签#atthebaseballgame来标记关于棒球比赛的社交网络消息。很多时候,元数据标签可能使用首字母缩略词(例如,用于“thankgoodnessit’sFriday”的#tgif)或者新创建的术语(例如,用于在电视上刚刚首播的“DancingwithFriendsshow”的#DWFS)进行标记,某些用户可能无法辨识这些标签。
技术实现思路
提供
技术实现思路
部分是为了以简化的形式介绍将在以下具体实施方式部分中进一步描述的一些概念。
技术实现思路
部分无意标识所要求保护的主题的关键因素或重要特征,也无意限制所要求保护的主题的范围。除了其他之外,本文中提供了用于元数据标签评估的一个或多个系统和/或技术。在元数据标签评估的示例中,标识与内容相关联的元数据标签。元数据标签包含一组字符。利用概率矩阵和上述内容来评估该组字符,以标识经扩展的元数据标签。检索与经扩展的元数据标签相关联的描述性内容。基于描述性内容来生成元数据标签的描述。在一个示例中,接收包括元数据标签的查询。经扩展的元数据标签被标识为元数据标签的扩展。提供元数据标签的描述作为查询的查询结果。为了实现前述和相关目的,以下描述和附图阐述了某些说明性方面和实现。这些仅指示一个或多个方面可以采用的各种方式中的几种。结合附图考虑下文的具体实施方式,本公开的其他方面、优点和新颖特征将变得清楚。附图说明图1是示出元数据标签评估的示例性方法的流程图。图2是示出用于元数据标签评估的示例性系统的部件框图,其中元数据标签的描述被生成。图3是示出用于元数据标签评估的示例性系统的部件框图,其中元数据标签的描述被生成。图4是示出用于元数据标签评估的示例性系统的部件框图,其中元数据标签的描述被提供为查询结果。图5是示例性计算机可读介质的图示,其中可以包括被配置为实现本文中阐述的一个或多个规定的处理器可执行指令。图6示出了其中可以实现本文中阐述的一个或多个规定的示例性计算环境。具体实施方式现在参考附图来描述所要求保护的主题,其中相同的附图标记通常始终用于指代相同的元素。在以下描述中,出于解释的目的,阐述了很多具体细节,以提供对所要求保护的主题的理解。然而,将清楚的是,可以在没有这些具体细节的情况下实践所要求保护的主题。在其他情况下,为了便于描述所要求保护的主题,以框图形式示出了结构和设备。本文中提供了用于元数据标签评估的一个或多个技术和/或系统。用户可能希望获得元数据标签的描述(例如,与“NewTVShowSitcom”的首字母缩略词相对应的其他非自身可标识的主题标签的描述、诸如#NTVSC的描述)、与元数据标签相关联的补充内容(例如,“NewTVShowSitcom”的图像和/或预告片)和/或相关元数据标签(例如,与“NewTVShowSitcom”中的演员对应的#JohnDoe)。因此,如本文中提供的,元数据标签评估部件可以评估元数据标签以生成元数据标签的描述,标识元数据标签的补充内容和/或元数据标签的相关元数据标签。元数据标签评估部件可以以有效的方式评估元数据标签,从而可以基于元数据标签评估来向用户提供描述、补充内容和/或相关元数据标签。在一个示例中,元数据标签评估部件可以被本地托管在客户端设备上,并且因此可以减轻带宽利用和/或保护用户信息的隐私,用户信息诸如是社交网络帖子、日历条目、照片、消息和/或其他内容(例如,用户已经给出内容供元数据标签评估使用的那些内容)。在另一示例中,元数据标签评估部件可以被托管在远程服务器上,并且因此可以减轻客户端侧存储器和/或处理器利用。在一个示例中,元数据标签评估部件中的至少一些可以被本地托管,并且元数据标签评估部件中的至少一些可以被远程托管。可以理解,用户可以采取肯定的动作,诸如提供选定同意,来允许访问和/或使用内容、信息、数据等(例如,社交网络帖子、日历条目、照片、消息等),诸如用于评估元数据标签的目的(例如,在这种情况下,在用户对关于收集和/或使用这样的信息的提示进行响应)。例如,社交网络的用户可以通过社交网络账户设置来指定(例如,由用户在社交网络帖子中使用的)元数据标签和/或其他社交网络内容可以出于生成这样的元数据标签的描述这样的目的而被使用。元数据标签评估的实施例由图1的示例性方法100示出。在102,该方法开始。在104,可以标识与内容相关联的元数据标签,其中元数据标签包括一组字符。元数据标签可以包括内容的主题标签(hashtag)或任何其他描述性标识符。内容可以包括可以与元数据标签相关联的社交网络帖子、微博消息、图像、视频、用户评论、网站、文章、消息和/或各种其他内容。在一个示例中,用户可以使用元数据标签#V4JIM来标记社交网络帖子“EveryoneshouldvoteforJimintheupcomingpresidentialelection”。然而,很多用户可能不理解元数据标签#V4JIM的含义,并且因此可能有利的是,对元数据标签#V4JIM进行评估,以生成元数据标签#V4JIM的描述。在106,可以使用概率矩阵和内容来评估该组字符,以标识经扩展的元数据标签。概率矩阵可以表示:以该组字符内的字符开始的术语或词语出现在元数据标签的扩展内的可能性/概率,和/或包括以该组字符内的字符开始的术语或词语的短语将出现在元数据标签的扩展内的可能性/概率。在一个示例中,概率矩阵可以是分词算法的定制,其中可能性/概率被限制为用于元数据标签的内容(例如,概率可以基于社交网络帖子、文章和/或包括元数据标签的各种其他内容内的文本),和/或其中元数据标签内的首字母缩略词基于标识可能的(例如,最有可能的)扩展而被扩展,对可能的扩展的标识基于内容内的文本(例如,文本“EveryoneshouldvoteforJimintheupcomingpresidentialelection”)。概率矩阵可以基于内容和/或与元数据标签相关联的其他内容中出现的文本和/或特征(例如,从文章、图像、视频等中提取的特征)来被填充。在一个示例中,可以基于以下来为第一字符“V”标识第一术语:第一术语在频率概率矩阵内具有在阈值(例如,用于“V”的最高频率概率)以上的第一频率概率。例如,可以为第一字符“V”标识术语“vote”。可以基于以下来为第二字符“4”标识第二术语:第二术语在频率概率矩阵内具有在阈值(例如,用于“4”的最高频率概率)以上的第二频率概率。例如,可以为第二字符“4”标识术语“for”。基于对第三字符“J”、第四字符“I”和第五字符“M”的评估,可以利用概率矩阵标识第三术语“Jim”。基于包括第一术语、第二术语和第三术语的短语“voteforJim”在概率矩阵内具有在短语阈值以上的短语频率概率,可以标识该短语,以将该短语包括在经扩展的元数据标签内,该短语阈值例如是最高短语频率概率,该最高短语频率概率指示第一术语、第二术语和第三术语在元数据标签的扩展内一起出现的相对较高可能性。可以理解,可以对照概率矩阵来标识和评估多个术语候选和/或短语候选,以标识元数据标签的扩展。以这种方式,经扩展的元数本文档来自技高网...
元数据标签描述的生成

【技术保护点】
一种通过利用生成的元数据标签描述对计算机搜索索引进行扩展来改进计算机搜索结果的方法,所述方法包括:在计算设备处获得包括元数据标签的内容,所述元数据标签包括文本字符;利用所述计算设备,基于相同元数据标签的其他文本字符并且基于所获得的内容,利用概率矩阵来生成与所述文本字符相对应的词语,所述概率矩阵标识一个或多个文本字符表示一个或多个词语的概率;利用所述计算设备生成所述元数据标签的扩展版本,经扩展的元数据标签包括所生成的词语,所生成的词语代替所述元数据标签的对应文本字符;在所述计算设备处检索描述性内容,所述描述性内容提供与所述经扩展的元数据标签相关的另外的信息,所述描述性内容不同于所获得的内容;以及在所述计算设备处基于所检索的描述性内容来生成所述元数据标签的描述。

【技术特征摘要】
【国外来华专利技术】2015.06.02 US 14/728,4401.一种通过利用生成的元数据标签描述对计算机搜索索引进行扩展来改进计算机搜索结果的方法,所述方法包括:在计算设备处获得包括元数据标签的内容,所述元数据标签包括文本字符;利用所述计算设备,基于相同元数据标签的其他文本字符并且基于所获得的内容,利用概率矩阵来生成与所述文本字符相对应的词语,所述概率矩阵标识一个或多个文本字符表示一个或多个词语的概率;利用所述计算设备生成所述元数据标签的扩展版本,经扩展的元数据标签包括所生成的词语,所生成的词语代替所述元数据标签的对应文本字符;在所述计算设备处检索描述性内容,所述描述性内容提供与所述经扩展的元数据标签相关的另外的信息,所述描述性内容不同于所获得的内容;以及在所述计算设备处基于所检索的描述性内容来生成所述元数据标签的描述。2.根据权利要求1所述的方法,包括:接收包括所述元数据标签的搜索查询;将所述经扩展的元数据标签标识为所述元数据标签的扩展;以及提供所生成的所述元数据标签的所述描述作为所述查询的搜索结果。3.根据权利要求1所述的方法,包括:获得包括第二元数据标签的第二内容,所获得的第二内容还包括所述元数据标签;以及将所述第二元数据标签标识为与所述元数据标签相关。4.根据权利要求3所述的方法,包括:接收包括所述元数据标签的搜索查询;以及提供所述元数据标签的所述描述和所述第二元数据标签两者,所述第二元数据标签作为建议。5.根据权利要求1所述的方法,其中生成与所述文本字符相对应的所述词语包括:基于在所述概率矩阵内一个或多个文本字符的第一集合的表示一个或多个词语的第一集合的第一概率在阈值以上,标识与所述一个或多个文本字符的第一集合相对应的所述一个或多个词语的第一集合;基于在所述概率矩阵内一个或多个文本字符的第二集合的表示一个或多个词语的第二集合的第二概率在所述阈值以上,标识与所述一个或多个文本字符的第二集合相对应的所述一个或多个词语的第二集合;以及基于在所述概率矩阵内包括所述一个或多个词语的第一集合和所述一个或多个词语的第二集合的短语由所述元数据标签的所述文本字符表示的短语概率在短语阈值以上,将所述一个或多个词语的第一集合和所述一个或多个词语的第二集合包括在所述经扩展的元数据标签内。6.根据权利要求1所述的方法,还包括:将第一时间标识符与所生成的描述相关联,所述第一时间标识符与第一时间范围相对应,在所述第一时间范围期间,所生成的描述描述所述元数据标签;生成与第二时间范围相关联的、所述元数据标签的第二描述,所生成的第二描述不同于所生成的所述描述并且基于第二描述性内容,所述第二描述性内容不同于所述描述性内容;以及将第二时间标识符与所生成的第二描述相关联,所述第二时间标识符与所述第二时间范围相对应,在所述第二时间范围期间,所生成的第二描述描述所述元数据标签。7.根据权利要求1所述的方法,包括:标识社交媒体内容,所述社交媒体内容包括所述元数据标签和对所述社交媒体内容外部的补充内容的引用两者;接收包括所述元数据标签的搜索查询;以及提供所生成的所述元数据标签的描述和所述补充内容两者作为所述查询的搜索结果。8.一种包括计算机可执行指令的计算机可读介质,所述计算机可执行指令在被执行时使计算设备执行根据权利要求1所述的步骤。9.一种通过利用生成的元数据标签描述对计算机搜索索引进行扩展来改进计算机搜索结果的计算设备,所述计算设备包括:一个或多个处理单元;以及包括计算机可执行指令的计算机...

【专利技术属性】
技术研发人员:S·N·班努尔O·阿隆索M·亨切尔
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1