一种数据标示方法和管理系统技术方案

技术编号：12787725 阅读：67 留言：0更新日期：2016-01-28 16:17

本发明专利技术提供了一种数据标示方法和管理系统，涉及数据加工处理领域。方法包括：S1，服务器提取待标示的数据的标题分词和/或正文的高词频分词和/或关键词汇；S2，服务器将所述标题分词和/或所述正文的高词频分词和/或关键词汇与所述数据的标签库进行对比，获取对比结果中匹配度大于90％的所述标题分词和/或所述正文的高词频分词和/或关键词汇，作为标示所述数据的第一位标签；所述第一位标签写入所述标签库；S3，人工读取所述数据的标题内容，用与所述标题内容匹配度大于90％的第一位标签对所述数据进行标示。采用本发明专利技术提供的技术方案，可以降低对技术人员的要求，提高工作效率，从而大大的降低数据加工成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据加工处理领域，尤其涉及一种数据标示方法和管理系统。
技术介绍
如今，人们已经习惯于从互联网上获取信息，而对数据进行标示处理，使人们在标示的指引下，快速的获得有用的信息，受到了广大用户的欢迎，也得到了技术人员的广泛关注和研究。目前，数据标示处理技术主要是通过人工的方式进行，技术人员通过阅读、理解数据内容后，再根据自身的理解，归纳、整理出能够代表数据内容的标签，完成对数据的标示。但是，该过程对技术人员的要求高，且由于人工处理效率低，因此需要的技术人员的数量多，从而使得对数据进行标示处理的成本高；尤其当互联网上具有大量的数据时，采用上述技术对其进行标示处理成本就会更高。
技术实现思路
本专利技术的目的之一在于提供一种数据标示方法，本专利技术的目的之二在于提供一种数据表示管理系统，通过利用服务器的初次标示后，再经过人工简单的校正和调整，完成对数据内容的标示，从而解决现有技术中存在的前述问题。为了实现上述目的，本专利技术采用的技术方案如下:—种数据标示方法,包括如下步骤:S1，服务器提取待标示的数据的标题分词和/或正文的高词频分词和/或关键词汇；S2，服务器将所述标题分词和/或所述正文的高词频分词和/或关键词汇与所述数据的标签库进行对比，获取对比结果中匹配度大于90%的所述标题分词和/或所述正文的高词频分词和/或关键词汇，作为标示所述数据的第一位标签；所述第一位标签写入所述标签库；S3，人工读取所述数据的标题内容，用与所述标题内容匹配度大于90%的第一位标签对所述数据进行标示。进一步地，步骤S2和步骤S3之间，还包括用户自定义标签的步骤，...

【技术保护点】
一种数据标示方法，其特征在于，包括如下步骤：S1，服务器提取待标示的数据的标题分词和/或正文的高词频分词和/或关键词汇；S2，服务器将所述标题分词和/或所述正文的高词频分词和/或关键词汇与所述数据的标签库进行对比，获取对比结果中匹配度大于90％的所述标题分词和/或所述正文的高词频分词和/或关键词汇，作为标示所述数据的第一位标签；所述第一位标签写入所述标签库；S3，人工读取所述数据的标题内容，用与所述标题内容匹配度大于90％的第一位标签对所述数据进行标示。

【技术特征摘要】

【专利技术属性】
技术研发人员：汤潮，汤杨，
申请(专利权)人：北京龙源创新信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人