基于微博的众包问答系统信息采集方法技术方案

技术编号：8703198 阅读：295 留言：0更新日期：2013-05-15 23:18

本发明专利技术公开了一种基于微博的众包问答系统信息采集方法，该发明专利技术首先实现了与微博平台进行数据交互的数据采集和发布模块，通过该模块自动采集系统相关的所有问答数据和用户资料信息；对于采集到的问答数据进行后台分析处理，为用户提供更直观和专业的回答结果展示；另外，系统通过对用户资料信息和问答行为的具体分析，将各类新问题有效推送给可能回答的潜在用户，以对新问题进行高效、快速扩散；应用本发明专利技术的方法，可以通过微博平台实现问答系统更高效快速地获取答案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及互联网应用中的数据处理技术、信息处理领域中的文本相似度分析技术、社交网络领域中的用户兴趣信息提取技术，特别涉及一种。
技术介绍
在互联网应用方面，大多数社交网络平台都采用了开放授权0Auth2的用户登陆和授权模式。应用通过平台用户的授权之后，就可以通过API接口获取相应的用户数据。此夕卜，在微博系统中，当用户@具体账号时，该条消息就会发送给被@的用户。所述@到该官方账号具体为:在微博内容中加上以“@”+账号昵称为格式的文本。这些成熟的互联网数据处理技术和服务是本专利技术实现的基础。在众包系统中，通常都是通过一套激励措施吸引用户来完成一系列的工作和任务。问答网站是众包系统的一种实例。在问答网站中，一般都实现了积分方式作为对回答者的一种激励。众包系统的存在，正是因为在信息处理领域中，许多的问题和工作仍然只有通过人力才能够更高效地开展。最近几年来，在众包系统领域，专家学者又提出了一系列新的思路和技术。例如，伯克利大学的科研工作者提出了通过众包来回答数据库查询的技术。在信息处理领域中，文本相似度分析已经存在很多成熟的算法，例如最长公共子串LCS算法和字符串...

【技术保护点】
一种基于微博的众包问答系统信息采集方法，其特征在于，包括如下步骤：步骤1：在微博平台上注册官方账号，在微博开放平台申请成为第三方网站开发账号，获取开发网站的App Key（应用码）和App Secret（应用密钥）；步骤 2：通过微博开放平台提供的接口，开发数据采集和发布模块，向微博平台采集和发布数据，包括问答数据以及用户资料信息；步骤3：用户发起的任何问题只需要@到该官方账号，该问题原微博以及所有转发微博将通过数据采集和发布模块被系统采集收录；步骤4：对采集到的问答数据进行分析处理：该步骤可提取该问题的整体树状转发结构、提取相似答案、过滤纯转发答案，并对整个话题回答进行各类统计分析；步骤5：...

【技术特征摘要】

【专利技术属性】
技术研发人员：胡天磊，伍赛，陈刚，周显锞，张冰冰，陈珂，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人