一种基于Hadoop的FLASH P2P流媒体实时监测方法技术

技术编号：11373065 阅读：69 留言：0更新日期：2015-04-30 08:38

本发明专利技术涉及一种基于Hadoop的FLASH P2P流媒体实时监测方法，所述方法包括客户端启动作业，通过任务调度器获取该作业，并将其放入作业队列中；通过所述客户端开启嗅探器，获取数据包，将所述数据包发送给HDFS；从所述HDFS获取输入划分信息，创建映射任务，并将每个映射任务分配给任务跟踪器；所述任务跟踪器收到映射任务后，从HDFS获取映射化简程序MapReduce，同时对该任务执行映射和化简。由此克服了数据量庞大不能及时处理的缺陷。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Hadoop的FLASHP2P流媒体实时监测方法
本专利技术涉及一种实时监测方法，具体涉及一种基于Hadoop的FLASHP2P流媒体实时监测方法。
技术介绍
FLASHP2P技术是现在视频网站用的比较成熟的技术。FlashP2P视频点播系统则使用FlashP2p技术，提供了一种全新分发点播视频的方式，在保证观众良好观看体验的同时降低了服务器负担和带宽使用，显著提高视频服务器的并发量和降低服务器和带宽成本。目前国内多家视频门户网站采用了FlashP2P技术，例如优酷、爱奇艺、搜狐等。Hadoop是基于分布式技术、并行处理技术和网格计算技术发展的产物,是为了适应用海量数据和大规模计算等新需求而发展出来的模型架构。Hadoop也是一个分布式存储和分布式计算的框架,可以高效的存储海量数据,而且可以运行、编写分布式应用程序处理海量数据。一方面Hadoop在编写和运行大型分布式程序计算方面具有很大优势,主要是Hadoop具有的方便和简捷的特性。另一方面,Hadoop具有极高的拓展性,使得Hadoop在研究和应用领域得到了广泛的应用，且广受欢迎。Hadoop数据中心由连接在一起的千上万的计算机构成,用户通过普通电脑接入就可以使用数据中心,根据自己的需求进行存储。HDFS作为Hadoop的分布式文件系统,具有高度的稳定性和存储效率；提供了高效的数据存储,为用户提供快速、稳定的数据存储服务。Map(化简)Reduce(映射)是Hadoop的核心计算数据模型，用户在使用Map(化简)Reduce(映射)模型进行大规模数据处理时,可以将主要精力放在如何编写Map(化简...

【技术保护点】
一种基于Hadoop的FLASH P2P流媒体实时监测方法，其特征在于，所述方法包括：(1)客户端启动作业，通过任务调度器获取该作业，并将其放入作业队列中；(2)通过所述客户端开启嗅探器，获取数据包，将所述数据包发送给HDFS；(3)从所述HDFS获取输入划分信息，创建映射任务，并将每个映射任务分配给任务跟踪器；(4)所述任务跟踪器收到映射任务后，从HDFS获取映射化简程序MapReduce，同时对该任务执行映射和化简。

【技术特征摘要】
1.一种基于Hadoop的FLASHP2P流媒体实时监测方法，其特征在于，所述方法包括：(1)客户端启动作业，通过任务调度器获取该作业，并将其放入作业队列中；(2)通过所述客户端开启嗅探器，获取数据包，将所述数据包发送给HDFS；(3)从所述HDFS获取输入划分信息，创建映射任务，并将每个映射任务分配给任务跟踪器；(4)所述任务跟踪器收到映射任务后，从HDFS获取映射化简程序MapReduce，同时对该任务执行映射和化简；所述步骤(4)中执行映射的方法包括：在执行映射前，确认映射任务的输入/输出的路径，并输入目录下的数据文件；获取第一<键，值>、中间<键，值>和第二<键，值>，先根据第一<键，值>进行映射计算，对其输出结果进行第二次映射计算，得到映射输出结果进行化简输出，并将数据输出到设定的目录下；第一次映射计算，包括通过映射函数根据数据包类型筛选UDP数据包，生成所述中间<键，值>，并删除UDP数据包外的其他数据包，其中键值为该UDP数据包类型，value值为UDP数据包。2.如权利要求1所述的FLASHP2P流媒体实时监测方法，其特征在于，所述步骤(1)中，所述作业用于将FLASHP2P流量从网络流量中分离。3.如权利要求1所述...

【专利技术属性】
技术研发人员：丁杰，刁柏青，孟祥君，张伟昌，杨佩，潘森，
申请(专利权)人：国家电网公司，中国电力科学研究院，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人