13811| 112
|
北京某公司 Flume-ng+Kafka+Storm+HDFS 实时系统 21页内部培训PPT |
[free]
1).数据采集 负责从各节点上实时采集数据,选用cloudera的flume来实现 2).数据接入 由于采集数据的速度和数据处理的速度不一定同步,因此添加一个消息中间件来作为缓冲,选用apache的kafka 3).流式计算 对采集到的数据进行实时分析,选用apache的storm 4).数据输出 对分析后的结果持久化,暂定用mysql 模块化思想设计原因 1.模块化使功能划分更加清晰,从“数据采集--数据接入--流失计算--数据输出/存储” 2.模块化之后,加入当Storm挂掉了之后,数据采集和数据接入还是继续在跑着,数据不会丢失,storm起来之后可以继续进行流式计算
购买主题
已有 4 人购买
本主题需向作者支付 4 金币 才能浏览
| |
发表于 2015-2-9 23:14:54
|
显示全部楼层
| ||
发表于 2015-3-15 01:08:44
|
显示全部楼层
| ||
发表于 2015-3-18 11:53:13
|
显示全部楼层
| ||
发表于 2015-3-30 20:25:36
|
显示全部楼层
| ||
发表于 2015-4-3 10:50:50
|
显示全部楼层
| ||
发表于 2015-5-5 20:53:27
|
显示全部楼层
| ||
发表于 2015-5-11 11:01:31
|
显示全部楼层
| ||
发表于 2015-5-11 15:36:46
|
显示全部楼层
| ||