北京某公司 Flume-ng+Kafka+Storm+HDFS 实时系统 21页内部培训PPT

时光与梦 · 发表于 2015-2-3 17:04:33

[free]

1）.数据采集
负责从各节点上实时采集数据，选用cloudera的flume来实现
2）.数据接入
由于采集数据的速度和数据处理的速度不一定同步，因此添加一个消息中间件来作为缓冲，选用apache的kafka
3）.流式计算
对采集到的数据进行实时分析，选用apache的storm
4）.数据输出
对分析后的结果持久化，暂定用mysql

模块化思想设计原因

1.模块化使功能划分更加清晰，从“数据采集--数据接入--流失计算--数据输出/存储”

2.模块化之后，加入当Storm挂掉了之后，数据采集和数据接入还是继续在跑着，数据不会丢失，storm起来之后可以继续进行流式计算

购买主题 已有 4 人购买 本主题需向作者支付 4 金币 才能浏览

remzhang · 发表于 2015-2-9 23:14:54

来了，好东西要收藏

king888 · 发表于 2015-3-15 01:08:44

来了，好东西要收藏

xubo · 发表于 2015-3-18 11:53:13

谢谢谢谢谢谢谢谢谢谢谢谢谢谢

hnlyd · 发表于 2015-3-30 20:25:36

赞，至少要十个字

笨笨 · 发表于 2015-3-31 22:42:42

JasonLee · 发表于 2015-4-3 10:50:50

that's very good
thanks very much.

lq_witness · 发表于 2015-5-5 20:53:27

谢谢谢谢谢谢

baojian_322 · 发表于 2015-5-11 11:01:31

非常不错的资料

findme1110 · 发表于 2015-5-11 15:36:46

感谢分享，单元能下载

三通IT学院

北京某公司 Flume-ng+Kafka+Storm+HDFS 实时系统 21页内部培训PPT

相关帖子

我爱三通

售前咨询

售后服务