楼主: 涤尘谷

[数据仓库/商业智能] 新版Andy老师商业智能数据仓库BI-ETL培训视频全集

  [复制链接]

0

主题

269

帖子

1749

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
-100
技术
0
活跃
259
在线时间
26 小时
发表于 2016-8-31 11:23:32 | 显示全部楼层
新版Andy老师商业智能数据仓库BI-ETL培训视频全集

0

主题

376

帖子

2480

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
0
技术
0
活跃
385
在线时间
44 小时
擅长技术
思科华为
发表于 2016-9-2 22:39:36 | 显示全部楼层
啊啊啊啊啊啊啊啊啊

44

主题

2174

帖子

1万

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
-100
技术
0
活跃
1299
在线时间
513 小时
发表于 2016-9-15 02:39:27 | 显示全部楼层
商业智能数据仓库BI-ETL培训视频全集

0

主题

735

帖子

4765

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
-100
技术
0
活跃
650
在线时间
57 小时
擅长技术
编程
发表于 2016-9-28 15:22:28 | 显示全部楼层
感谢楼主的精彩分享!

0

主题

1122

帖子

7772

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
-100
技术
0
活跃
1197
在线时间
193 小时
发表于 2016-9-29 09:28:58 | 显示全部楼层
谢谢楼主分享

0

主题

34

帖子

95

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
-100
技术
0
活跃
39
在线时间
5 小时
发表于 2016-10-31 15:26:48 | 显示全部楼层
  以上这些传统数据仓库中的组件,在Hadoop生态圈中都有对应的开源项目或产品。
        抽取
        Hadoop生态圈中的主要数据摄取工具是Sqoop。Sqoop被设计成支持从关系数据库传输数据,而Flume被设计成基于流的数据捕获 —— 主要是从日志文件中获取数据。使用这两个工具可以建立数据仓库的抽取过程。
        转换与装载
        Hive可以用于装载和装换数据。Hive实际上是在MapReduce之上封装了一层SQL解释器,这样可以用类SQL语言书写复杂的MapReduce作业。
        过程管理
        Hadoop生态圈中的主要管理工具是Falcon。Falcon把自己看作是数据治理工具,能让用户建立定义好的ETL流水线。除Falcon外还有一个叫做Oozie的工具,它是是一个Hadoop的工作流调度系统,可以使用它将ETL过程封装进工作流自动执行。
        数据目录
        Hadoop生态圈中主要的数据目录工具是HCatalog —— 一个Hive的组件。HCatalog被设计成给Hadoop引入“表”的抽象,把文件看做数据集。通过HCatalog,用户不需要做很多工作就可以轻松知道系统中有哪些表,表中都包含什么。
        查询引擎和SQL层
        Hadoop生态圈中的主要SQL查询引擎有基于MapReduce的Apache Hive、SparkSQL和Cloudera公司的Impala。Hive可以在四种主流计算框架的三种(分别是Tez、MapReduce和 Spark,还有一种是Storm)上执行类SQL查询。SparkSQL是Hadoop中另一个著名的SQL引擎,它实际上是一个Scala程序语言的子集。正如SparkSQL这个名字所暗示的,它以Spark作为底层计算框架。Impala是Cloudera公司的查询系统,它提供SQL语义,最大特点是速度快,主要用于OLAP。
        用户界面
        Hadoop生态圈中比较知名的数据可视化工具是Hue和Zeppelin,其中Hue支持Hive和Impala,Zeppelin目前只支持SparkSQL。

0

主题

232

帖子

1563

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
0
技术
0
活跃
278
在线时间
24 小时
发表于 2016-11-8 10:49:08 | 显示全部楼层
999999999999999999999999

0

主题

727

帖子

4806

积分

Yib

Rank: 10Rank: 10Rank: 10

贡献
0
技术
0
活跃
616
在线时间
110 小时
发表于 2016-11-15 09:11:49 | 显示全部楼层
传统商业智能的内容

0

主题

788

帖子

5198

积分

Yib

Rank: 10Rank: 10Rank: 10

贡献
0
技术
0
活跃
998
在线时间
52 小时

我爱三通水神

发表于 2016-11-17 14:54:58 | 显示全部楼层
三通出品,必属精品

0

主题

482

帖子

3185

积分

论坛贵宾VIP-永久权限

Rank: 8Rank: 8

贡献
0
技术
0
活跃
380
在线时间
23 小时
发表于 2016-12-8 16:00:08 | 显示全部楼层
很好,很强大
使用 高级模式(可批量传图、插入视频等)
您需要登录后才可以回帖 登录 | 立即注册

快速回复 返回顶部 返回列表