大数据-Hadoop-基础篇-第二章-介绍

目录
参考
概述
- Hadoop是一个由Apache基金会所开发的分布式系统基础架构
- 用java语言实现,开源
- 允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算
- Hadoop核心组件
- Hadoop HDFS(分布式文件存储系统):解决海量数据存储
- Hadoop YARN(集群资源管理和任务调度框架):解决资源任务调度
- Hadoop MapReduce(分布式计算框架):解决海量数据计算
架构
Hadoop特性优点
Hadoop发行版本
Apache开源社区版本
商业发行版本
- Cloudera:
- Hortonworks: