prince的文章

一、了解HBase

HBase 概述 HBase是[Hadoop][]的生态系统，是建立在Hadoop文件系统（HDFS）之上的分布式、面向列的数据库，通过利用Hadoop的文件系统提供容错能力。如果你需要进行实时读写或者随机访问大规模的数据集的时候，请考虑使...

princeHBase 教程阅读(308)

//www.w3cschool.cn/hadoop/hadoop_big_data_overview.html

princeHadoop 教程阅读(257)

公众号：“皇子谈技术”主理人

2026-05-19

Hadoop – 参考 Yahoo教程细细品味Hadoop HDFS 原理、架构与特性介绍 Hadoop MapReduce开发最佳实践 MapReduce的Shuffle阶段 Hadoop的最佳实践和反模式 Hadoop读split

princeHadoop 教程阅读(275)

Hadoop 监控 Logyarn.log-aggregation-enable=true如果显示错误，则日志存储在节点管理器运行节点上。当聚集启用时所有日志进行汇总，任务完成后转移到HDFS。 Hadoop集群性能监控Ganglia, N...

princeHadoop 教程阅读(264)

Hadoop配置有两种配置文件：一种是*_*_-default.xml（只读，默认的配置）一种是#x662F;__-site.xml（替换default中的配置） core-site.xml 配置公共属性 hdfs-site.xml ...

princeHadoop 教程阅读(236)

Hadoop安装单节点安装所有服务运行在一个JVM中，适合调试、单元测试伪集群所有服务运行在一台机器中，每个服务都在独立的JVM中，适合做简单、抽样测试多节点集群服务运行在不同的机器中，适合生产环境配置公共帐号方便主与从进行...

princeHadoop 教程阅读(235)

Hadoop 测试 MRUnit单元测试Mapper和Reducer类在内存上独立运行, PipelineMapReduceDriver单线程运行. LocalJobRunner单线程运行, 且仅有一个 Reducer能够启动conf.se...

princeHadoop 教程阅读(240)

Hadoop – IO 1、输入文件从HDFS进行读取.； 2、输出文件会存入本地磁盘.； 3、 Reducer和Mapper间的网络I/O,从Mapper节点得到Reducer的检索文件.； 4、使用Reducer实例从本地磁盘回读...

princeHadoop 教程阅读(232)

MapReduce – 编程处理 1、 select：直接分析输入数据，取出需要的字段数据即可； 2、 where:也是对输入数据处理的过程中进行处理，判断是否需要该数据； 3、 aggregation:min,max,sum； 4、 g...

princeHadoop 教程阅读(245)

MapReduce – Shuffle 对Map的结果进行排序并传输到Reduce进行处理 Map的结果并不#x662F;直接存放到硬盘,而是利用缓存做一些预排序处理 Map会调用Combiner，压缩，按key进行分区、排序等，尽量减少结...

princeHadoop 教程阅读(243)