Hadoop集群部署配置文档2
2013-06-02 20:12:32 来源:WEB开发网核心提示:Tip:8) 参数mapred.map.output.compression.codec 默认值 org.apache.hadoop.io.compress.DefaultCode
Tip:
8) 参数mapred.map.output.compression.codec
默认值
|
org.apache.hadoop.io.compress.DefaultCodec
|
说明
|
如果 mapred.compress.map.output=true,则会使用这个codec来执行压缩。一般常见的压缩格式为
· deflate: org.apache.hadoop.io.compress.DefaultCodec,已內建
· gzip: org.apache.hadoop.io.compress.GzipCodec,已內建
· bzip2: org.apache.hadoop.io.compress.BZip2Codec,已內建
· lzo: com.hadoop.compression.lzo.LzoCodec,因为lzo是GPL license,Apache 或 Cloudera 的版本没有内建,需要自行安装lzo package
· snappy: org.apache.hadoop.io.compress.SnappyCodec,Cloudera的版本已內建这个codec
|
生产环境配置值
|
com.hadoop.compression.lzo.LzoCodec
|
Tip:
2.4.3 其他
1) 参数mapred.heartbeats.in.second
默认值
|
100
|
说明
|
作业管理跟踪器的每秒中到达的心跳数量
|
生产环境配置值
|
200
|
Tip:
2) 参数mapreduce.tasktracker.outofband.heartbeat
默认值
|
false
|
说明
|
让在任务结束后发出一个额外的心跳信号
|
生产环境配置值
|
true
|
Tip:
3) 参数hadoop.job.history.user.location
默认值
|
|
说明
|
可以指定具体某个作业的跟踪管理器的历史文件存放目录
|
生产环境配置值
|
none
|
更多精彩
赞助商链接