Hadoop、Hive、Pig 等软件含有大量的配置,当需要对其软件配置进行修改时,可以使用软件配置功能来实现。目前软件配置操作只能在集群启动时执行一次。

例如,HDFS 服务器的服务线程数目 dfs.namenode.handler.count 默认是 10,假设要加大到 50;HDFS 的文件块的大小 dfs.blocksize 默认是 128 MB,假设系统都是小文件,想要改小到 64 MB。

操作步骤

  1. 登录阿里云 E-MapReduce 控制台
  2. 在上方选择所在的地域(Region),所创建集群将会在对应的地域内。
  3. 单击创建集群,即会进入创建集群的操作界面。
  4. 在创建集群的软件配置这一步中可以看到所有包含的软件以及对应的版本。若想修改集群的配置,可以通过软件自定义配置(可选)框选择相应的 json 格式配置文件,对集群的默认参数进行覆盖或添加。json 文件的样例内容如下:
    [
        {
            "ServiceName":"YARN",
            "FileName":"yarn-site",
            "ConfigKey":"yarn.nodemanager.resource.cpu-vcores",
            "ConfigValue":"8"
        },
        {
            "ServiceName":"YARN",
            "FileName":"yarn-site",
            "ConfigKey":"aaa",
            "ConfigValue":"bbb"
        }
    ]
    说明
    • 实际传参的 FileName,需要去掉后缀。
    • 服务名(ServiceName )需全部大写。
    • ConfigKey 是配置项的名称,ConfigValue 为该配置项要设置的具体的值。
    各个服务的配置文件如下所示:
    • Hadoop
      Filename:
      • core-site.xml
      • log4j.properties
      • hdfs-site.xml
      • mapred-site.xml
      • yarn-site.xml
      • httpsfs-site.xml
      • capacity-scheduler.xml
      • hadoop-env.sh
      • httpfs-env.sh
      • mapred-env.sh
      • yarn-env.sh
    • Pig
      Filename:
      • pig.properties
      • log4j.properties
    • Hive
      Filename:
      • hive-env.sh
      • hive-site.xml
      • hive-exec-log4j.properties
      • hive-log4j.properties
  5. 设置好后,确认后单击下一步