JupyterHub是一个支持多用户的Notebook服务器,用于创建、管理和代理多个Jupyter Notebook实例。本文为您介绍如何访问JupyterHub的Web UI及JupyterHub的配置项信息。

前提条件

访问JupyterHub UI

  1. 进入详情页面。
    1. 登录阿里云E-MapReduce控制台
    2. 在顶部菜单栏处,根据实际情况选择地域和资源组
    3. 单击上方的集群管理页签。
    4. 集群管理页面,单击相应集群所在行的详情
  2. 添加Linux用户。
    您可以通过用户管理功能添加用户,详情请参见添加用户
  3. 在左侧导航栏中,选择访问链接与端口
  4. 单击Studio Workspace UI所在行的链接。
    输入步骤2中添加的用户名和密码,即可正常访问Web UI页面。
    说明 请稍等几秒即可看到Studio Workspace UI的信息。
  5. 关联计算集群。
    1. 关联集群页面,单击可关联集群页签。
    2. 选择待关联集群的集群类型。
      说明 仅显示同一个VPC下的EMR集群。支持关联Hadoop集群、Dataflow集群和DataScience集群三种集群类型。
    3. 单击待关联集群操作列的关联集群
    4. 关联集群对话框中,单击绑定
      已关联集群页签,显示关联的集群信息时,表示关联成功。
      说明 绑定集群过程大约需要1~2分钟,请您耐心等待。
  6. 在EMR上构造Jupyter运行环境。
    1. 通过SSH方式登录集群,详情请参见登录集群
    2. 执行以下命令,构建默认运行环境。
      cd /var/lib/ecm-agent/cache/ecm/service/JUPYTERHUB/1.3.0.2.2/package/files && bash build_default_env.sh
      如果您需要在运行环境中安装特殊的软件包,则需要修改/var/lib/ecm-agent/cache/ecm/service/JUPYTERHUB/1.3.0.2.1/package/files/emr-jupyterenv/目录下的requirements.yaml文件,然后再执行上述命令。例如,如果需要在环境中安装TensorFlow,则需修改requirements.yaml文件内容如下。
      name: emr-jupyterenv
      channels:
        - conda-forge
        - defaults
      dependencies:
        - python<3.8
        - pandas
        - papermill
        - jupyterlab
        - conda-pack
        - pip:
           - ./jupyter-osscontents-manager
           - ./jupyterhub-yarnspawner
           - ./jupyter-emrmagic
  7. 访问Jupyter UI。
    1. 单击左侧导航栏的Jupyter
    2. Sign in对话框中,输入用户名和密码,单击Sign in
      说明 用户名和密码为步骤2中您添加的用户信息。
    3. Server Options页面,单击Start
      说明 如果关联了多个集群,请选择关联的集群。首次启动Jupyter Server需要20秒左右,请您耐心等候。
      Server Options页面的YARN ENV中,即可看到构建的环境信息。Server Options

      登录后,即可进入JupyterHub UI页面。

查看配置项

  1. 进入详情页面。
    1. 登录阿里云E-MapReduce控制台
    2. 在顶部菜单栏处,根据实际情况选择地域和资源组
    3. 单击上方的集群管理页签。
    4. 集群管理页面,单击相应集群所在行的详情
  2. 在左侧导航栏,选择集群服务 > JupyterHub
  3. 在JupyterHub服务页面,单击配置页签。
    服务配置区域,展示了JupyterHub服务所有的配置项。主要配置项信息如下。
    注意 如果您需要修改配置项信息,请参见修改组件参数。配置项修改完成后,需要重启JupyterHub服务,使配置生效。
    参数 描述
    notebook_root_path Notebook在OSS中的存储路径。

    默认值为jupyter/notebook

    venv_root_path Jupyter运行环境在OSS中的存储路径。
    默认值为jupyter/venv
    说明 仅对在EMR on ACK集群上运行的Jupyter生效。