JupyterHub是一个支持多用户的Notebook服务器,用于创建、管理和代理多个Jupyter Notebook实例。本文为您介绍如何访问JupyterHub的Web UI及JupyterHub的配置项信息。
前提条件
访问JupyterHub UI
- 进入详情页面。
- 登录阿里云E-MapReduce控制台。
- 在顶部菜单栏处,根据实际情况选择地域和资源组。
- 单击上方的集群管理页签。
- 在集群管理页面,单击相应集群所在行的详情。
- 登录阿里云E-MapReduce控制台。
- 添加Linux用户。
您可以通过用户管理功能添加用户,详情请参见添加用户。
- 在左侧导航栏中,选择访问链接与端口。
- 单击Studio Workspace UI所在行的链接。
输入步骤2中添加的用户名和密码,即可正常访问Web UI页面。说明 请稍等几秒即可看到Studio Workspace UI的信息。
- 关联计算集群。
- 在关联集群页面,单击可关联集群页签。
- 选择待关联集群的集群类型。
说明 仅显示同一个VPC下的EMR集群。支持关联Hadoop集群、Dataflow集群和DataScience集群三种集群类型。
- 单击待关联集群操作列的关联集群。
- 在关联集群对话框中,单击绑定。
待已关联集群页签,显示关联的集群信息时,表示关联成功。说明 绑定集群过程大约需要1~2分钟,请您耐心等待。
- 在EMR上构造Jupyter运行环境。
- 通过SSH方式登录集群,详情请参见登录集群。
- 执行以下命令,构建默认运行环境。
cd /var/lib/ecm-agent/cache/ecm/service/JUPYTERHUB/1.3.0.2.2/package/files && bash build_default_env.sh如果您需要在运行环境中安装特殊的软件包,则需要修改/var/lib/ecm-agent/cache/ecm/service/JUPYTERHUB/1.3.0.2.1/package/files/emr-jupyterenv/目录下的requirements.yaml文件,然后再执行上述命令。例如,如果需要在环境中安装TensorFlow,则需修改requirements.yaml文件内容如下。name: emr-jupyterenv channels: - conda-forge - defaults dependencies: - python<3.8 - pandas - papermill - jupyterlab - conda-pack - pip: - ./jupyter-osscontents-manager - ./jupyterhub-yarnspawner - ./jupyter-emrmagic
- 访问Jupyter UI。
- 单击左侧导航栏的Jupyter。
- 在Sign in对话框中,输入用户名和密码,单击Sign in。
说明 用户名和密码为步骤2中您添加的用户信息。
- 在Server Options页面,单击Start。
在Server Options页面的YARN ENV中,即可看到构建的环境信息。说明 如果关联了多个集群,请选择关联的集群。首次启动Jupyter Server需要20秒左右,请您耐心等候。
查看配置项
- 进入详情页面。
- 登录阿里云E-MapReduce控制台。
- 在顶部菜单栏处,根据实际情况选择地域和资源组。
- 单击上方的集群管理页签。
- 在集群管理页面,单击相应集群所在行的详情。
- 登录阿里云E-MapReduce控制台。
- 在左侧导航栏,选择。
- 在JupyterHub服务页面,单击配置页签。
在服务配置区域,展示了JupyterHub服务所有的配置项。主要配置项信息如下。重要 如果您需要修改配置项信息,请参见修改组件参数。配置项修改完成后,需要重启JupyterHub服务,使配置生效。
参数 描述 notebook_root_path Notebook在OSS中的存储路径。 默认值为jupyter/notebook。
venv_root_path Jupyter运行环境在OSS中的存储路径。 默认值为jupyter/venv。说明 仅对在EMR on ACK集群上运行的Jupyter生效。
该文章对您有帮助吗?