JupyterHub是一个支持多用户的Notebook服务器,用于创建、管理和代理多个Jupyter Notebook实例。本文为您介绍如何访问JupyterHub的Web
UI及JupyterHub的配置项信息。
前提条件
- 已创建EMR Studio集群,详情请参见创建集群。
- 已创建EMR Studio关联的集群,详情请参见创建集群。
- 安全组规则已开启8000和8443端口,详情请参见添加安全组规则。
访问JupyterHub UI
- 进入详情页面。
- 登录阿里云E-MapReduce控制台。
- 在顶部菜单栏处,根据实际情况选择地域和资源组。
- 单击上方的集群管理页签。
- 在集群管理页面,单击相应集群所在行的详情。
- 添加Linux用户。
您可以通过用户管理功能添加用户,详情请参见
添加用户。
- 在左侧导航栏中,选择访问链接与端口。
- 单击Studio Workspace UI所在行的链接。
输入
步骤2中添加的用户名和密码,即可正常访问Web UI页面。
说明 请稍等几秒即可看到Studio Workspace UI的信息。
- 关联计算集群。
- 在关联集群页面,单击可关联集群页签。
- 选择待关联集群的集群类型。
说明 仅显示同一个VPC下的EMR集群。支持关联Hadoop集群、Dataflow集群和DataScience集群三种集群类型。
- 单击待关联集群操作列的关联集群。
- 在关联集群对话框中,单击绑定。
待
已关联集群页签,显示关联的集群信息时,表示关联成功。
说明 绑定集群过程大约需要1~2分钟,请您耐心等待。
- 在EMR上构造Jupyter运行环境。
- 通过SSH方式登录集群,详情请参见登录集群。
- 执行以下命令,构建默认运行环境。
cd /var/lib/ecm-agent/cache/ecm/service/JUPYTERHUB/1.3.0.2.2/package/files && bash build_default_env.sh
如果您需要在运行环境中安装特殊的软件包,则需要修改
/var/lib/ecm-agent/cache/ecm/service/JUPYTERHUB/1.3.0.2.1/package/files/emr-jupyterenv/目录下的
requirements.yaml文件,然后再执行上述命令。例如,如果需要在环境中安装TensorFlow,则需修改
requirements.yaml文件内容如下。
name: emr-jupyterenv
channels:
- conda-forge
- defaults
dependencies:
- python<3.8
- pandas
- papermill
- jupyterlab
- conda-pack
- pip:
- ./jupyter-osscontents-manager
- ./jupyterhub-yarnspawner
- ./jupyter-emrmagic
- 访问Jupyter UI。
- 单击左侧导航栏的Jupyter。
- 在Sign in对话框中,输入用户名和密码,单击Sign in。
- 在Server Options页面,单击Start。
说明 如果关联了多个集群,请选择关联的集群。首次启动Jupyter Server需要20秒左右,请您耐心等候。
在
Server Options页面的YARN ENV中,即可看到构建的环境信息。
登录后,即可进入JupyterHub UI页面。
查看配置项
- 进入详情页面。
- 登录阿里云E-MapReduce控制台。
- 在顶部菜单栏处,根据实际情况选择地域和资源组。
- 单击上方的集群管理页签。
- 在集群管理页面,单击相应集群所在行的详情。
- 在左侧导航栏,选择。
- 在JupyterHub服务页面,单击配置页签。
在
服务配置区域,展示了JupyterHub服务所有的配置项。主要配置项信息如下。
注意 如果您需要修改配置项信息,请参见
修改组件参数。配置项修改完成后,需要重启JupyterHub服务,使配置生效。
参数 |
描述 |
notebook_root_path |
Notebook在OSS中的存储路径。
默认值为jupyter/notebook。
|
venv_root_path |
Jupyter运行环境在OSS中的存储路径。
默认值为 jupyter/venv。
说明 仅对在EMR on ACK集群上运行的Jupyter生效。
|