DSW支持R语言

DSW实例集成了开源JupyterLab,您可以在DSW实例中安装R Kernel,即可在Notebook中运行R脚本来做数据分析。本文为您介绍如何在DSW实例中安装R Kernel。

前提条件

已创建DSW实例,详情请参见创建DSW实例

操作步骤

  1. 进入DSW开发环境。

    1. 登录PAI控制台

    2. 在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

    3. 在页面左上方,选择使用服务的地域。

    4. 在左侧导航栏,选择模型开发与训练 > 交互式建模(DSW)

    5. 可选:交互式建模(DSW)页面的搜索框,输入实例名称或关键字,搜索实例。

    6. 单击需要打开的实例操作列下的打开

  2. DSW实例页面,进入Terminal完成如下操作。

    1. 安装R语言

      执行如下命令,使用Ubuntu的包管理工具apt安装R语言环境。

      代码执行过程中,当遇到Proceed([y]/n)时,请输入y并按回车。

      apt update
      apt install r-base
    2. 安装IRkernel

      安装IRkernel,即R语言的Jupyter Kernel。启动R环境(在终端中输入R并回车)后,执行以下命令:

      install.packages('IRkernel')
      IRkernel::installspec()

      安装完成后退出R环境。

      q()
  3. 返回Launcher页面并刷新页面,查看R环境已安装完成。

    Notebook区域下新打开一个Launcher页,即可看到R语言的kernel选项。选择R,您就可以新建一个Notebook,开始使用R语言在JupyterLab里工作。

    image

示例:用R语言做数据分析

依次执行如下命令,创建一个R kernelNotebook文件,使用内置的mtcars数据集,计算每种车型的平均马力(hp),并使用ggplot2包绘制马力与里程(mpg)之间的关系图。

install.packages("ggplot2")
# 加载所需的包
library(ggplot2)

# 使用mtcars数据集
data(mtcars)

# 打印前几行数据进行查看
head(mtcars)

# 计算每种车型的平均马力
average_hp_by_cyl <- aggregate(mtcars$hp, by=list(mtcars$cyl), FUN=mean)
colnames(average_hp_by_cyl) <- c("cylinders", "average_hp")

# 打印出平均马力
print(average_hp_by_cyl)

# 使用ggplot2绘制马力与里程的关系图
ggplot(mtcars, aes(x=mpg, y=hp)) +
geom_point() +  # 添加点
geom_smooth(method="lm") +  # 添加线性回归拟合线
labs(title="马力与里程之间的关系", x="每加仑里程 (mpg)", y="马力 (hp)")  # 添加标题和轴标签

image