当您需要对少量数据进行快速的、临时的分析,或者需要一个像Excel一样灵活的工具来整理、计算和可视化数据时,传统的SQL查询显得过于笨重,而专业的BI工具又可能过于复杂,学习成本高。DataWorks数据分析提供了“电子表格”功能。它是一个在线的、与数据仓库无缝集成的类Excel工具,您不仅可以像使用本地Excel一样直接录入、编辑数据,还可以轻松地将数据仓库中的表、本地文件导入到表格中。
进入电子表格
您可以通过如下两种方式进入:
创建并管理电子表格
进行数据分析前,您需要先创建用于承载目标数据的电子表格。
创建电子表格
在电子表格页面,单击新建电子表格下的
图标,进入电子表格编辑页面。
说明您也可以在首页的快捷入口区域,单击电子表格进入电子表格编辑页面。
在电子表格编辑页面,单击右上方的保存。
在编辑页面,您可以设置电子表格的样式,并进行透视分析和探查等数据分析,详情请参见分析数据。
在保存文件对话框中,输入文件名。
单击确定。
查看和管理电子表格
在电子表格的编辑页面,单击左上方的电子表格或左侧菜单栏中的
图标,进入电子表格列表页面。
在电子表格页面的全部电子表格区域,您可以查看我创建的和分享给我的电子表格列表。
说明您也可以分享电子表格给指定成员,详情请参见分享电子表格。
单击文件名,即可进入该电子表格的编辑页面。
您还可以在该页面对电子表格进行以下管理:
单击相应文件后的
图标,在重命名对话框中,输入修改后的文件名,单击确定。
单击相应文件后的
图标,在转交对话框中,输入需要转交的对象并选中,单击确定。
单击相应文件后的
图标,即可克隆成功,显示后缀名为_copy的新文件。
单击相应文件后的
图标,在删除对话框中,单击确定。
导入数据至电子表格
在电子表格的编辑页面,您可以直接录入数据,也可以从其他数据源导入数据,或将本地数据导入电子表格,以便为后续数据分析做好准备。
在电子表格的编辑页面,鼠标悬停至右上方的导入,支持导入电子表格、本地CSV文件和本地Excel文件三种类型的文件。
若您选择电子表格:仅支持导入电子表格。
若您选择本地CSV文件:仅支持导入本地CSV文件。
若您选择本地Excel文件:仅支持导入本地Excel文件,且导入Excel文件的所有Sheet。
选择本地需要导入的Excel文件,单击选择文件(.xlsx),导入Excel文件中的所有Sheet数据至电子表格,并且支持选定某个Sheet进行导入。
导入电子表格
在导入对话框中,单击电子表格,配置各项参数,单击确认。
参数 | 描述 |
电子表格 | 从电子表格下拉列表中,选中需要导入的电子表格名称。 |
Sheet | 从Sheet下拉列表中,选中该电子表格中需要导入的Sheet页。 |
数据预览 | 预览需要导入的数据。 |
导入起始行 | 从您设置的起始行的数据开始导入,默认为1。 |
放置位置 | 包括当前工作表和新工作表。 |
放置方式 | 包括追加、覆盖和活动单元格。 |
导入本地CSV文件
在导入对话框中,单击本地CSV文件,配置各项参数,单击确认。
参数 | 描述 |
文件 | 单击选择文件,选中需要导入的本地CSV文件,单击打开。 |
原始字符集 | 包括UTF-8和GBK。如果出现乱码,您可以切换字符集。 |
分隔符 | 包括行和列:
如果无法正确分隔单元格的数据,您可以切换分隔符。 |
数据预览 | 预览需要导入的数据。 |
导入起始行 | 从您设置的起始行的数据开始导入,默认为1。 |
放置位置 | 包括当前工作表和新工作表。 |
放置方式 | 包括追加、覆盖和活动单元格。 |
导入本地Excel文件
在导入对话框中,单击本地Excel文件,配置各项参数,单击确认。
参数 | 描述 |
文件 | 单击选择文件,选中需要导入的本地Excel文件,单击打开。 |
Sheet | 从Sheet下拉列表中,选择需要导入的Sheet。 |
数据预览 | 预览需要导入的数据。 |
导入起始行 | 从您设置的起始行的数据开始导入,默认为1。 |
放置位置 | 包括当前工作表和新工作表。 |
放置方式 | 包括追加、覆盖和活动单元格。 |
分析数据
DataWorks的电子表格为您提供丰富、便捷的数据分析操作,其操作与Office Excel高度一致,大大降低您的学习成本。您可以在电子表格的编辑页面,设置电子表格的字体、对齐方式、数字格式、行列、条件格式和样式等,也可以对电子表格的数据进行探查。详情请参见数据探查。
设置电子表格
您可以在电子表格的编辑页面设置如下内容:
字体
序号
功能
描述
①
字体
选择需要的字体类型。
②
字号
选择需要的字号大小。
③
加粗
将文字加粗。
④
倾斜
将文字变为斜体。
⑤
下划线
给文字添加下划线。
⑥
中划线
给文字添加中划线。
⑦
边框
给文字添加边框。
⑧
背景填充
填充文字的背景颜色。
⑨
文字填充
修改文字的颜色。
对齐方式
序号
功能
描述
①
顶端对齐
沿顶端对齐文字。
②
垂直居中
对齐文本,使其在单元格中上下居中。
③
底端对齐
沿底端对齐文字。
④
自动换行
多行显示超长文本,便于查看所有内容。
⑤
左对齐
将文本靠左对齐。
⑥
水平居中
将文本水平居中对齐。
⑦
右对齐
将文本靠右对齐。
⑧
合并居中
将选择的多个单元格合并成一个较大的单元格,并将新单元格内容居中。
数字
序号
功能
描述
①
数据类型
选择单元格格式,例如数字、货币、短日期、长日期、时间、百分比、分数、科学计数和文本等。
②
百分比
将单元格的数据类型设置为百分比类型。
③
两位小数
使单元格的数据保留两位小数。
④
千位分割
将单元格数据的千位以逗号形式分割,例如1,005。
⑤
货币
将单元格的数据类型设置为货币类型,例如人民币、美元、英镑、欧元和法郎等。
行列
序号
功能
描述
①
插入行
在电子表格中添加新的单元行。
②
插入列
在电子表格中添加新的单元列。
③
删除行
在电子表格中删除选中的单元行。
④
删除列
在电子表格中删除选中的单元列。
⑤
锁定行
在电子表格中锁定选中的单元行前的所有单元行。
⑥
锁定列
在电子表格中锁定选中的单元列前的所有单元列。
⑦
隐藏行
在电子表格中隐藏选中的单元行。
⑧
隐藏列
在电子表格中隐藏选中的单元列。
条件格式
序号
功能
描述
①
过滤型条件格式
包括突出显示单元格规则和最前/最后规则中的规则。
②
色彩填充型条件格式
包括渐变填充、实心填充和色阶中的样式。
③
符号填充型条件格式
包括方向、形状、标记和等级图标。
④
取消条件格式效果
包括清除所选单元格的条件格式和清除整个工作表的规则。
样式
序号
功能
描述
①
套用表格模式
选择相应的表格样式进行套用。
②
删除
取消应用的表格样式。
③
单元格样式
设置单元格的样式。
④
清除
包括清除全部、清除内容和清除样式。
编辑
序号
功能
描述
①
自动求和
支持求和、平均值、计数、最大值、最小值五种类型。
②
查找
您可以直接单击查找,也可以使用快捷键Ctrl+F,即可弹出相应的输入框。
③
筛选和排序
您可以筛选数据进行排序或降序处理。
④
清除
直接删除选中的内容。
图表
序号
功能
描述
①
柱状图
详情请参见柱状图。
②
折线图
详情请参见折线图。
③
饼图
详情请参见饼图。
④
更多
单击更多,您可以选择如下图表:
插件:目前支持类型转换,单击
图标,您可以将选中的数据转换为数值型和转换成字符型。
快捷键列表
单击
图标,查看各功能对应的快捷键。
您可以在编辑页面的单元格直接输入内容,也可以通过函数计算公式从其它单元格中计算获取结果。单元格的行标记从A开始由左向右递增、列标记从1开始由上向下递增。
右键单击某一行的行数或某一列的列数,您可以删除、隐藏和取消隐藏该行或该列。
右键单击选中的单元格,您可以进行剪切、复制和粘贴等操作。
数据探查
数据探查功能可以帮您分析当前数据的质量、结构、分布和统计信息,帮助数据分析完成数据的预览、探查、加工、分析和可视化。数据探查通过列分析的方法,探查每列数据的类型和值的分布。
您可以选中需要分析的数据,单击菜单栏中的数据探查,即可在电子表格顶部,以图形和富文本的形式,为您展示每列数据的类型、值分布的概览情况。
数据探查简单模式的说明如下:
针对STRING和DATE类型:以富文本的形式为您展示Top2的值及其占比,同时展示其它值的占比。如果值的种类超过50%,则为您展示唯一值的总数。
针对INTEGER和FLOAT类型:以分箱柱状图的形式,为您展示其数据范围的分布情况。
针对BOOLEAN:以饼图的形式为您展示数据的占比。
针对混合型(探查数据包括两种及以上类型):以饼图的形式为您展示各值类型的占比。提醒您当前列存在脏数据,如果脏数据已被清洗,则根据上述三种情况为您展示值的分布。
针对空值null:将空值null的占比标红展示。
单击右上方的详细模式,您可以在详细模式对话框中,查看每列数据的字段名称、字段类型、字段中文名、字段描述和安全等级等探查结果。
数据探查详细模式的说明如下:
针对STRING和DATE类型:为您展示字段个数、唯一值、有效值、空值率等基本信息和重复值Top5。
针对INTEGER和FLOAT类型:为您展示基本信息(字段个数、唯一值、零值、空值率等)、重复值Top5、统计信息和直方图。
针对BOOLEAN类型:为您展示基本信息(字段个数、唯一值、零值、空值率等)、重复值Top5和饼图分布。
说明其中字符串类型中的true和false、数字类型中的0和1会被识别为BOOLEAN类型。
导出、分享和下载电子表格
在DataWorks的数据表格中编辑或导入数据后,您可以将数据导出、下载或分享给指定用户。
分享电子表格的应用场景如下:
多人协同编辑电子表格。
例如,统计团队成员的个人信息、活动的报名情况等,您可以分享该电子表格并赋予对方编辑的权限。
将自己的分析结果分享给他人,供其阅读。
您可以分享该电子表格,并赋予对方阅读的权限。
阿里云主账号可以在数据查询与分析管控页面开启允许分享和允许下载电子表格。
导出电子表格
电子表格最多支持导出100行数据。
在电子表格的编辑页面,单击右上方的
。在导出为MaxCompute表的对话框中,配置各项参数。
插入模式
参数
描述
将数据插入MaxCompute表(insert overwrite)
选择目标项目
选择目标工作空间。
选择表
输入需要插入数据的表名进行选择。
新建MaxCompute表并插入数据
选择目标项目
选择目标工作空间。
输入表名
输入新表的表名。请保持表名的唯一性,您可以单击检查重名进行检查。
单击复制SQL语句并关闭对话框。
重要仅支持非分区表。
单击页面左上方的
图标,选择 。
插入数据至已有表或新建MaxCompute并插入数据。
将数据插入MaxCompute表(insert overwrite)
如果您选择的插入模式为将数据插入MaxCompute表(insert overwrite),请打开需要插入语句的MaxCompute表。在表的编辑页面,单击DDL模式,粘贴已复制的SQL语句,单击生成表结构。
新建MaxCompute表并插入数据
如果您选择的插入模式为新建MaxCompute表并插入数据,请新建MaxCompute表,并粘贴已复制的SQL语句。详情请参见创建并使用MaxCompute表。
分别单击提交到开发环境和提交到生产环境。
如果您使用的是简单模式的工作空间,仅需要单击提交到生产环境。
分享电子表格
您可以在电子表格的编辑页面,单击右上方的分享,设置相应的分享方式。
您可以通过以下方式分享电子表格:
通过链接分享:指定可编辑、可阅读成员或设置所有人可见后,单击复制链接,发送链接至需要分享的人员即可。
如果您开启提取码,则会生成一个需要输入提取码才能访问的链接。
指定可编辑人员:如果需要指定人员具备编辑该电子表格的权限,请单击
。在对话框中输入需要分享的成员并选中,单击确认。所有人可见:如果当前电子表格可以对所有人开放,请开启所有人可见开关。
以下人员,可阅读:如果需要指定人员具备阅读该电子表格的权限,请关闭所有人可见后,单击
。在对话框中输入需要分享的成员并选中,单击确认。
不同版本的DataWorks工作空间,可指定的最大可编辑人数和可阅读人数存在差异:
功能点/版本 | 基础版 | 标准版 | 专业版 | 企业版 |
最大可编辑人数 | 0 | 3 | 5 | 10 |
最大可阅读人数 | 0 | 10 | 20 | 30 |
分享成功后,发送链接给对方,对方可以通过链接进行访问。
您可以在电子表格编辑页面右上角的浏览记录中,查看当前表格分享后,有哪些人员已查看表格。
您可以在电子表格页面,查看分享给我的电子表格。
下载电子表格
您可以在电子表格的编辑页面,单击右上方的下载,下载当前电子表格至本地。