本教程通过分析2023年浙江省考生报考的省份,以及不同省份居民对于食物的消费观念,预测在哪个城市摆摊能获得更多收益。教程采用DataV-Note(智能分析)完成对原始高考数据的清洗、查看及分析操作,并将分析结果生成报告,进行查阅分享。
教程简介
背景介绍
通常,大学生作为小吃摊的主要受众群体,有助于带动摆摊经济的增长。我们将运用智能分析,借助2023年浙江省的学校报考数据,探究浙江的学生都流向了哪些地区;同时,对各地区的食品偏好程度进行分析,基于分析结果,针对性地去对应地区摆小吃摊。
分析流程
本教程的分析流程如下图。
数据清洗:首先对获取到的多个高考数据进行整合,生成一张包含所有高校及招生信息的汇总表。后续将基于该表进行查询分析。
数据概览:基于汇总表进行查询,可查看各高校的报考信息概况、录取情况及各城市的教育水平。
数据分析:
基于分析结果,我们可以将获得的“考生报考热度高,且居民食品消费指数较高的地区”视为摆摊收益更为显著的区域。
生成分析报告:您可将分析过程发布为分析报告,导出或分享给他人使用。
分析工具
整个分析过程,将会使用DataV-Note的如下分析单元:
SQL分析:通过SQL语句整合原始数据,以及对结果数据进行查询分析操作。
智能报告:使用自然语言一键分析学生报考的意向省份,以及省份与录取分数的关系,并生成分析报告。
Python分析:通过Python语句进行线性回归分析,探索省份与平均分数线是否存在线性趋势。
可视化分析:通过图表可视化展示分析结果。
文本分析:使用Markdown文本分析单元,编写报告相关介绍,辅助理解分析过程。
效果展示
完成本教程后,您将输出类似如下样式的分析报告。
准备数据
请下载如下数据至本地,后续需将该数据上传至DataV-Note,进行相关查询分析操作。
原始数据 | 作用 |
存放浙江省2023年普通类高校招生投档分数线数据,以及高校信息数据(例如,所在省份、城市等)。 用于分析各省份的分数线及招生计划。 | |
用于分析各个城市的人均消费支出。 | |
用于分析各个城市的食品平均消费量。 |
该数据为样例数据,仅用于学习和交流。
创建项目并上传数据
数据清洗:整合高校信息
由于获取到的三个原始文件数据(招生一段线、招生二段线、高校信息)均包含高校相关信息,且存在信息重合情况,为避免多次查询导致分析过程繁琐,在进行数据分析前,需先对这些数据进行整合。
创建SQL分析单元。
在报告编辑区域,单击图标,创建SQL分析单元。
进行数据整合。
选择文件数据集(上传的招生表存放于此),运行如下SQL语句。合并两个招生表数据,通过学校名称与高校信息表进行连接,生成一张包含高校信息及招生数据的汇总表,并将汇总表重命名为school。
生成的汇总表将展示在左侧导航栏的查询结果集中,后续会基于该查询结果集进行查询分析。
数据概览:查看高校信息概况
在该步骤,可使用SQL查看相关数据详情,了解高校信息概况。您可参考如下语句进行查询,也可自行编写SQL查询语句。
查看高校汇总表概况
查看各高校的录取情况
查看各城市的教育水平
数据分析:报考热度及差异
至此,将正式进入报告的分析及编写阶段。在该步骤,我们将借助Data-Note的AI能力,输出分析思路及分析过程,了解各地区的学校招生情况、录取标准及报考热度,并评估地域是否会影响录取分数线。
智能分析是系统根据您输入的需求,自动分析并匹配相应算法,输出合适结果。因此,即使每次输入的描述相同,生成的分析过程也可能存在差异,但不会影响最终的结论导向,具体请以实际界面为准。
智能分析生成的报告您可直接使用,也可基于该报告进行二次编辑。为保障报考热度及差异分析与后文饮食消费指数分析的关联性,本文示例使用智能分析体验生成分析思路,并通过手动操作体验核心分析过程。
智能分析操作指引
各地区学生报考热度排名
地域对录取分数线的影响评估
分析结论
数据分析:饮食消费指数
在该步骤,我们将通过分析各地区居民对食品的偏好指数,预测在哪个地区摆摊会获得更高的收益。分析过程使用SQL,并结合图表进行可视化展示,结合Markdown进行辅助描述。
各地区人均消费支出
各地区总食品消费量
计算食品偏好指数并得出结论
生成分析报告
分析操作执行完成后,您可将分析过程发布为分析报告,并导出或分享给他人查阅。
单击分析界面右上角的预览&发布,将分析结果生成可视化报告。
在报告界面右上角,单击图标,即可将该报告导出为指定格式或分享至所需应用。
说明您也可按需进行相关发布设置,调整报告样式。
相关文档
更多分析单元(图表、文本、控件等)的介绍,请参见分析单元使用。
更多核心操作介绍,请参见操作指引。
更多AI体验案例,请参见使用AI一键生成分析报告、AI助力SQL分析:宜居小区案例。