【功能介绍】
A. python脚本爬取【去哪儿】网站中的北京地区的旅游景点数据, 保存为data.csv文件
B. data.csv上传到hadoop集群环境进行MapReduce数据清洗, 去除不符合条件的数据
C. 对清理过的数据进行MR数据汇总处理, 将Reduce的结果数据保存到本地Mysql数据库中
D. Springboot+Echarts+MySQL 显示数据分析结果
数据维度分别为【景区级别】【景区简介词云】【各区域景点数量】【景区价格排名】【各区域景点平均价格】
【不同景区级别均价】【景区热点排名】
【运行环境】 Python解释器 PyCharm Idea JDK Maven XShell VM虚拟机 Mysql
【技术栈】 python springboot echarts Hadoop MarReduce mysql
【项目包含内容】

【项目架构图】



【项目运行截图】

下载源码