Python爬虫实战,openpyxl模块学习,爬取房价信息并简单的数据分析
前言
利用Python爬取房价信息并进行简单的数据分析
Ok,让我们开始吧~~~
开发工具
Python版本:3.6.4
相关模块:
openpyxl模块;
requests模块;
bs4模块;
pyecharts模块;
以及一些python自带的模块。
环境搭建
安装Python并添加到环境变量,pip安装需要的相关模块即可。
pyecharts模块安装可参考:
Python简单分析微信好友
原理简介
需求:
根据输入的城市名获取该城市的房价信息;
对获得的数据进行简单的分析。
目标网站:
链家网(https://dl.lianjia.com/)
目标数据(图中圈出的):
实现思路:
很基础的爬虫,不需要任何分析。直接请求需要的网页地址,然后利用bs4模块解析请求返回的数据并获取所需的信息即可。
然后再对这些信息进行简单的分析。
其中信息保存到Excel中,分析时读取即可。
数据分析
以北京为例:
北京房价(元/平方):
北京房价(万元/套起):
参考:详细参考
Python系列爬虫之Scrapy实战 | 抓取并分析天气数据
文章到这里就结束了,感谢你的观看,关注我每天分享Python爬虫实战系列,下篇文章分享爬取携程旅游景点数据爬取与可视化。
为了感谢读者们,我想把我最近收藏的一些编程干货分享给大家,回馈每一个读者,希望能帮到你们。
干货主要有:
① 2000多本Python电子书(主流和经典的书籍应该都有了)
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且经典的练手项目及源码)
④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)
⑤ Python学习路线图(告别不入流的学习)
All done~完整源代码+干货详见个人简介或者私信获取相关文件。。