如何用python做数据分析
首先,是数据分析的模块,numpy 高效处理数据,提供数组支持,很多模块都依赖它,比如pandas,scipy,matplotlib都依赖他,所
以这个模块都是基础。所以必须先安装numpy。
然后,pandas 主要用于进行数据的采集与分析,scipy 主要进行数值计算。同时支持矩阵运算,并提供了很多高等数据处理功能,比如
积分,微分方程求样等。matplotlib 作图模块,结合其他数据分析模块,解决可视化问题,statsmodels 这个模块主要用于统计分析,
Gensim 这个模块主要用于文本挖掘,sklearn,keras 前者机器学习,后者深度学习。
然后,安装的numpy版本一定要是带mkl版本的,没有返回值的,修改原处的值,这里等于修改了Xx.max() # 最大值,对二维数组都管
用x.min() # 最小值,对二维数组都管用x1=x[1:3] # 取区间,和python的列表没有区别。
然后,通过pandas导入数据,pandas支持多种输入格式,我这里就简单罗列日常生活最常用的几种,对于更多的输入方式可以查看源码
后者官网。csv文件导入后显示输出的话,是按照csv文件默认的行输出的,有多少列就输出多少列。
更多学习内容,请点击《Python学习网》!
来源:PY学习网:原文地址:https://www.py.cn/article.html