这个分析笔记由Jake Vanderplas编辑汇总。 源代码和license文件在GitHub。 中文翻译由派兰数据在派兰大数据分析平台上完成。 源代码在GitHub上。
使用前提:安装&介绍 (15 分钟)
机器学习的基本原理和Scikit-learn的接口 (45 分钟)
深入探索监督学习 (1 小时)
深入探索无监督学习 (1 小时)
模型验证 (1 小时)
本教程需要安装以下的包:
numpy
1.8 或者更新版本: http://www.numpy.org/scipy
0.15 或者更新版本: http://www.scipy.org/matplotlib
1.3 或者更新版本: http://matplotlib.org/scikit-learn
0.15 或者更新版本: http://scikit-learn.orgipython
/jupyter
3.0 或者更新版本,支持python notebook: http://ipython.orgseaborn
: 0.5 或者更新版本,用于图片的规格化最简单的安装方法是使用 conda 环境管理工具。我建议下载和安装miniconda。
下面的命令会自动安装所有需要的包:
$ conda install numpy scipy matplotlib scikit-learn ipython-notebook
另外,您可以选择下载和安装 Anaconda 软件发行版(非常大),可以在https://store.continuum.io/ 中找到。
【译者注】在派兰大数据分析和人工智能平台上免费注册,即可拥有上述所有的包,本教程所有分析笔记也在派兰分析平台上同步,方便交互式学习。
In [ ]:
from __future__ import print_function
import IPython
print('IPython:', IPython.__version__)
import numpy
print('numpy:', numpy.__version__)
import scipy
print('scipy:', scipy.__version__)
import matplotlib
print('matplotlib:', matplotlib.__version__)
import sklearn
print('scikit-learn:', sklearn.__version__)
import seaborn
print('seaborn', seaborn.__version__)
In [ ]: