https://github.com/woters/ds101
http://mybinder.org/repo/woters/ds101
http://nbviewer.ipython.org/github/woters/ds101
IPython - интерактивный shell для Python. У него очень много достоинств, но основное в том, что вы, как data scientist, имеете возможность очень быстро протестировать свои идеи не создавая новых файлов.
Jupyter блоктон это такая оболочка в форме веб приложение вокруг IPython shell, которая позволяет создавать и расшаривать документы, которые содержат код, графики, визуализации и текст. Jupyter умеет работать не только с Python, а еще с R, Julia, Scala...
In [80]:
from IPython.display import IFrame
IFrame('http://jupyter.org/', width='100%', height=350)
Out[80]:
Библиотека для обработки и анализа данных. Без Pandas никуда. В основном мы будем использовать один объект DataFrame - это что-то вроде многомерного массива с метками строк и столбцов, который в основном содержит разнотипные или отстутствующие данные. Помимо предоставление удобного интерфейса для доступа к данным, в Pandas есть масса мощных функций для операций с данными.
In [81]:
from IPython.display import IFrame
IFrame('http://i.giphy.com/12Y8uwQsnpizCw.gif', width='100%', height=350)
Out[81]:
In [82]:
from IPython.display import IFrame
IFrame('http://pandas.pydata.org/', width='100%', height=350)
Out[82]:
Существует несколько Python библиотек для Machine Learning. Одна из лучших - Scikit Learn, в ней уже реализованно большое количество оптимизированных ML алгоритмов. Scikit Learn отличается чистым кодом, понятным API и полной документацией.
In [1]:
from IPython.display import IFrame
IFrame('http://scikit-learn.org/', width='100%', height=350)
Out[1]:
Давайте немного попрактикуемся в использовании Jupyter. Help, doc links
Jupyter блокнот состоит из ячеек, в них вы можете писать как текст, так и код.
Для того, чтобы выполнить код в ячейке нажмите Shift + Enter.
In [8]:
print('hello')
In [30]:
list(range(10))
Out[30]:
Keyboard Shortcuts:
Если вы не знаете, как использовать ту, или иную функцию, добавьте в конце функции знак вопроса и вы получите документацию по ней.
In [17]:
list?
В IPython встроенны несколько полезных magic commands, одна из них %time
позволяет измерить время выполнения вашего кода.
In [56]:
%time _ = [i for i in range(1000)]
%timeit (%% - multiline) выдает усредненное значение, выполнив в цикле наш код.
In [83]:
%%timeit
_ = list(range(200))
Также Jupyter позволяет запустить команды системного шелла:
In [75]:
! echo "print('wasup!')" > my.py
In [79]:
! ls
Выполним созданный файл
In [78]:
%run my.py
5 минут попрактиковаться с Jupyter.
In [ ]: