El curso consiste de dos partes que exploran aspectos distintos de la teoría y práctica del análisis de datos. Una parte del curso se ocupa de los conceptos centrales y aplicaciones de la teoría moderna de redes; la otra, en explorar técnicas para el análisis de conjuntos de datos numéricos y textuales. Objetivos
La calificación final será compuesta de la siguiente manera:
Cada sesión se divide en dos partes, en la primera se estudiarán temas de teoría de redes y en la segunda diversas técnicas para el análisis de datos y textos.
| Sesión | Fecha | Tema |
|---|---|---|
| 01 | 01/15 | [Introducción: Grafos y redes, tipos de redes, características](http://www2.imperial.ac.uk/~mbegueri/Metodos/LectureNotes/Lecture1.pdf) |
| 01 | 01/15 | [Similitud entre conjuntos: Similitud de conjuntos, minhashing, LSH](Lecture_1_Similarity.ipynb) |
| 02 | 01/22 | Conceptos básicos 1: Grados, correlaciones, assortatividad |
| 02 | 01/22 | [Similitud entre conjuntos: escalando con PySpark](Lecture_2_Similarity_Spark.ipynb) |
| 03 | 01/29 | Conceptos básicos 2: Centralidad, comunicabilidad |
| 03 | 01/29 | [Similitud entre elementos: Teoría de LSH y otras familias](Lecture_3_LSH_Theory.ipynb) |
| 04 | 02/05 | Small worlds, navegación |
| 04 | 02/05 | [Sistemas de recomendación](Lecture_4_Recommendation_Systems.ipynb) |
| 05 | 02/12 | Presentaciones: Planteamiento del problema |
| 05 | 02/12 | Presentaciones: Planteamiento del problema |
| 06 | 02/19 | Redes aleatorias 1: Erdös-Renyi |
| 06 | 02/19 | Sistemas de recomendación: filtrado colaborativo |
| 07 | 02/26 | Redes aleatorias 2: Barabási-Albert, configuración |
| 07 | 02/26 | [Procesamiento de flujos: muestreo en flujos / filtrado](Lecture_5_Stream_Algorithms.ipynb) |
| 08 | 03/05 | Dinámica de redes 1: Caminatas aleatorias, Laplaciano |
| 09 | 03/12 | Dinámica de redes 2: Contagio, percolación |
| 09 | 03/12 | [Procesamiento de flujos: conteo](Lecture_6_Stream_Algorithms_Counting.ipynb) |
| 10 | 03/19 | [Programación funcional](Lecture_7_Functional_Programming.ipynb) |
| 11 | 03/26 | Dinámica en redes 3: Consenso |
| 12 | 04/02 | Presentaciones: Avances |
| 12 | 04/02 | Presentaciones: Avances |
| 13 | 04/09 | Comunidades 1: Clustering y Modularidad |
| 13 | 04/09 | [Estructuras algebráicas para procesamiento de información](Lecture_8_Abstract_Algebra.ipynb) |
| 04/16 | DESCANSO | |
| 04/16 | DESCANSO | |
| 14 | 04/23 | Comunidades 2: Stability |
| 14 | 04/23 | Minería de textos / índices invertidos |
| 15 | 04/30 | Comunidades 3: Map y comunidades con traslape Redes con signos y balance estructural |
| 15 | 04/30 | Modelos de lenguaje: introducción |
| 16 | 05/07 | Inferencia de redes |
| 16 | 05/07 | Topic Models |
| 17 | 05/14 | Privacidad y privacidad en redes |
| 17 | 05/14 | Privacidad en bases de datos |
| 19 | 05/21 | Presentación final |
| 19 | 05/21 | Presentación final |
En este curso uilizaremos las siguientes herramientas:
La forma más sencilla de instalarlo junto con todas las dependencias es:
http://ipython.org/install.html
conda install matplotlib
Descargar Spark de la siguiente liga:
http://spark.incubator.apache.org/downloads.html
Descomprimir y ejecutar los siguientes comandos desde del directorio de spark:
> sbt/sbt assembly
> ./pyspark
In [ ]: