In [1]:
"""
IPython Notebook v4.0 para python 2.7
Librerías adicionales: Ninguna.
Contenido bajo licencia CC-BY 4.0. Código bajo licencia MIT. (c) Sebastian Flores.
"""

# Configuracion para recargar módulos y librerías 
%reload_ext autoreload
%autoreload 2

from IPython.core.display import HTML

HTML(open("style/mat281.css", "r").read())


Out[1]:






MAT281

Aplicaciones de la Matemática en la Ingeniería

Sebastián Flores

¿Qué contenido aprenderemos?

  • Formalidades
  • Proyectos 2014
  • Proyectos 2015

¿Porqué aprenderemos ese contenido?

  • Formalidades
    • Rrevisión de horarios y programa del curso.
  • Proyectos 2014
    • Ver ejemplos concretos de proyectos realizados por alumnos.
  • Proyectos 2015
    • Conocer posibles proyectos y comenzar a discutir posibles grupos y proyectos.

1- Formalidades

  • Horario del curso:
    • Lunes 3-4, P212
    • Miercoles 3-4, F265
  • Horario ayudantía:
    • Lunes bloques 13-14
  • Programa de la asignatura

2- Proyectos 2014

  • Reconciliación de datos
    • Aplicación a celdas de flotación de minería.
  • Análisis de Sentimientos
    • Aplicación a tweets.
  • Interpolación espacial con Krigging.
    • Aplicación a datos de crimen.
  • Valor intrínseco de un producto.
    • Aplicación a datos de Amazon.

2- Proyectos 2014

Interpolación espacial con Krigging

Aplicación a datos de crimen

Diego Gajardo.

2- Proyectos 2014

Valor intrínseco de un producto.

Aplicación a datos de Amazon.

Alberto Rubio

3- Proyectos 2015

  • Proyectos definidos

  • Proyectos por definir

Proyectos definidos

  • Entity resolution
  • Model Order Reduction
  • Call Center Mathematics
  • Electrical Trees

¿Cómo comparar en internet?


Entity Resolution

Proyectos definidos

Proyectos definidos

Entity Resolution

Conocida multitienda 1:

Proyectos definidos

Entity Resolution

Conocida multitienda 2:

Proyectos definidos

Entity Resolution

  • ¿Son los productos anteriores iguales?
  • ¿Cómo medir las diferencias entre 2 "items" arbitrarios de las tiendas?
  • ¿Cómo asignar eficientemente pares entre 2 bases de datos "grandes"?
Temáticas

Lenguaje natural, optimización, machine learning.

Proyectos definidos

Entity Resolution

AKA: "record linkage", "list washing", "database merging", "data matching", ...

Definición formal:

Tomar dos o más bases de datos y generar clases de equivalencia entre ellos.

Definición informal:

Determinar si 2 productos son iguales, a pesar de tener "definiciones" distintas.

Proyectos definidos

Entity Resolution

"Golden" Datasets

Ver el link: http://dbs.uni-leipzig.de/en/research/projects/object_matching/fever/ benchmark_datasets_for_entity_resolution

  • Amazon-GoogleProducts: Datos de e-commerce.
  • Abt-Buy: Datos de e-commerce.
  • DBLP-ACM: Datos bibliográficos.
  • DBLP-Schola: Datos bibliográficos.
Algunas referencias:
  • Evaluating Entity Resolution Results David Menestrina, Steven Euijong Whang, Hector Garcia-Molina.
  • Disinformation Techniques for Entity Resolution. Steven Euijong Whang, Hector Garcia-Molina.

¿Cómo simplificar un problema?


Model Order Reduction

Proyectos definidos

Proyectos definidos

Model Order Reduction

Proyectos definidos

Model Order Reduction

AKA: "dimensionality reduction", "feature extraction"...

Reducir el "tamaño" de un problema resulta interesante para simulaciones computacionales, optimización, uncertainty quantification y análisis de sensibilidad.

Definición formal:

Disminución del tamaño computacional en simulaciones de sistemas dinámicos de gran tamaño.

Definición informal:

Simplificar el problema tomando los elementos (o mezclas de éstos) que entregan las mayores contribuciones.

Proyectos definidos

Model Order Reduction

Algunos ejemplos
  • HyShot II scramjet
  • Photovoltaic solar cell
  • Airfoil shape optimization
Algunas referencias:
  • Active Subspaces, Paul G. Constantine.
  • A Comparison of Some Model Order Reduction Techniques, Rodney Slone, Jin-fa Lee, Robert Lee.

¿Cómo podemos optimizar un call center?


Call Center Mathematics

Proyectos definidos

Proyectos definidos

Call Center Mathematics

¿Cómo podemos optimizar un call center, de manera científica?

  • Problemas de optimización estocástica.
  • Dados ciertos turnos,
    • ¿Qué calidad de servicio se entrega?
  • Dada una calidad de servicio deseada,
    • ¿Cómo se deben organizar los turnos?
  • Algunas formulas conocidas: Erlang C, Erlang F,
Temáticas

Simulación, optimización, estadística, probabilidades, industrias.

Proyectos definidos

Call Center Mathematics

Datasets
Algunas referencias
  • Ger Koole: Fundador de CCmath, "call center optimization company". Varios libros y artículos en la web.
  • Queueing Models of Call Centers: An Introduction. Ger Koole y Avishai Mandelbaum.

¿Fractales en la naturaleza?


Árboles eléctricos

Proyectos definidos

Árboles eléctricos

Proyectos definidos

Árboles eléctricos

Proyectos definidos

Proyectos definidos

Árboles eléctricos

Árboles eléctricos

Proyectos definidos

  • ¿Porqué la electricidad viaja en una trayectoria fractal en el material?
  • ¿Qué características del medio condicionan las características del árbol eléctrico?
  • ¿Qué predomina, determinismo o aleatoriedad, en la propagación eléctrica?
Temática

Fractales, simulación, visualización, modelamiento.

Proyectos definidos

Árboles eléctricos

Datasets
  • Departamento de Eléctrica, UTFSM.
Algunas referencias
  • Three-Dimensional Imaging and Analysis of Electrical Trees, Roger Schurch.
  • Fractal Analysis of Electrical Trees, K. Kudo.

Proyectos por definir

  • Proyectos en Kaggle
  • Proyectos en HeroX
  • API del gobierno
  • Otras APIS y fuentes de datos
  • Otras ideas

Proyectos por definir

Kaggle

  • http://www.kaggle.com/
  • Plataforma de concursos de Machine Learning y Data Science.
  • Modalidad:
    • Descargar datos
    • Seleccionar y afinar un modelo
    • Predecir resultados

Proyectos por definir

Kaggle

Proyectos actuales:

  • 1- Springleaf Marketing Response: Determine whether to send a direct mail piece to a customer.
  • 2- Western Australia Rental Prices: Predict rental prices for properties across Western Australia.
  • 3- Rossmann Store Sales: Forecast sales using store, promotion, and competitor data.
  • 4- Flavours of Physics: Identify a rare decay phenomenon.
  • 5- Right Whale Recognition: Identify endangered right whales in aerial photographs.
  • 6- How Much Did It Rain?: Predict hourly rainfall using data from polarimetric radars.

Proyectos por definir

Kaggle

Proyectos actuales:

  • 7- Ocean Ship Logbooks (1750-1850): Explore changing climatology with data from early shipping logs.
  • 8- Hillary Clinton's Emails: Uncover the political landscape in Hillary Clinton's emails.
  • 9- Meta Kaggle: The dataset on Kaggle, on Kaggle.
  • 10- What's Cooking?: Use recipe ingredients to categorize the cuisine.
  • 11- San Francisco Crime Classification: Predict the category of crimes that occurred in the city by the bay.
  • 12- Denoising Dirty Documents: Remove noise from printed text.

Proyectos por definir

HeroX

  • http://www.herox.com/
  • Plataforma de concursos de Machine Learning y Data Science.
  • Similar a Kaggle, pero un poco más diverso.
  • Modalidad:
    • Descargar datos
    • Seleccionar y afinar un modelo
    • Predecir resultados

Proyectos por definir

HeroX

Proyectos actuales

  • 1- Cognitive Computing Challenge: Build a cognitive system that can read a document, then load a database with what it finds.
  • 2- Integra Gold Rush Challenge: Integra Gold is offering $1 million to help lead us to the next big gold discovery in Val-d'Or, Canada.
  • 3- Sky for All: Air Mobility for 2035 and Beyond: Envision the skies of 2035 and design an airspace system that allows vehicles to safely and efficiently navigate...
  • 4- The Lunar Initiatives Flash Art Competition: Calling all writers and 2D artists! Submit your lunar artwork in the Lunar...
  • 5- Financial Revolutionaries Enhancing Education: Educating For Financial Freedom

Proyectos por definir

HeroX

Proyectos actuales:

  • 6- Operation Blue Sky: Aboriginal Health Initiative: MNP presents an ideation challenge to improve health outcomes
  • 7- Autism Speaks House to Home Prize: Autism Speaks is searching for belief-busting breakthroughs in housing and residential supports for...
  • 8- Raising the Bar on Healthcare: A video challenge to share how Redirect Health raised the bar on healthcare and led to lowered costs...
  • 9- Clinical Trial Innovation Prize: Producing a breakthrough that doubles the accrual rate of clinical trials in the diagnosis and treatment of cancer.
  • 10- CHIME National Patient ID Challenge: Ensure 100% accuracy of every patient’s health info to reduce preventable medical errors and...

Interludio

API

¿Qué es una API?

Application Programming Interface: abstracción que permite a terceros consumir datos de un programa o de un sitio web.

Ejemplos clásicos:

  • API de Twitter: Permite encontrar tweets por pais, por idioma, por fecha, etc...
  • API de Google Maps: permite que desarrolladores construyan aplicaciones con los datos y mapas de google maps.

No todas las APIs son idénticas, pero existen similaridades y ciertas "buenas prácticas".

Proyectos por definir

API datos.gob.cl

  • http://recursos.datos.gob.cl/
  • Plataforma con datos relativos a Chile: ministerios y consejos, desde educación a homicidios.
  • Sólo están los datos: usteden tiene que elaborar una pregunta, proponer una estrategia de resolución e implementarla.
  • Modalidad:
    • Descargar una base de datos

Proyectos abiertos

API datos.gob.cl

Ejemplos de bases de datos recientes:

  • Organizaciones Comunitarias

    • Fuente: Municipalidad de Máfil
    • Categorías: Comunicaciones Comunidad Sociedad General
    • Formatos: xls
    • Descripción: Nómina de organizaciones comunitarias
  • Patentes Comerciales Renovadas 1er Semestre 2015

    • Fuente: Municipalidad de Los Lagos
    • Categorías: Negocios Comunidad Finanzas Planificación
    • Formatos: xlsx
    • Fecha de publicación: 30 de septiembre del 2015
    • Descripción: Listado de patentes comerciales renovadas y vigentes para el primera semestre del año 2015.
  • Abonados Móviles

    • Fuente: Subsecretaría de Telecomunicaciones
    • Categorías: Comunicaciones
    • Formatos: xlsx
    • Fecha de publicación: 30 de septiembre del 2015
    • Descripción: Abonados Móviles

Proyectos abiertos

API datos.gob.cl

Ejemplos de datos más descargados:

  • Precipitaciones diarias por Estaciones

    • Fuente: Dirección General de Aeronáutica Civil
    • Categorías: Negocios Comunicaciones Comunidad Cultura
    • Formatos: csv xml
    • Fecha de publicación 8 de septiembre del 2015
    • Descripción: Muestra las precipitaciones ocurridas por período, en cada estación a lo largo del pais.
  • PRODUCTO INTERNO BRUTO DE CHILE

    • Fuente: Comisión Chilena del Cobre
    • Categorías: Gobierno
    • Formatos: html
    • Fecha de publicación 9 de julio del 2013
    • Descripción: Contiene información del Producto Interno Bruto por Clase de Actividad Económica a precios corrientes y volumen a precios del año anterior encadenado. Series anuales disponibles desde el año 2003.
  • CENSO 2002

    • Fuente: Instituto Nacional de Estadísticas
    • Categorías: Cultura Educación Sociedad Tecnología
    • Formatos: txt gz
    • Fecha de publicación 1 de febrero del 2013
    • Descripción: El censo es la medición más importante del país, se realiza cada 10 años y es el operativo estadístico más amplio que se realiza en Chile.Debe cumplir con tres características...

Proyectos abiertos

Otros sitios y APIs

Algunos ejemplos (no limitantes):

Consejo

Definan el tema que más les interesa, y luego busquen un sitio o API apropiada.

Proyectos por definir

Otras ideas

  • ¿Es posible predecir la existencia de monopolios, mediante un procesamiento automático de indicadores económicos?

  • ¿Cómo imprime una impresoras 3D? ¿Cómo se diseña/optimiza la impresión?

  • Reconstrucción tridimensional con datos obtenidos por drones.