Datos Básicos

Nombre: Métodos de Investigación y Análisis de Datos con Python
Fechas: Clases presenciales del 8 al 23 de julio de 2019

Presentación


Duración:

50 horas (24 presenciales, 6 de tutoría, 20 de trabajo autónomo)

Este curso nace como una iniciativa de la Universidad del Azuay a través de International Research Networks (IReNE) en alianza con University of Pittsburgh, su finalidad es brindar a nuestros docentes e investigadores métodos computacionales que les permita validar y corroborar grandes cantidades de datos para el desarrollo de sus investigaciones.

Antecedentes

Este es un curso introductorio a los diversos temas relacionados con análisis de datos. Python es un lenguaje de programación que ofrece una amplia gama de paquetes especializados que facilitarán el aprendizaje de diferentes métodos de análisis. El curso se desarrollará con el uso de los programas comerciales Python y su versión interactiva iPython. Estos programas son open source, por lo que no requieren licencia adicional ya que su acceso es gratuito.

Objetivos:

Objetivo general

Familiarizar a los participantes con procedimientos analíticos que sean útiles para procesar grandes cantidades de datos.

Objetivos específicos

  • Extraer e interpretar información útil a partir de grandes cantidades de datos.
  • Aplicar métodos de análisis de datos apropiados para diferentes tipos de aplicaciones.
  • Utilizar recursos para análisis de datos provistos por Python y sus paquetes especializados.
  • Familiarizar a los participantes con técnicas de aprendizaje, clasificación y clustering.
  • Utilizar técnicas efectivas de visualización de datos.
  • Preparar a los participantes para abordar (en cursos subsecuentes) temas de minería de datos y machine learning.

Metodología del curso

El curso será teórico-práctico por lo que el participante requiere del software y de una laptop propia. Existirán lecturas individuales, y desarrollos de ejercicios individuales y grupales.

Estructura de módulos:

Parte teórica: presentación y explicación por parte del/de la instructor/a de la teoría detrás del tema a tratar.

Parte práctica: a través de Jupyter Notebooks (iPython) se procederá a dar ejemplos prácticos del tema abordado. Esto servirá a los estudiantes conectar la teoría con aplicaciones prácticas.

Tareas: las tareas deberán ser realizadas de manera individual. Los estudiantes contarán con tiempo acorde a la complejidad de las tareas para entregar las mismas. Estas tareas incluirán preguntas teóricas y prácticas y serán entregadas en el formato de Jupyter Notebooks. Adicionalmente, se proporcionará a los estudiantes lecturas relevantes a los temas tratados para que puedan complementar los conceptos impartidos en clase.

“Prueba de confianza”: Las pruebas de confianza permitirán a los estudiantes poner a prueba los conocimientos adquiridos. De esta forma, los estudiantes podrán identificar a tiempo los temas que dominan y aquellos que requieren más trabajo.

Cronograma:

De lunes a viernes: 11:00-13:00

Sábados: 09:00 – 12:00 (tutoría)

 

Contenidos:

Introducción

Tema

Contenido

Introducción General

Organización y estructura del curso

¿Qué es Big Data?

¿Qué es Análisis de datos?

Tareas y aplicaciones fundamentales en el análisis de datos.

Problemas prácticos con la data: heterogeneidad, ruido, limpiar datos para el análisis.

Introducción a Python y al Software

¿Por qué usamos Python?

Revisión de la funcionalidad de Python para análisis de datos

Estructuras básicas de Python para análisis de datos: Pandas, NumPy, SciKit.

Introducción al ambiente del IDE a utilizar y a Jupyter Notebooks

 

Fundamentos

Tema

Contenido

Conceptos Fundamentales de Estadística

Revisión de conceptos de estadística: incertidumbre, probabilidad, varianza, muestreo, elementos de análisis de datos.

Descripción y presentación de datos

Correlación

Distribución de probabilidad conjunta

Distribución de probabilidad condicional

Manipulación de Datos con NumPy y Pandas

Cargar y Guardar Datos.

Diferentes formatos de archivos soportados por Python.

Limpiar y preparar data para el análisis

Técnicas de Visualización

Prácticas útiles para la presentación de resultados

Visualización de datos con Matplotlib

Visualización de datos con Pandas y Seaborn

Análisis de Datos

Tema

Contenido

Supervised Learning

Modelos de regresión

Métodos Kernel (Support Vector Machines)

Ensemble learning (bagging, boosting, Bayesian model averaging)

Naïve Bayes Classifiers

Decision Tree Learning

Unsupervised Learning

Dimensionality Reduction

Clustering

Modelos combinados

Topic Models

Principal Component Analysis

Validación y Testing

Prueba de significancia, intervalos de confianza, sensitividad, especificidad, Curvas ROC y AUC, calibración.

Overfitting y Como evitar Overfitting

Validación cruzada

Bases de Datos

Introducción a SQL

Introducción a MAMP

Conexión de SQL con Python

 

Destinatarios:

Docentes, investigadores y profesionales interesados en la temática, cuyas áreas de investigación requieran de validación y corroboración de grandes cantidades de datos a través de métodos computacionales.

Requisitos Previos:

Conocimientos básicos de estadística y se prefiere que los participantes conozcan los fundamentos básicos de programación.  Sin embargo, al inicio del curso se incluirá un módulo introductorio de programación en Python.

 

Requisitos de aprobación:

Evaluación global igual o mayor al 70%.

Asistencia mínima del 80% de las clases presenciales.

Asistencia mínima del 80% a la plataforma virtual.

Sistema de evaluación

Cuestionarios de Aula Virtual: 20%

Tareas y trabajo autónomo: 30%

Proyecto Final: 50%

Instructores:

Marcela Gómez, PhD 

Pedro Bustamante, MSc

 

Inversión:

La Universidad del Azuay auspicia el 100% del valor del curso a sus docentes e investigadores y personal administrativo, condicionado a la aprobación del mismo.

Estudiantes Universidad de Azuay: $ 80,00 -Código para el pago en tesorería 1160

Personal externo: Profesionales, docentes, estudiantes: $ 160,00  -Código para el pago en tesorería 1159

 

Inscripciones:

Cerradas

 

Inscripciones cerradas

Certificados:

Mayor Información:

Ing. Miriam Briones García: formacion.continua@uazuay.edu.ec



Compartir: