Temario de Estadística para Ciencia de Datos

bajo revisión

Nivel Básico

Introducción a la estadística descriptiva

  • Medidas de tendencia central (media, mediana, moda)
  • Medidas de dispersión (varianza, desviación estándar)
  • Herramientas Python: NumPy, Pandas
  • Práctica: Análisis básico en hojas de cálculo de Google

Visualización de datos

  • Tipos de gráficos (barras, histogramas, dispersión)
  • Herramientas Python: Matplotlib, Seaborn, Altair
  • Práctica: Creación de gráficos en Google Colab

Probabilidad básica

  • Conceptos fundamentales
  • Distribuciones de probabilidad comunes
  • Herramientas Python: SciPy
  • Práctica: Simulaciones simples en Google Colab

Introducción a la inferencia estadística

  • Muestreo y estimación
  • Intervalos de confianza
  • Herramientas Python: StatsModels, Scikitlearn
  • Práctica: Análisis de datos de ejemplo en bases de datos abiertas

Nivel Intermedio

Pruebas de hipótesis

  • Pruebas paramétricas y no paramétricas
  • Errores Tipo I y Tipo II
  • Herramientas Python: SciPy, StatsModels
  • Práctica: Aplicación en datos reales de bases abiertas

Análisis de regresión

  • Regresión lineal simple y múltiple
  • Evaluación de modelos
  • Herramientas Python: Scikit-learn, StatsModels
  • Práctica: Modelado en Google Colab con datos de bases abiertas

Análisis de varianza (ANOVA)

  • ANOVA de una vía y factorial
  • Herramientas Python: SciPy, StatsModels
  • Práctica: Análisis en Google Colab

Series temporales básicas

  • Componentes de una serie temporal
  • Modelos de suavizado
  • Herramientas Python: Pandas, StatsModels
  • Práctica: Análisis de series temporales en hojas de cálculo de Google y Google Colab

Nivel Avanzado

Métodos de remuestreo

  • Bootstrap
  • Validación cruzada
  • Herramientas Python: Scikit-learn
  • Práctica: Implementación en Google Colab

Modelos lineales generalizados

  • Regresión logística, Poisson
  • Herramientas Python: StatsModels, Scikit-learn
  • Práctica: Modelado avanzado con datos de bases abiertas

Análisis multivariado

  • Análisis de componentes principales (PCA)
  • Análisis factorial
  • Herramientas Python: Scikit-learn
  • Práctica: Reducción de dimensionalidad en Google Colab

Métodos Bayesianos

  • Teorema de Bayes
  • Inferencia Bayesiana
  • Herramientas Python: PyMC3
  • Práctica: Modelado Bayesiano en Google Colab

Aprendizaje automático estadístico

  • Árboles de decisión y bosques aleatorios
  • Máquinas de vectores de soporte (SVM)
  • Herramientas Python: Scikit-learn
  • Práctica: Implementación de modelos en Google Colab con datos de bases abiertas

Series temporales avanzadas

  • Modelos ARIMA, SARIMA
  • Pronóstico
  • Herramientas Python: StatsModels, Prophet
  • Práctica: Análisis y predicción de series temporales complejas

Bibliotecas Python adicionales a considerar:

  • Plotly (para visualizaciones interactivas)
  • Scipy.stats (para funciones estadísticas adicionales)
  • Statsmodels.api (para modelado estadístico avanzado)
  • XGBoost (para modelos de gradiente boosting)
  • Tensorflow y Keras (para aprendizaje profundo, si es necesario)